Bard diventa Gemini: tutto quello che devi sapere sull’AI di Google

L’intelligenza artificiale di Google Bard prende ora il nome di Gemini. Vediamo insieme perchè e come funziona il potente Chatbot.



Oggi sul web si trovano tante alternative a ChatGPT, piattaforme con servizi più o meno avanzati, che offrono attività fino a poco tempo fa impensabili, soprattutto gratuitamente. Google non poteva non fronteggiare la rivale con un intelligenza artificiale tutta sua, che sfrutta il motore di ricerca più usato al mondo per ottenere informazioni aggiornate e valide.

L’Intelligenza Artificiale di Google è Gemini

Tanti i passi avanti fatti dal suo lancio a Luglio 2023 sotto il nome di Bard. Nome che traeva origine da “Bardo di Avon”, appellativo con cui era noto William Shakespeare. Diventa ora “Gemini” per riflettere la tecnologia avanzata che lo anima e così da uniformarlo sotto la stessa denominazione dell’omonimo modello di linguaggio . Persone di tutto il mondo lo hanno utilizzato per collaborare con l’IA in un modo completamente nuovo: per prepararsi ai colloqui di lavoro, per eseguire il debug di un codice, per elaborare nuove idee per la propria impresa o per creare immagini accattivanti.

È già possibile testare Gemini nella versione Pro 1.0 in oltre 40 lingue (incluso l’italiano) e in più di 230 paesi e territori.

Cosa è Gemini: l’intelligenza artificiale Google

Gemini è stato annunciato a Dicembre 2023 come il modello IA più capace e generale che Google abbia mai costruito. È il risultato di una collaborazione che ha coinvolto molti team di Google, compreso ovviamente il comparto ricerca Google Research. Gemini è stato costruito fin dalle sue fondamenta per essere multimodale, il che significa che può generalizzare, comprendere, operare e combinare senza discontinuità diversi tipi di informazioni, tra cui testo, immagini, audio, video e codice informatico

Il suo ChatBot fu sviscerato in ogni suo aspetto al Google I/O 2023, la conferenza annuale di Google che si svolge a Mountain View, in California, rivolta a sviluppatori web e incentrata sullo sviluppo di applicazioni web e mobile attraverso Google e relative tecnologie. Durante l’evento il CEO Sundar Pichai in persona ha presentato l’allora Bard, l’IA conversazionale basata su LaMDA, il modello di linguaggio di grandi dimensioni (LLM, Large Language Model) presentato due anni fa da Google.

Conversazionale e Generativa: sfrutta l’apprendimento automatico (machine learning), ovvero quella tecnologia che nell’ambito dell’informatica intende una variante alla programmazione tradizionale, nella quale in una macchina si predispone l’abilità di apprendere qualcosa dai dati in maniera autonoma, senza istruzioni esplicite.

Lo sapevi che: Con il termine AI Conversazionale si intendono le tecnologie, come chatbot o agenti virtuali, con cui gli utenti possono parlare. Queste tecnologie utilizzano il machine learning e l’elaborazione del linguaggio naturale per aiutare a imitare le interazioni umane, riconoscere input vocali e testuali e tradurne i significati in varie lingue, combinandosi fra loro.

Come funziona il Chatbot Google Gemini

Gemini rimane quasi identico nel suo funzionamento. Offre una casella di testo vuota chiamata Prompt e un invito a porre domande su qualsiasi argomento. Sembra quindi niente di meno che il motore di ricerca da cui tra le informazioni, ma non si limita al dare risposte a domande più o meno complesse. Può essere usata infatti come un “consulente personale” pronto a eseguire ogni richiesta, come dare consigli e suggerimenti (come posso essere più produttivo?), spiegare argomenti complessi oppure per creare contenuti come post per i social network.

Gemini genera tre risposte a ciascuna domanda, sebbene la variazione nel contenuto sia minima, e sotto ognuna un pulsante “Google It” indirizza a una ricerca correlata in una nuova scheda e sembra che sarà possibile dare feedback con “pollice in su” o “pollice in giù”. 

Come precauzione ulteriore l’azienda ha deciso di inserire una dichiarazione di non responsabilità sotto la casella di testo avverte gli utenti “Gemini può mostrare informazioni imprecise o offensive che non rappresentano le opinioni di Google”. A marzo i dirigenti Google hanno dimostrato che il chatbot che si è rifiutato di rispondere a una domanda medica, perché avrebbe richiesto informazioni precise e corrette. Inoltre, ha riportato una fonte falsa in una risposta sulla rivoluzione americana. Da apprezzare l’onestà.

Tante funzionalità per Gemini

È possibile collaborare con Gemini in più di 40 lingue e 230 paesi e territori nel mondo. Con Gemini potrai ascoltare le risposte elaborate, funzione utile in particolare per conoscere la pronuncia corretta di una parola o se vuoi ascoltare una poesia o un racconto. Per ascoltare le risposte di Bard è sufficiente scrivere un prompt e selezionare l’icona dell’altoparlante.

Fissare, organizzare e modificare le conversazioni

Poter rivedere i prompt è una parte importante delle interazioni con Gemini, perciò google ha aggiunto tanti modi per fissare e rinominare le conversazioni. Quando inizierai una conversazione, vedrai le opzioni per fissare, rinominare e riprendere le conversazioni recenti nella barra laterale. Ad esempio, se chiederai a Gemini di suggerirti idee per scegliere uno sport all’aperto per l’estate, potrai rivedere i suggerimenti anche in un secondo momento.

Puoi anche cambiare il tono e lo stile delle risposte di Gemini semplicemente chiedendogli di variare sulla base del contesto.

Usare le immagini nei prompt

Le immagini sono una parte fondamentale per la nostra immaginazione. Durante I/O, Google ha annunciato che avrebbe portato su Gemini le capacità di Google Lens. Se vorrai più informazioni su una foto, o trovare ispirazione per una didascalia, ad esempio un messaggio di ringraziamento per un regalo, ora potrai caricare immagini nei prompt e Gemini le analizzerà per aiutarti. Questa funzionalità è ora disponibile in inglese e verrà presto estesa ad altre lingue.

Condividere le risposte ed Esportare codice in più posti

Google rende più semplice condividere le interazioni con Gemini attraverso i link condivisibili, per esempio con i tuoi contatti. Infine, l’uso per le attività di programmazione è una costante fonte di interesse. Per questo l’implementazione della funzionalità che permette di esportare codice Python in Replit, oltre che in Google Colab.

Tutto in linea con l’approccio ambizioso e responsabile di Google sull’IA, come delineato nei Principi sull’IA, che seguono un confronto aperto con esperti, legislatori ed enti regolatori – inclusi i garanti per la protezione dei dati. Google continuerà ad adottare misure per proteggere i dati e la privacy delle persone. A questo proposito, è stato creato un Centro per la privacy di Gemini per raccogliere in un unico posto le spiegazioni sui controlli per la privacy degli utenti.


Le schede tecniche di MisterGadget.Tech


In arrivo altre novità per Google Gemini

Non contenta dei risultati ottenuti, Google propone due nuove esperienze. Oltre alla versione base liberamente fruibile anche dall’Italia e in italiano, ci sarà anche una versione premium a pagamento nota come Gemini Advance. Arriverà anche un’applicazione mobile (al momento non disponibile in Italia) – per aiutarti a collaborare facilmente con il meglio dell’intelligenza artificiale di Google.

Nel Chatbot notiamo invece alcune differenze rispetto alla precedente versione. Adesso, le risposte sono immediate e si creano man mano che l’AI le elabora, mentre precedentemente venivano mostrate solo a fine elaborazione. È disponibile durante l’elaborazione anche la possibilità di fermare la scrittura, mediante il pulsante di stop che sostituisce quello di invio durante il processo.

Gemini versus ChatGPT

Simile nello scopo a ChatGPT che, con la recente acquisizione di OpenAI da parte di Microsoft, dovrebbe presto rivoluzionare il motore di ricerca Bing e potenziare la popolare suite di programmi Office. Dopo la morte definitiva di Cortana l’assistente vocale Windows, l’integrazione dell’AI Microsoft sui prodotti Office è iniziata: nella versione premium, infatti, Teams utilizza ora GPT 3.5 (l’LLM su cui si basa ChatGPT) per ascoltare i partecipanti e, in base a ciò che dicono, generare trascrizioni e riassunti delle conference call, impostare appuntamenti, abbozzare e inviare mail.

Una grossa differenza fra le due AI sta ovviamente nel database di riferimento, la fonte da cui estraggono le informazioni. Mentre Gemini si appoggia direttamente alla rete e alle risorse di Google, ChatGPT utilizza un database interno a OpenAi. Questo archivio è aggiornato solo a Settembre 2021 e non riesce a soddisfare le ricerche più recenti. Le informazioni in tempo reale sono sicuramente uno dei vantaggi di Google Gemini

Maria Grazia Cosso: Contributor, studentessa di ingegneria informatica e nel tempo libero esploratrice di novità. Fiera Calabrese e appassionata sin dai tempi del Compaq Presario 425 ai computer, ha reso oggi questa sua passione il suo futuro. Segue da sempre il progresso e lo sviluppo delle nuove tecnologie, le piace stare al passo con le ultime uscite e testarle in prima persona, ogni tanto riesce anche a guardare qualche serie tv.
Post collegati