Bard, Claude 2 e xAI contro ChatGPT. Tra il 12 e il 13 Luglio 2023 ci sono state tre grosse novità nel campo delle intelligenze artificiali (AI). Il 13 luglio Google ha rilasciato l’AI Bard anche in Italia. Nello stesso giorno, Anthropic – startup sempre finanziata da Google per 300 milioni di dollari – ha lanciato negli Usa e nel Regno Unito la nuova versione della sua AI, Claude 2. Intanto a partire dal 12 luglio Elon Musk ha fatto nuove dichiarazioni sul suo ultimo progetto aziendale: xAI.
Abbiamo provato in anteprima alcune di queste nuove intelligenze artificiali (anche quelle non ancora disponibili in Italia) trovando in ognuna i suoi punti di forza e di debolezza. E mentre nelle ultime settimane ChatGPT inizia a perdere traffico, i giganti tech si affrontano ancora una volta sul campo dell’intelligenza artificiale.
Claude 2: l’AI generativa che può leggere documenti (e non solo)
Anthropic, la startup fondata da ex-dirigenti di OpenAI di origini italiane, ha presentato il 13 luglio la nuova versione del suo chatbot alimentato dall’intelligenza artificiale generativa. Claude 2 promette di essere più potente, sicuro e versatile del suo rivale ChatGPT.
https://vimeo.com/844014740/141c021b45
L’intelligenza artificiale generativa (AGI) è una delle frontiere più avanzate e promettenti della tecnologia. Si tratta della capacità di creare testo, immagini, suoni e altri contenuti a partire da un input iniziale, imitando lo stile e la logica umana. Tra i protagonisti di questo campo ci sono Anthropic e OpenAI, due startup che hanno sviluppato dei chatbot basati sull’AGI: Claude 2 e ChatGPT.
I fondatori di Anthropic, i fratelli Dario Amodei e Daniela Amodei, hanno dichiarato che la loro startup si occupa di sviluppare modelli di intelligenza artificiale affidabili, trasparenti e al servizio dell’umanità. Claude2 è il più recente frutto di questo lavoro alimentato dall’AGI.
Dove trovare Claude
Claude 2 è disponibile in beta sul sito web e tramite API (Application Programming Interface), ma solo per utenti degli States e del Regno Unito. Noi l’abbiamo testata in esclusiva. Il nuovo Claude offre la possibilità di caricare documenti per riassumerli o interpretarli, scrivere codice e rispondere a domande su qualsiasi tipo di argomento. Rispetto alla versione 1.3, secondo Anthropic, questo nuovo chatbot è più potente in quasi tutti i settori.
La seconda versione di Claude, per esempio, ha ottenuto un punteggio superiore nella sezione a risposta multipla dell’esame BAR (l’esame di abilitazione all’avvocatura negli Usa): 76.5% contro il 73% della versione 1.3. Il bot è anche riuscito a superare la sezione a risposta multipla dell’esame U.S. Medical Licensing ed ha ottenuto un punteggio del 71.2% nel test di programmazione Codex Human Level Python (dove la versione 1.3 aveva raggiunto solo il 56%).
Claude vs Claude 2
Avvocato, medico, ingegnere informatico e non solo. Claude 2 ha anche migliorato le sue capacità linguistiche e matematiche. Il bot può ora conversare in oltre 40 lingue, tra cui l’italiano, ed ha ottenuto un punteggio dell’88% in un set di problemi matematici di livello scolastico (GSM8k). Inoltre, Claude 2 ha introdotto nuove funzionalità, come la possibilità di cambiare il tono e lo stile delle risposte, di ascoltare il testo generato a voce, di usare immagini e documenti nei prompt, di esportare il codice in più ambienti e di fissare o rinominare le conversazioni. Nel video d’esempio, Claude è in grado di aggiungere componenti interattive a una mappa statica in autonomia.
https://vimeo.com/844019370/d1e5de8aa0
Anche in termini di sicurezza l’AI risulta migliorata. «Claude 2.0 è stato 2 volte migliore nel fornire risposte innocue rispetto a Claude 1.3 », si legge nel sito di Anthropic. Nella nostra prova, l’intelligenza artificiale si è rivelata sorprendente. Ha riassunto in pochi punti chiave Il vecchio e il mare di Ernest Hemingway e I Promessi Sposi di Alessandro Manzoni. Ha poi effettuato un commento approfondito delle due opere, mettendole a confronto e trovandone i rispettivi punti di forza ed eventuali demeriti letterari. Il tutto per ora solo in lingua inglese, ma con un realismo conversazionale di qualità praticamente umana. Ecco nelle immagini sottostanti alcuni estratti.
ChatGPT: il chatbot di OpenAI che domina il mercato dell’AGI
ChatGPT è il chatbot di OpenAI, una startup fondata nel 2015 da alcuni imprenditori e ricercatori, tra cui Elon Musk e Sam Altman, l’attuale CEO. L’intelligenza artificiale è disponibile dal 2020 sul web e tramite API, offrendo la possibilità di conversare con il bot su qualsiasi tipo di argomento.
Il bot attualmente più avanzato si basa su GPT-4, il modello linguistico di grandi dimensioni sviluppato da OpenAI, che ha dimostrato di essere in grado di comprendere e produrre testo in diverse lingue, domini e stili. ChatGPT è stato usato da milioni di utenti in tutto il mondo per scopi diversi, come intrattenimento, istruzione, lavoro e ricerca.
ChatGPT-4 ha anche mostrato delle capacità impressionanti in vari ambiti. Il bot ha ottenuto un punteggio del 78.9% nella sezione a risposta multipla dell’esame BAR, del 79.3% nel test di programmazione Codex Human Level Python e del 90.2% nel set di problemi matematici GSM8k.
Per il momento si tratta dell’intelligenza artificiale generativa più utilizzata e affidabile, disponibile anche tramite il chatbot del motore di ricerca Bing targato Microsoft. In questa modalità, ChatGPT può fare ricerche su Internet in autonomia e sopperire così all’annoso problema dell’aggiornamento interno limitato al 2022.
Bard: il chatbot che vuole essere informativo e completo
Dopo alcuni imprevisti iniziali, Google ha lanciato pubblicamente Bard il 13 luglio 2023. L’intelligenza artificiale è basata sul modello linguistico PaLM2, che promette di essere informativo, completo e capace di generare testo simile a quello umano in risposta a un’ampia gamma di richieste e domande. Come per le AGI rivali, potrà essere usato per fare ricerche, generare contenuti, scrivere codice, pianificare attività e molto altro.
Bard ha introdotto nuove funzionalità in linea con la concorrenza, come la possibilità di cambiare il tono e lo stile delle risposte, di ascoltare il testo generato a voce, di usare immagini nei prompt.
Google intende integrare Bard con il suo motore di ricerca e le sue altre piattaforme, come Maps, Translate e Gmail, per offrire un servizio più utile e versatile agli utenti. Secondo alcune fonti, Google avrebbe già generato un fatturato di oltre 100 milioni di dollari da Bard nel primo semestre del 2023.
Utilizzare Bard
A parità di prompt inserito (cioè la richiesta dell’utente all’AI), le risposte elaborate da Bard risultano molto più rapide nella loro generazione, ma anche molto meno approfondite.
Uno dei dettagli maggiormente apprezzabili, e in cui si vede la velocità senza paragoni di Bard, è la possibilità di scegliere più bozze di una stessa risposta. L’AI cioè fornisce fino a un massimo di tre testi elaborati per volta, tutti molto diversi gli uni dagli altri. Eccone in basso un esempio.
Sicuramente la velocità è una componente essenziale dell’esperienza di Bard. Ma seppure le risposte sembrino molto lunghe ed elaborate, nella maggior parte dei casi rimangono piatte e poco “umane”.
x.AI: la startup di Elon Musk che vuole capire l’universo
x.AI è la nuova startup di Elon Musk, fondata a marzo 2023 in Nevada, che si occupa di intelligenza artificiale. L’autodichiarato obiettivo è capire l’universo, come si legge nel sito stesso della compagnia. Secondo il magnate sudafricano, la tecnologia dovrà farsi carico di comprendere la vera natura della realtà e essere a favore dell’umanità. Nel team di x.AI ci sono ex professionisti di Google, Microsoft e OpenAI, che hanno contribuito a sviluppare alcuni dei modelli di linguaggio più avanzati, come GPT-3.5, Bard e GPT-4.
Qui di seguito il primo tweet della società nascente, che rende chiaro lo scopo dell’azienda: “Quali sono le domande fondamentali senza risposta più importanti?”
What are the most fundamental unanswered questions?
— xAI (@xai) July 12, 2023
xAI è l’ennesima sfida lanciata da Musk nel campo dell’intelligenza artificiale, dopo aver co-fondato e poi lasciato OpenAI nel 2018 per divergenze etiche e strategiche. Musk ha espresso più volte le sue preoccupazioni sui rischi dell’intelligenza artificiale non controllata o malvagia, che potrebbe minacciare l’esistenza dell’umanità. Per questo motivo, Musk ha voluto creare una società separata da X Corp (Twitter), Tesla e le altre società a cui è legato, pur condividendo con esse i risultati ottenuti con l’AI.
xAI è ancora avvolta nel mistero, ma Musk ha annunciato che il 14 luglio, in uno spazio di Twitter, il suo team sarà a disposizione degli utenti per rispondere a domande e curiosità. Si presume che xAI si occupi di intelligenza artificiale generale (AGI), ovvero quella in grado di svolgere qualsiasi compito che normalmente richiederebbe l’intelligenza umana, e di intelligenza artificiale estesa (XAI), ovvero quella in grado di spiegare le proprie decisioni e azioni in modo trasparente e comprensibile.
Un confronto tra visioni diverse dell’intelligenza artificiale
Tutti questi progetti rappresentano visioni diverse di cosa dovrebbe essere un’intelligenza artificiale. Da una parte Google, che punta a offrire un servizio utile e versatile agli utenti, integrando Bard con il suo motore di ricerca e le sue altre piattaforme. Dall’altra Elon Musk, che sfida OpenAI, la società che ha co-fondato e poi lasciato per divergenze etiche e strategiche, e che vuole creare un’AI «estremamente curiosa ma impegnata nella massima ricerca della verità».
E ancora Anthropic, che sogna un chatbot trasparente e dal linguaggio umanizzato. Infine OpenAI, che punta a offrire un’AI accessibile a tutti e che possa beneficiare l’umanità, migliorando ChatGPT con nuove versioni e funzionalità.
Tutti i progetti sono ancora in fase sperimentale e riceveranno nuove funzionalità nel corso dei prossimi mesi. Il confronto tra Bard, ChatGPT, Claude e xAI sarà interessante da seguire, sia dal punto di vista tecnologico che da quello sociale ed economico. Nel frattempo non ci resta che scoprire e utilizzare tutte le loro nuove funzionalità, che promettono di cambiare per sempre le nostre vite.