Modello Italia

Lo spazio dei curiosi di futuro

Modello Italia

Questa settimana è importante la notizia dell’annuncio del lancio di Modello Italia, un large language model, tutto tricolore. Per dirla in parole semplici un “concorrente” di ChatGPT nostrano. Ma pensato su principi molto differenti dal prodotto di OpenAI.

Prima di tutto nascerà, perché se ne prevede il lancio in estate, dalla collaborazione tra iGenius e Cineca. Il primo è un operatore specializzato nell’AI generativa, ma più che altro Cineca è un consorzio interuniversitario senza scopo di lucro formato da 70 università italiane, dal Ministero dell’Istruzione e del Merito e dal Ministero dell’Università e della Ricerca, oltre a 45 istituzioni pubbliche nazionali. Compagine che già ci dà qualche indizio sulla tipologia delle fonti che andranno ad alimentare il data set di partenza.

Fonti che saranno affiancate comunque da Wikipedia in lingua italiana e, a detta dei progettisti, da altre risorse con una particolare attenzione posta sul non raccattare a strascico materiali vari presenti in rete, ma protetti da copyright. Un buon approccio iniziale, se mi posso permettere, con la speranza che però le fonti siano sufficientemente ampie da garantire un buon risultato finale. In compenso Cineca metterà a disposizione per l’addestramento il supercomputer italiano Leonardo, che tra le altre cose, ad oggi, è il secondo più potente in Europa.

ITALIANO E BIAS

La scelta dell’italiano è un altro elemento interessante. Ma non tanto e non solo per mero spirito patriottico, quanto per distinguersi da tutti gli altri modelli esistenti oggi che si basano su data set in inglese (e in parte in cinese). La tesi dietro questa scelta sostiene che la lingua è importante ed i modelli allenati sulla lingua inglese rischiano di “importare” i bias insiti nella lingua e nella cultura anglosassone. Vedremo in compenso se il modello sarà in grado di neutralizzare i bias presenti nella lingua e cultura italiana, che magari sono diversi da quelli inglesi, ma comunque presenti.

OPEN SOURCE

L’altro elemento di sicuro interesse di Modello Italia è la scelta di essere open-source. In una doppia accezione. In primis, sulla base di questo modello gli sviluppatori potranno produrre ulteriori applicazioni di intelligenza artificiale. Secondo, la possibilità di scaricare il modello sui propri dispositivi, per utilizzarlo senza dover inviare dati e query al cloud. Elemento che consente maggiore privacy ed in pratica anche di usarlo in “modalità aereo”, quindi senza essere connessi.

FACT CHECKING

Altro spunto, a mio avviso notevole, il fatto che il sistema conterrà degli algoritmi di fact checking per garantire che la risposta data sia sempre affidabile ed accurata, riducendo il possibile rischio di “allucinazioni” o di risposte povere qualitativamente, praticamente a zero. Se ci riusciranno, Modello Italia potrà diventare una soluzione affidabile per aziende ed operatori in settori delicati o per svolgere compiti cosiddetti “mission-critical”, dove un errore potrebbe causare danni importanti.

AI ACT EUROPEO

Last but not least, ovviamente cercherà di nascere compliant con le previsioni del nascente AI Act Europeo. Giustamente non si può giudicare un libro dalla copertina o valutare qualcosa che tecnicamente ancora non esiste o, almeno, non è aperto al pubblico, ma le premesse sono indiscutibilmente interessanti e generano grande curiosità. I large language models potrebbero essere un asset strategico a livello Paese, specialmente se sono aperti e non interamente privati; quindi, questo è davvero un progetto da osservare con attenzione.

LARGE LANGUAGE MODEL IN GENERALE

Un large language model (LLM) è un tipo di modello di apprendimento automatico che è stato addestrato su un enorme set di dati di testo e codice. Questo set di dati può includere libri, articoli, pagine web, codice sorgente e altro. Il training di un LLM richiede una grande quantità di potenza di calcolo e può richiedere mesi o addirittura anni. Ad un costo evidentemente non trascurabile.

Una volta addestrato, un LLM può essere utilizzato per una varietà di compiti, tra cui:

  • Generazione di testo
  • Traduzione linguistica
  • Riepilogo di testo
  • Ricerca di informazioni

Il funzionamento di un LLM si basa su una tecnica chiamata apprendimento automatico supervisionato. In questo tipo di apprendimento, il modello viene fornito con un set di dati di esempi di input e output. Il modello impara quindi a generare output corretti per nuovi input, sulla base degli esempi che ha visto durante l’addestramento.

Nel caso di un LLM, il set di dati di input è costituito da testo. Il modello impara a identificare le relazioni tra le parole e le frasi. Questo gli consente di generare testo nuovo che è grammaticalmente corretto e coerente.

I LLM sono una tecnologia relativamente nuova, ma hanno il potenziale per rivoluzionare il modo in cui interagiamo con i computer. Possono essere utilizzati per creare nuovi tipi di applicazioni, come chatbot intelligenti, assistenti virtuali e sistemi di traduzione automatica.


APPROFONDIMENTI

Modello Italia, la sfida italiana a ChatGPT | Wired Italia


I LIBRI DI THE FUTURE OF

“Next” è un’entusiasmante antologia che esplora le tecnologie emergenti, le scoperte scientifiche e le visioni che plasmeranno il nostro prossimo decennio. Frutto della raccolta degli scritti dell’autore dall’autunno del 2022 all’intero anno 2023, il libro offre una prospettiva unica sulle tendenze tecnologiche che potrebbero definire il nostro futuro.
Il titolo “Next” è scelto con attenzione, riflettendo l’idea che le tecnologie e i fenomeni discussi nel libro potrebbero rivelare il loro pieno potenziale nel corso del prossimo decennio. L’autore, con uno sguardo critico e senza inutili hype, esplora tematiche che vanno dalla crionica alle interfacce cervello-computer, dal futuro del volo all’inseminazione delle nuvole per far piovere, dall’agricoltura di precisione al cibo stampato in 3D, e davvero molto altro ancora.
Un punto di forza del libro è l’attenzione dedicata a tecnologie di nicchia e argomenti meno mainstream, rendendo la lettura un’esperienza avvincente e informativa. Attraverso numerosi esempi di persone, startup, applicazioni e progetti concreti, l’autore illustra come le visioni del futuro si stiano già realizzando in vari settori. Il libro non è una mera speculazione filosofica, ma un racconto avvincente di come le cose stiano accadendo ora, sottolineando che il futuro è già qui.