I ricercatori del Laboratorio di Data Engineering a fianco di nuovi laureati in Matematica, Data Science e Scientific Computing
Congratulazioni a Giada Panerai, Francesco Ortu e Alessandro Pietro Serra per aver portato a termine il loro percorso di laurea magistrale all’Università di Trieste.
Nelle loro tesi, svolte presso il Laboratorio di Data Engineering di Area Science Park, hanno affrontato in modo originale diversi temi all’avanguardia nel campo dell’Intelligenza Artificiale, che spaziano dallo studio della geometria dei modelli di deep learning a ricerche sull’interpretabilità dei modelli generativi di linguaggio.
Nel dettaglio le tesi elaborate, grazie alle quali tutti e tre i candidati hanno raggiunto il massimo dei voti.
→ “Zig Zag Persistence in Neural Network Representations” – di Giada Panerai
Laurea Magistrale in Matematica – Relatori: Matteo Biagetti, Alberto Cazzaniga
Con il suo lavoro di tesi Giada ha applicato alcune innovative tecniche matematiche per studiare il funzionamento delle reti neurali sui cui si fondano celebri modelli di apprendimento odierni, alla base anche di chatGPT. Lo studio individua promettenti relazioni tra gli spazi geometrici su cui operano le reti, che permetteranno di comprendere più a fondo il funzionamento delle reti neurali.
→ “Interpreting How Large Language Models Handle Facts and Counterfactuals through Mechanistic Interpretability” – di Francesco Ortu
Laurea Magistrale in Data Science and Scientific Computing – Relatori: Alberto Cazzaniga, Diego Doimo
La tesi di Francesco studia come i modelli generativi di linguaggio, alla base di ChatGPT, reagiscono quando viene loro proposto un testo contente delle informazioni che contraddicono la conoscenza contenuta nel modello. Francesco analizza come l’informazione si propaga all’interno della rete neurale, inidividuando i “neuroni” che scelgono se promuovere o sopprimere le informazioni contraddittorie proposte dall’utente.
→ “A Geometric Interpretation of Few Shot Learning and Finetuning in Language Model Representations” – di Alessandro Pietro Serra
Laurea Magistrale in Data Science and Scientific Computing – Relatori: Alberto Cazzaniga, Diego Doimo
I modelli di linguaggio possono imparare sia direttamente dalle istruzioni scritte dall’utente, sia a seguito di uno specifico allenamento (“fine-tuning”) eseguito su analoghe fonti testuali. La tesi di Alessandro studia come questi due metodi modificano il funzionamento interno delle reti neurali, soffermandosi su analogie e differenze nella geometria delle rappresentazioni neurali. I risultati della tesi facilitano la nostra comprensione di come i modelli di Intelligenza Artificiale per linguaggio organizzano al loro interno le informazioni contenute nei dati.
Scopri il LADE Laboratorio di Data Engineering
Sfoglia il calendario degli eventi scientifici di Area Science Park