Nuove frontiere dell’IA per la ricerca sulle proteine
Il Laboratorio di Data Engineering (LADE) di Area Science Park ha recentemente pubblicato una ricerca innovativa su Bioinformatics che apre nuove prospettive nello studio delle proteine, i mattoni fondamentali della vita. Francesca Cuturello, Marco Celoria, Alessio Ansuini e Alberto Cazzaniga, autori della ricerca, hanno infatti dimostrato come l’intelligenza artificiale possa predire l’impatto delle mutazioni genetiche sulla stabilità delle proteine, contribuendo a comprendere meglio i meccanismi alla base di molte malattie e potenzialmente sviluppare nuovi trattamenti. Il genoma degli esseri viventi muta, infatti, costantemente a causa di agenti esterni o del caso, e questo ci porta ad osservare cambiamenti nelle sequenze delle proteine che essi sintetizzano.
Condotto all’interno delle attività del progetto Pathogen Readiness Platform for CERIC-ERIC (PRP@CERIC), lo studio utilizza modelli di AI simili a GPT, applicati alla proteomica. Questi modelli si fondano sull’analogia tra una sequenza proteica e una frase, con gli amminoacidi che fungono da “parole”, consentendo di applicare algoritmi addestrati su centinaia di milioni di sequenze proteiche. Grazie a questa tecnica, i ricercatori del LADE sono riusciti a prevedere come piccole variazioni nella sequenza di amminoacidi, come quelle indotte da mutazioni, possano influenzare la stabilità delle proteine.
Un aspetto particolarmente innovativo è l’uso del modello MSA Transformer, che sfrutta informazioni sulle relazioni ancestrali tra sequenze proteiche per migliorare la precisione delle previsioni. L’algoritmo sviluppato dal LADE offre prestazioni all’avanguardia e sarà reso disponibile alla comunità scientifica per favorire ulteriori progressi in questo campo.
“Prevedere l’effetto delle mutazioni proteiche attraverso l’intelligenza artificiale ci permette di esplorare con grande precisione fenomeni biologici complessi che, fino a poco tempo fa, erano difficili da osservare direttamente – spiega Francesca Cuturello, primo autore della ricerca. – Questa tecnologia è un passo avanti verso soluzioni terapeutiche innovative per una vasta gamma di malattie.”
Il lavoro del team ha già ottenuto ampi riconoscimenti, inclusa l’invito di Francesca Cuturello al prestigioso Research Retreat “Physics of Biological Data Analysis” presso l’Aspen Center for Physics, e sarà presentato in altri centri di ricerca internazionali, come l’ICTP e il Leibniz Center for Informatics.
Per saperne di più sulle attività di LADE clicca qui.