50 citazioni sulla panchina che adorerai condividere
May 22, 202350 citazioni sulla panchina che adorerai condividere
Apr 04, 20236 migliori protezioni per grondaie del 2023, testate da esperti
Mar 17, 20236 migliori protezioni per grondaie del 2023, testate da esperti
Apr 30, 2023Adult Swim aggiunge Ed, Edd n Eddy, Dexter's Lab e altro ancora
Mar 27, 2023Utilizzo dell’intelligenza artificiale generativa per progettare nuove proteine
I ricercatori dell’Università di Toronto hanno sviluppato un sistema di intelligenza artificiale in grado di creare proteine non presenti in natura utilizzando la diffusione generativa, la stessa tecnologia alla base delle popolari piattaforme di creazione di immagini IA come Midjourney e DALL-E di OpenAI.
Il sistema contribuirà a far avanzare il campo della biologia generativa, che promette di accelerare lo sviluppo dei farmaci rendendo la progettazione e la sperimentazione di proteine terapeutiche completamente nuove più efficienti e flessibili.
"Il nostro modello impara dalle rappresentazioni delle immagini per generare proteine completamente nuove a un ritmo molto elevato", afferma Philip M. Kim, PhD, professore presso il Donnelly Center for Cellular and Biomolecular Research presso la Temerty Faculty of Medicine della U of T. "Tutte le nostre proteine sembrano essere biofisicamente reali, nel senso che si ripiegano in configurazioni che consentono loro di svolgere funzioni specifiche all'interno delle cellule."
I risultati sono stati pubblicati sulla rivista Nature Computational Science e sono i primi nel loro genere in una rivista sottoposta a revisione paritaria. Il laboratorio di Kim ha anche pubblicato una prestampa sul modello la scorsa estate attraverso il server ad accesso aperto bioRxiv, prima di due prestampe simili dello scorso dicembre: RF Diffusion dell'Università di Washington e Chroma di Generate Biomedicines.
Le proteine sono costituite da catene di amminoacidi che si ripiegano in forme tridimensionali, che a loro volta dettano la funzione proteica. Queste forme si sono evolute nel corso di miliardi di anni e sono varie, complesse e in numero limitato.
Ora, con una migliore comprensione di come si ripiegano le proteine esistenti, i ricercatori hanno iniziato a progettare modelli di ripiegamento non prodotti in natura.
Una sfida importante, afferma Kim, è stata immaginare pieghe che fossero allo stesso tempo possibili e funzionali.
"È stato molto difficile prevedere quali pieghe saranno reali e funzioneranno in una struttura proteica", afferma Kim, che è anche professore nei dipartimenti di genetica molecolare presso la Facoltà di Medicina di Temerty e di informatica presso la Facoltà di Arti e Scienze. . "Combinando rappresentazioni basate sulla biofisica della struttura proteica con metodi di diffusione dallo spazio di generazione delle immagini, possiamo iniziare ad affrontare questo problema."
Il nuovo sistema, che i ricercatori chiamano ProteinSGM, si basa su un ampio insieme di rappresentazioni simili a immagini di proteine esistenti che codificano accuratamente la loro struttura. I ricercatori inseriscono queste immagini in un modello di diffusione generativa che aggiunge gradualmente rumore fino a quando ogni immagine diventa tutta rumore. Il modello tiene traccia del modo in cui le immagini diventano più rumorose e quindi esegue il processo al contrario, imparando come trasformare i pixel casuali in immagini chiare che corrispondono a proteine completamente nuove.
Jin Sub (Michael) Lee, uno studente di dottorato nel laboratorio Kim e primo autore dell'articolo, afferma che l'ottimizzazione della fase iniziale di questo processo di generazione di immagini è stata una delle sfide più grandi nella creazione di ProteinSGM.
"Un'idea chiave era la corretta rappresentazione simile a un'immagine della struttura proteica, in modo tale che il modello di diffusione possa imparare come generare nuove proteine in modo accurato", afferma Lee, che è di Vancouver ma ha conseguito la laurea in Corea del Sud e un master in Svizzera. prima di scegliere la U of T per il suo dottorato.
Altrettanto difficile è stata la validazione delle proteine prodotte da ProteinSGM. Il sistema genera molte strutture, spesso diverse da qualsiasi cosa si trovi in natura. Quasi tutti sembrano reali secondo i parametri standard, dice Lee, ma i ricercatori avevano bisogno di ulteriori prove.
Per testare le loro nuove proteine, Lee e i suoi colleghi si sono prima rivolti a OmegaFold, una versione migliorata del software AlphaFold 2 di DeepMind. Entrambe le piattaforme utilizzano l'intelligenza artificiale per prevedere la struttura delle proteine in base alle sequenze di aminoacidi.
Con OmegaFold, il team ha confermato che quasi tutte le nuove sequenze si ripiegano nelle strutture proteiche desiderate. Hanno quindi scelto un numero inferiore da creare fisicamente in provette, per confermare che le strutture fossero proteine e non solo stringhe vaganti di composti chimici.
"Con le corrispondenze in OmegaFold e i test sperimentali in laboratorio, potevamo essere sicuri che si trattasse di proteine correttamente ripiegate. È stato sorprendente vedere la convalida di queste pieghe proteiche completamente nuove che non esistono da nessuna parte in natura", afferma Lee.