Mi chiamo Ornella, sono laureata in Biotecnologie Mediche e a ottobre ho intrapreso il mio percorso di dottorato in Scienze farmacologiche biomolecolari, sperimentali e cliniche del Dipartimento di Scienze Farmacologiche e Biomolecolari. La mia attività si svolge presso due differenti sedi lavorative: il Servizio di epidemiologia e farmacologia preventiva (SEFAP), diretto da Alberico L. Catapano e la Fondazione Bruno Kessler, che si trova a Trento.
Oggi mi piacerebbe parlarvi di un argomento un po’ complesso ma estremamente interessante: il machine learning e le prospettive del suo utilizzo nella ricerca e nella pratica clinica.
Il machine learning consiste in una serie di approcci che consentono alle macchine di imparare dai dati, senza che queste siano programmate in maniera esplicita. Nasce dall’incontro tra la statistica e l’informatica e ha l’obiettivo di elaborare modelli statistici da dataset (cioè raccolte di dati) molto vasti. In soldoni, il machine learning deve il suo nome proprio al fatto che la macchina letteralmente impara dai dati. Ma come fa? Si comincia con la fase di addestramento (training). Alla macchina viene fornito un dataset di esempio (training set): a partire da questi dati la macchina, man mano che riceve informazioni su quello che sta elaborando, modifica e migliora gli algoritmi massimizzando le sue capacità predittive. Una volta terminato il training, l’algoritmo generato verrà testato su nuovi dati.
Esistono due diversi tipi di apprendimento: quello supervisionato e quello non supervisionato. Nell’apprendimento supervisionato la macchina impara a effettuare previsioni (per esempio, un paziente con queste determinate caratteristiche cliniche è sano o malato?), in quello non supervisionato impara a sintetizzare i dati, per esempio tramite clustering (cioè la creazione di raggruppamenti per i quali dati appartenenti al medesimo cluster condividono caratteristiche simili mentre dati appartenenti a cluster diversi sono differenti).
Possiamo ora dedicarci a scoprire le immense potenzialità del machine learning quando applicato alla ricerca e alla medicina.
La ricerca scientifica ha compiuto passi da gigante e volge ora lo sguardo verso la generazione e l’integrazione di un’enorme mole di dati, che permetterà un approccio olistico alla comprensione del funzionamento degli organismi viventi e di meccanismi patologici.
Come gestire quantità di dati così rilevanti? Come integrarli con dati provenienti per esempio da tecniche di imaging (risonanza magnetica, radiografie, …)? Come analizzarli? Il machine learning è sicuramente un’arma potente per ovviare a questi problemi.
Uno dei campi in cui questa tecnica si è rivelata di grande utilità è l’epigenomica, cioè lo studio delle modificazioni epigenetiche (modifiche chimiche a carico della cromatina, che non coinvolgono cambiamenti nella sequenza dei nucleotidi) che contribuiscono alla regolazione dell’espressione genica. Sulla base dell’apprendimento non supervisionato sono stati sviluppati metodi di annotazione genomica semi-automatica (SAGA) che clusterizzano le regioni del genoma sulla base di similarità in termini di proprietà epigenomiche.
Tramite machine learning è anche possibile predire quali sequenze di DNA possono costituire un sito di legame per fattori di trascrizione (superando le limitazioni dei saggi comunemente utilizzati in laboratorio), identificare possibili geni target dei microRNA e predire possibili effetti deleteri di polimorfismi.
In maniera del tutto simile, il machine learning trova applicazione anche nella farmacologia computazionale. Infatti, si è rivelato molto utile ad approcci di drug discovery basati su un flusso di operazioni automatizzate che iniziano con l’incubazione delle cellule con agenti perturbanti (piccole molecole, vettori plasmidici, …), a cui seguono l’acquisizione di immagini tramite microscopi automatizzati e, ad ultima, l’analisi delle immagini. Il fine di queste metodiche consiste nel testare gli effetti degli agenti perturbanti di interesse sul fenotipo cellulare. Molti di questi studi si affidano ad algoritmi di machine learning per valutare cambiamenti fenotipici di singole cellule o di popolazioni cellulari.
Per quanto concerne la pratica clinica, il machine learning porterebbe con sé la promessa di diventare presto uno strumento di supporto all’attività decisionale dei medici. Mettiamoci un attimo nei panni di un medico: sarebbe molto utile sapere quanto il nostro paziente sia a rischio di sperimentare un evento (per esempio l’infarto) o di sviluppare una determinata condizione patologica. È qui che entra in gioco il machine learning che, come sottolineato in precedenza, permette alla macchina di fare previsioni. Ciò consentirebbe agli algoritmi di generare una stima del rischio di un paziente per uno specifico outcome, indirizzando il medico verso la terapia più adatta ed efficace.
Tramite machine learning sarà possibile anche identificare quali pazienti potrebbero rispondere nel modo migliore a una terapia, guidando il medico nella scelta della strategia terapeutica più indicata. Non è tutto! L’utilizzo di queste procedure renderà possibile l’identificazione di nuovi predittori di rischio, migliorando l’accuratezza diagnostica.
Oltre alle capacità predittive, il machine learning è caratterizzato dall’abilità di individuare pattern che vanno oltre la percezione umana. Tale abilità potrebbe a sua volta trovare spazio nella pratica clinica, per esempio fornendo un valido supporto nell’interpretazione delle immagini (medical imaging) o consentendo la definizione di profili fenotipici in maniera più fine e la stratificazione dei pazienti in sottogruppi più omogenei, superando le limitazioni dovute alla variazione fenotipica.
Insomma, il machine learning ha l’indubbia capacità di essere applicabile a una moltitudine di diversi ambiti medici e scientifici, vedremo nei prossimi anni i risvolti dell’utilizzo di questi nuovi approcci!
Lascia un commento