DNA non codificante e Intelligenza Artificiale: il futuro dell’analisi del DNA

DNA non codificante e Intelligenza Artificiale: il futuro dell’analisi del DNA

La medicina personalizzata del futuro prevede la “scansione” dell’intero genoma e solitamente viene denominato WGS – Whole Genome Sequencing.

I test genetici attualmente disponibili (wellness, predisposizione a patologie, genealogia, farmacogenomica, nutrigenomica, metabolismo etc.) sono ottenuti utilizzando aree del DNA cosiddette codificanti.

Queste aree codificano (forniscono le informazioni per costruire) le proteine che diventano parte essenziale del nostro organismo (es: struttura ossea, muscolare, metabolismo, caratteristiche fisiche etc.).

Queste aree incredibilmente rappresentano meno del 2% del patrimonio genetico umano e comprendono circa 20.000 geni raggruppati in 23 coppie di cromosomi.

Il restante 98% del genoma umano non codificante,fino a pochi anni fa definito junk (spazzatura), indicava quelle sequenze di basi (le quasi famose ACGT) che non codificano per proteine.

Ma dato che di casuale nel corpo umano solitamente non c’è nulla, ad oggi, sulla base di importanti studi internazionali, sappiamo che le regioni di DNA non codificante rappresentano una preziosa risorsa per il genoma.

Il DNA non codificante è una sorta di magazzino da cui andare ad attingere materiale che consente la ricombinazione genetica, una delle fonti principali di mutazioni genetiche e di novità evolutive.

Vediamo quali applicazioni pratiche può avere questa scoperta e come ciò possa impattare sia sui servizi offerti, sia sul “valore” della banca dati genomica che stiamo costruendo.

Applicazioni del DNA non codificante

Oggi molti pazienti soffrono di malattie genetiche diagnosticate in modo errato o non diagnosticate a causa di insufficienti test genetici.

Le analisi basate su test di singoli geni, pannelli genetici o microarray spesso non sono in grado di identificare le cause di una malattia in quanto sono fondamentalmente limitate.

Il WGS (Whole Genome Sequencing) che abbiamo illustrato in precedenza è invece in grado di rilevare tutte le varianti e identificare quelle rilevanti con un’unica metodologia.

Ad esempio, è stato scoperto che alcune mutazioni nel DNA spazzatura potrebbero contribuire allo sviluppo di uno dei disturbi dello spettro autistico le cui cause, ad oggi, non sono ancora ben note.

A dimostrarlo è un gruppo di ricerca coordinato dalla Princeton University e guidato da Olga Troyanskaya in collaborazione con Robert Darnell.

Gli scienziati spiegano che questa è la prima dimostrazione di come le mutazioni rilevate nel DNA non codificante possano causare malattie. I risultati sono stati pubblicati su Nature Genetics.

Gli scienziati saranno in grado di applicare la stessa tecnica per studiare il ruolo delle mutazioni non codificanti legate al cancro, alle malattie cardiache e ad altre malattie, come spiega Jian Zhou, ricercatore del CCB e di Princeton.

“Questo – sottolinea il ricercatore – fornisce una nuova prospettiva sulle cause non solo dell’autismo, ma di molte altre malattie umane”.

L’intelligenza artificiale su misura

Rimane comunque il problema di come analizzare l’enorme quantità di dati presenti in un singolo genoma o in più genomi per valutazioni comparative.

Parliamo di oltre 3 miliardi di basi cioè di coppie formate dalle sole 4 lettere sopra citate.

L’analisi di strutture così ampie e indifferenziate richiede piattaforme e strumenti potenti e innovativi.

Primo elemento è l’enorme crescita dei servizi offerti in cloud sia come memorizzazione di grandi quantità di dati sia come capacità di elaborazione.

La partnership con un fornitore di tecnologia come IBM che eroga sia i servizi blockchain per la sicurezza e privacy sia i servizi di memorizzazione dei dati permette a Genesy Project di rispondere alle esigenze sopra citate.

Altro elemento correlato su cui Genesy lavora da tempo sono le tecniche di “machine learning” in ambito di Intelligenza Artificiale.

Questo termine, traducibile come apprendimento automatico, in sintesi sono algoritmi matematici attraverso i quali si permette alle macchine di apprendere quanto necessario per svolgere un compito o una attività senza che siano stati preventivamente programmati.

Serve poi identificare schemi specifici (pattern), all’interno di una grande quantità di dati genetici, che verranno poi tradotti in modelli informatici.

L’obiettivo è quello di aiutare a prevedere le possibilità del paziente di sviluppare una determinata patologia o, in alternativa, per progettare un potenziale percorso di cura.

Gli algoritmi sono progettati per aiutare a interpretare gli effetti che alcune mutazioni genetiche hanno sui processi cellulari vitali come il metabolismo, la riparazione del DNA e la crescita cellulare.

Anomalie nel funzionamento di questi meccanismi possono causare patologie e mettere il paziente a rischio di sviluppare ad esempio forme tumorali.

Test genetici: nuove informazioni per la tua salute

L’utilizzo di strumenti avanzati di machine learning permetterà inoltre di estrarre informazioni con alto valore aggiunto da integrare con le informazioni di base.

Il sequenziamento completo del DNA ci permette non solo di fornire test genetici avanzati al momento della fornitura del servizio, ma anche fornire continue analisi sulla stessa base dati.

I test genetici, frutto degli studi scientifici, saranno aggiornati periodicamente e riguarderanno sempre più le aree non codificanti che spero abbiate imparato a conoscere.

Sequenziamento DNA, il futuro della medicina personalizzata

Portare la genomica ad un livello elevato di innovazione tramite blockchain, cloud computing e intelligenza artificiale, questa è la mission di Genesy Project.

Attualmente circa 26 milioni di utenti (fonte MIT su dati 2019) hanno sequenziato il proprio DNA e quasi tutti negli Stati Uniti. Esiste quindi un ampio mercato potenziale in Europa non solo in termini numerici, ma anche per il valore aggiunto che un genoma europeo potrà apportare nel mercato globale.

Un investimento economico, ma anche nella salute che ha il potenziale di migliorare l’assistenza sanitaria, il benessere sociale e la qualità di vita delle persone. Il digitale sta cambiando profondamente il modo con cui possiamo gestire la conoscenza nell’ambito sanitario e nello specifico, ci permette di disporre di dati e di possibilità di mettere in relazione dati e conoscenza sino ad oggi impraticabili.

Allo stesso tempo, pone anche nuove problematiche legate alla privacy e alla sicurezza dei dati, questioni importanti che spesso arrivano a scoraggiare l’adozione o lo sviluppo di determinati progetti. Ed è proprio su tematiche rilevanti, collegate alla qualità del dato e alla sua “utilizzabilità” e accessibilità che l’innovazione digitale può dare, ancora una volta, risposte nuove.

È qui che si colloca Genesy Project, una innovativa piattaforma blockchain, che si pone come intermediario tra il proprietario del dato e i potenziali utilizzatori. Un nuovo ecosistema che assicura proprietà e accesso esclusivo dell’utente ai propri dati genomici, ma anche l’eventuale possibilità di partecipare ai vantaggi di questa ricerca.

Le opportunità di un mercato di dati genomici

Il valore dei dati genomici risiede nella possibilità di identificare associazioni tra varianti genetiche e malattie che si traduce anche in una progettazione razionale dei farmaci in funzione delle caratteristiche genetiche con un miglioramento dei relativi effetti terapeutici. Farmaci “genomici” data driven concretizzano la frontiera della medicina personalizzata e cioè di farmaci creati per i pazienti con un particolare corredo genetico. Fattori di rischio e punti di forza possono essere identificati in anticipo e poi, prevenzione, diagnosi e trattamento delle malattie possono essere mirate per ottenere l’effetto migliore su ogni individuo.

Per quanto riguarda l’economia nazionale, si tratta della possibilità di migliorare significativamente la produttività e l’efficienza dell’assistenza sanitaria e del benessere sociale. A livello individuale, significa migliorare la qualità della vita e aumentare la possibilità che le persone abbiano un impatto diretto sulla propria salute.

Oggi poi, il sequenziamento completo del genoma umano (Whole Genome Sequencing) è diventato più accessibile e ha costi nell’ordine di centinaia di dollari con recenti tecnologie di terza generazione come quella da noi adottata Oxford Nanopore. In questo modo, l’accesso ai dati è completo e le interpretazioni dei dati genomici possono essere continuamente aggiornate. Condizioni che stanno portando all’adozione di questo approccio da parte delle più importanti compagnie statunitensi. In Europa e quindi in Italia siamo agli inizi di questo percorso. Stiamo coinvolgendo nel nostro progetto partner tecnologici e scientifici che ci permettano di crescere in qualità del dato genomico e di credibilità scientifica

Servizi genomici Genesy Project

Sequenziamento intero genoma

L’utente potrà disporre dei files originati dal sequenziamento su una piattaforma in cui sia i suoi dati anagrafici/sanitari sia i dati genetici saranno protetti dall’architettura blockchain. Avrà accesso esclusivo ai suoi dati e ne potrà disporre in modo autonomo.

Test genetici in continuità

Le attività di elaborazione di test genetici per scoprire predisposizioni fisiche o patologie specifiche potranno essere effettuati con continuità nei mesi e anni successivi anche in funzione della pubblicazione di nuovi studi clinici. Il livello di precisione e accuratezza e gli standard applicati permetteranno ad es. all’utente di poter sottoporre per fini diagnostici i report a medici genetisti o ad elaborazioni con software di terze parti.

Analisi avanzata dei dati genomici

L’architettura dei database genetici prodotti formata per ogni persona da miliardi di coppie di informazioni elementari ( le lettere ACGT) e dimensioni di decina di gigabyte richiede per l’elaborazione strumenti specifici che possano tradurre i dati stessi in report genetici .A tal fine stiamo implementando ambienti di Big Data e Intelligenza Artificiale (deep learning) per estrarre valore aggiunto dall’enorme quantità di dato che andiamo a memorizzare.