Un articolo pubblicato sulla rivista “Genome Biology” riporta i risultati di test condotti con SeqScreen, un software libero / open source sviluppato per riconoscere sequenze genetiche esistenti in microrganismi patogeni. Un team di ricercatori guidato dall’informatico Todd Treangen della Rice University e dalla specialista in genomica Krista Ternus della società di consulenze scientifiche Signature Science, LLC ha sviluppato SeqScreen per analizzare le caratteristiche di brevi sequenze di DNA chiamate spesso oligonucleotidi e migliorare le tecniche di riconoscimento di sequenze presenti in un campione che sono almeno potenzialmente pericolose.
Il riconoscimento di microrganismi patogeni sta diventando possibile grazie ai grandi progressi compiuti nelle tecniche genetiche e nei sistemi informatici usati per analizzare DNA (o RNA nel caso dei virus a RNA). Nonostante ciò, un riconoscimento accurato di sequenze patogene è ancora complesso. Per questo motivo, nel 2017 un progetto per migliorare la situazione è stato finanziato dalla IARPA (Intelligence Advanced Research Projects Activity), un’agenzia governativa americana che gestisce ricerche scientifiche ad alto rischio di fallimento ma anche con un elevato potenziale.
Finora, nell’approccio in questo tipo di ricerca gli strumenti usati cercavano di identificare specifici batteri o virus mentre SeqScreen è stato sviluppato per riconoscere in qualsiasi microrganismo piccole sequenze genetiche che possono avere effetti nocivi come tossine. Questi microrganismi possono scambiarsi geni tramite il cosiddetto trasferimento genico orizzontale e ciò significa che vi possono essere batteri con genomi quasi identici eccetto alcune sequenze che codificano sostanze nocive come tossine. SeqScreen è stato sviluppato per riconoscere quelle sequenze nella variante batterica che le ha incluse nel proprio genoma.
Sono stati necessari anni di sviluppo e l’uso di un algoritmo di apprendimento automatico per addestrare SeqScreen a riconoscere certe sequenze genetiche. L’immagine (Cortesia Balaji, A., Kille, B., Kappell, A.D. et al.) illustra il flusso di operazioni di SeqScreen (A) e il framework dell’addestramento tramite apprendimento automatico (B). Il software è disponibile sotto la licenza libera / open source GNU GPL3.
La diffusione di virus e batteri potenzialmente nocivi è cresciuta negli ultimi decenni grazie alla facilità di spostamenti anche tra continenti diversi. La pandemia di Covid-19 ha mostrato drammaticamente come ogni ritardo nell’intervenire con quarantene e altre misure sanitarie possa avere effetti pesanti. Nuove applicazioni bioinformatiche come SeqScreen possono aiutare a riconoscere tempestivamente microrganismi nocivi e Todd Treangen ha dichiarato che questo software aiuterà la rilevazione di patogeni nuovi o emergenti nell’ambiente.