Marco Benazzo
Ricerca di biomarcatori vocali del COVID-19 mediante machine learning
La pandemia da COVID-19, causata dal virus SARS-CoV-2, ha colpito oltre duecento paesi nel mondo, raggiungendo in poco più di un anno quasi 174 milioni di casi confermati e oltre 3.7 milioni di decessi. Per rallentarne la diffusione sono stati prontamente implementati molteplici test virologici (test molecolari, anticorpali e antigenici), inadatti tuttavia allo screening per l’impossibilità di somministrazioni di massa e a frequenza elevata.
Inoltre, le attuali strategie di sorveglianza sanitaria (checklist dei sintomi, misurazione della temperatura) si sono dimostrate scarsamente sensibili e specifiche. Da qui si evince la necessità di strumenti di screening che siano sensibili ma al contempo ampiamente accessibili, rapidi ed erogabili ad alta frequenza.
Il presente progetto di ricerca è stato pertanto concepito allo scopo di testare l’analisi vocale mediante machine learning (machine learning-based voice analysis, MLVA) quale potenziale strumento di screening nel contesto dell’attuale pandemia, ricercando biomarcatori vocali non invasivi del COVID-19. La voce è a tutti gli effetti un segnale corporeo prodotto dalle interazioni di molteplici sottosistemi (sistema respiratorio, corde vocali, cavità risonanziali), a loro volta finemente coordinati dall’attività cerebrale e influenzati da molteplici condizioni di contorno (idratazione, nutrizione, temperatura, vasodilatazione). Variazioni in ciascuna di queste componenti possono quindi modificare il prodotto vocale finale. Le tecniche tradizionali di analisi vocale, di comune impiego nella pratica clinica otorinolaringoiatrica, sono di per sé in grado di identificare caratteristiche vocali suggestive di molteplici condizioni patologiche. Il potere computazionale del machine learning (ML) offre il vantaggio di poter analizzare migliaia di variabili (feature) acustiche contemporaneamente, risultando efficace anche su campioni acquisiti con dispositivi non professionali (smartphone).
Per questo progetto di ricerca, condotto presso tre ospedali italiani (Fondazione IRCCS Policlinico San Matteo, Pavia; Ospedale dei Castelli, Ariccia; Fondazione Policlinico Tor Vergata, Roma), sono state reclutate tre distinte popolazioni di partecipanti: (a) settanta pazienti COVID-19 positivi ospedalizzati (un tampone positivo); (b) settanta pazienti COVID-19 guariti (due tamponi negativi); (c) settanta soggetti sani di controllo (sierologia negativa).
Per ciascun partecipante sono stati raccolti mediante smartphone e in alta qualità molteplici campioni o task vocali, tra cui la fonazione sostenuta della vocale /a/, una frase e colpi di tosse. Successivamente, i task vocali sono stati analizzati mediante MLVA per estrarne le feature audio distintive e analizzare quindi i pattern di alterazioni predominanti nei diversi gruppi di studio.
Complessivamente, il sistema di MLVA ha dimostrato un’accuratezza media del 90.24% (range 87.88%-92.81%), una sensibilità media del 91.15% (range 83.58%-93.27%) e una specificità media del 89.13% (range 85.51%-92.31%) nella discriminazione dei tre sottogruppi di partecipanti per tutti i task vocali. Nello specifico, la vocale/a/ sostenuta si è dimostrata il miglior discriminatore tra soggetti positivi e sani, così come tra soggetti positivi e guariti. La tosse si è invece rivelata il miglior discriminatore tra soggetti guariti e sani.
L’elevata accuratezza di classificazione dei tre sottogruppi di studio evidenzia le molteplici potenzialità del MLVA nell’ambito della presente emergenza sanitaria. Nello specifico, l’accurata discriminazione degli individui COVID-19 positivi permetterebbe, dopo opportuna validazione, di utilizzare questa innovativa tecnologia come strumento di screening di massa, facilmente accessibile e a costi virtualmente nulli, indirizzando a conferma virologica i soggetti identificati come sospetti. In aggiunta, questi sistemi di MLVA potrebbero essere testati e introdotti nelle regioni del mondo in cui i test convenzionali siano scarsamente accessibili o reperibili con difficoltà. Significativamente, questo progetto di ricerca rappresenta il primo studio a testare la tecnologia
del MLVA su pazienti COVID-19 guariti. Nello specifico, l’elevata capacità discriminativa dei soggetti guariti sulla base del solo segnale vocale permette di ipotizzare che in questi pazienti possano residuare “tracce” vocali dell’infezione da SARS-CoV-2 rilevabili mediante sistemi di MLVA. Inoltre, è ipotizzabile che questa tecnologia possa identificare fasi distinte dell’infezione, contribuendo così al monitoraggio del decorso clinico della malattia. In conclusione, gli incoraggianti risultati di questo studio preliminare supportano la potenziale utilità clinica del MLVA quale innovativo strumento di screening nel contesto della presente pandemia. Nuovi studi multicentrici sono stati avviati per validare questa tecnologia su più ampia scala, ai fini di una sua pronta adozione quale più efficace strategia di sorveglianza sanitaria per il COVID-19.