In un recente studio pubblicato sulla rivista npj Medicina DigitaleI ricercatori hanno condotto una revisione esplorativa per analizzare i modelli basati sull’intelligenza artificiale (AI) per la previsione del diabete mellito di tipo 2 (T2DM).
Revisione: una revisione esplorativa dei metodi basati sull’intelligenza artificiale per la previsione del rischio di diabete. Credito immagine: creato con l’aiuto di DALL·E 3
La crescente importanza dell’intelligenza artificiale nel settore sanitario
L’intelligenza artificiale sta aiutando a sviluppare modelli di previsione per il diabete, una malattia la cui prevalenza è in aumento in tutto il mondo. Sulla base dei profili di rischio, questa tecnica tenta di valutare il rischio di un individuo di sviluppare il T2DM e le relative complicanze. L’intelligenza artificiale consente l’identificazione di pazienti ad alto rischio e lo sviluppo di metodi preventivi personalizzati e terapie mirate.
Fasi chiave nello sviluppo di modelli di intelligenza artificiale
I modelli di intelligenza artificiale dovrebbero essere sviluppati in più fasi, compresa la creazione, la valutazione e la traduzione del modello in supporto alle decisioni cliniche. È possibile utilizzare la convalida interna o esterna, ma la convalida esterna è consigliata per una revisione più completa della generalizzazione del modello. I modelli basati sull’intelligenza artificiale sono emersi come un approccio praticabile per generare modelli di previsione del T2DM, consentendo strategie di prevenzione delle malattie individualizzate.
Metodologia di studio
Nella presente revisione completa, i ricercatori hanno esplorato le applicazioni degli approcci predittivi basati sull’intelligenza artificiale nella previsione del rischio di diabete.
Nei database Scopus, PubMed, Google Scholar e IEEE-Xplore sono stati ricercati sistematicamente studi longitudinali rilevanti utilizzando modelli basati sull’intelligenza artificiale per soggetti umani e pubblicati tra il 1 gennaio 2000 e il 19 gennaio settembre 2022. Inoltre, i riferimenti agli studi inclusi sono stati inclusi. sono stati esaminati per identificare ulteriori documenti.
Sono stati inclusi solo studi sottoposti a revisione paritaria, ricerche originali e atti di conferenze che utilizzavano informazioni mediche, comprese cartelle cliniche elettroniche (EHR), imaging e multi-omics. Il team ha escluso revisioni, commenti, editoriali, lettere, prestamp, studi trasversali, quelli senza l’uso dell’intelligenza artificiale, quelli condotti su soggetti non umani, quelli che includevano il diabete di tipo 1 e gestazionale e quelli che includevano individui con complicanze associate al diabete. .
I dati estratti includevano titoli, anno di pubblicazione, nome del primo autore, tipo di pubblicazione, paese, obiettivo dello studio, popolazione campione, disegno dello studio, dati demografici dei partecipanti, metodi utilizzati per determinare la diagnosi di T2DM, periodo di monitoraggio e tipo della fonte dati. Inoltre, il team ha registrato il numero e il tipo di modalità utilizzate, il tipo di intelligenza artificiale, gli algoritmi specifici e l’approccio di convalida. Un revisore ha condotto una ricerca di dati e due studi hanno selezionato ed estratto i dati in modo indipendente, con discrepanze risolte mediante discussione o consultazione con un terzo revisore. Per l’analisi è stato utilizzato un approccio di sintesi narrativa.
Cosa rivelano i dati
Inizialmente sono stati identificati 1.105 record, di cui 853 sono stati sottoposti a screening del titolo e dell’abstract, 64 sono stati sottoposti a screening del testo completo e 40 sono stati considerati per l’analisi finale. La maggior parte degli studi sono stati pubblicati nei quattro anni precedenti. Le dimensioni del campione variavano da 244 a 1.893.901 individui, con popolazioni diverse tra cui quelle provenienti da Cina, Finlandia, California e Kuwait.
Tipi di dati e algoritmi più comuni
La maggior parte degli studi erano di tipo retrospettivo di coorte, analizzando dati provenienti da grandi set di dati privati e database accessibili al pubblico, come il Canadian Primary Care Sentinel Surveillance Network (CPCSSN), il San Antonio Heart Study (SAHS) e il Tehran Lipid and Glucose Study ( TLGS). ). Livelli di glucosio nel sangue a digiuno pari o superiori a 126 mg/dl e emoglobina glicata (HbA1c) pari o superiori al 6,5% erano i criteri più comunemente utilizzati per determinare una diagnosi di diabete di tipo 2.
La maggior parte degli studi ha utilizzato modelli di intelligenza artificiale unimodali (n = 30) e solo 10 hanno utilizzato approcci multimodali. Mentre i modelli unimodali mostravano un valore dell’area sotto la curva (AUC) di 0,8, i modelli multimodali erano superiori (AUC, 0,9). La maggior parte degli studi (n = 10) hanno utilizzato modelli classici di machine learning (ML), con EHR (inclusi dati sociodemografici, storia familiare di diabete, fattori di stile di vita, misurazioni antropometriche, tratti glicemici, livelli di lipidi sierici, colesterolo e TG) come dati più utilizzati modalità.
Inoltre, la multiomica (come i polimorfismi a singolo nucleotide (SNP), le misurazioni metabolomiche e i dati sul microbiota) erano predominanti, mentre l’imaging medico era il meno utilizzato. I modelli classici di machine learning utilizzavano alberi decisionali (DT) con le loro varianti, come alberi statistici veloci, imparziali ed efficienti (QUEST) e alberi di classificazione e regressione (CART). Modelli di regressione lineare, classificatori random forest (RF), support vector machines (SVM), classificatori Naïve Bays (NB), extreme gradient boosting (XGBoost) e KNN sono stati utilizzati in 10 studi, nove studi, otto studi, cinque studi, quattro studi e quattro studi, rispettivamente.
Le limitazioni incontrate nelle diverse fasi di costruzione del modello predittivo di intelligenza artificiale per il T2DM: quelle associate ai dati sottostanti, alla costruzione e valutazione del modello e alla traduzione clinica.
Validazione e interpretabilità: un aspetto critico
Trentanove studi hanno effettuato una validazione interna, mentre solo cinque hanno eseguito una validazione esterna. La maggior parte degli studi ha utilizzato i valori dell’area sotto la curva (AUC) per le misure di discriminazione. Da notare che solo cinque studi hanno fornito calibrazioni del modello. Il 50% degli studi hanno utilizzato metodi di interpretabilità per identificare i predittori di rischio e la maggior parte dei modelli riportava quelli comunemente noti. La glicemia a digiuno, l’indice di massa corporea (BMI), l’età e i trigliceridi sierici (TG) erano i predittori di rischio più frequentemente documentati per il diabete di tipo 2. I marcatori metabolomici includevano α-tocoferolo, mannosio, glucosio, mestranolo, iboflavina, idrossisfingomielina C14:1 e acilalchil fosfatidilcolina C40:5. I biomarcatori basati su immagini per la malattia retinica correlata al diabete includevano tortuosità vascolare, emorragia retinica, macchie di cotone idrofilo e dilatazione venosa.
Direzioni e sfide future
Sulla base dei risultati, i modelli di intelligenza artificiale si sono dimostrati promettenti nel prevedere lo sviluppo del T2DM, ma è necessario superare gli ostacoli prima che il loro pieno potenziale possa essere realizzato. Per valutare i potenziali benefici dei modelli di intelligenza artificiale, sono necessarie un’ampia validazione e valutazione attraverso studi clinici e ricerche prospettiche. Il ruolo dell’intelligenza artificiale in medicina non è autonomo ma piuttosto uno sforzo collaborativo tra modelli di intelligenza artificiale e conoscenza umana.
Prossimi passi
Nonostante limiti e ostacoli, i ricercatori devono utilizzare le tecnologie di intelligenza artificiale per accelerare la scoperta dei progressi e la loro traduzione nella pratica clinica per pazienti e operatori sanitari.