„Dacă toţi cei care predau sau scriu despre medicină şi-ar dovedi spusele cu fapte, una peste alta mai puţine lucruri false se vor spune.”
De methodo medendi, Galenus din Pergam (129-216), probabil cel mai mare clinician al Antichităţii

(Liu X, et al. A comparison of deep learning performance against health care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. Lancet Digital Health. 2019. https://doi.org/10.1016/S2589-7500(19)30123-2)

Autorii au dorit să verifice în ce măsură sunt justificate anunţurile din presă conform cărora inteligenţa artificială (IA) a întrecut judecata medicilor. Din cele 20.000 de rezumate unice publicate, mai puţin de 100 au îndeplinit criteriile de evaluare sistematică şi doar 25 criteriile de includere în metaanaliză. Aceste 25 de studii au comparat performanţa soluţiilor de deep learning cu cea a medicilor în 13 domenii. În doar două cazuri, cancerul de sân şi cancerul de piele, existau mai mult de trei studii. Metaanaliza sugerează o performanţă egală a algoritmilor de deep learning cu cea a medicilor în 14 studii care au folosit acelaşi sistem de validare cu o sensibilitate de 87% (IC 95%:83-90,2) pentru algoritm şi 86,4% (IC 95%:79,9-91) pentru medici şi o specificitate de 92,5% (85,1-96,4) pentru algoritm şi 90,5% (80,6-95,7) pentru medici. Autorii evidenţiază faptul că evaluarea acurateţei diagnostice presupune existenţa unui adevăr fundamental sau standard de aur fără de care este inevitabil să apară erori sistematice în studiu. Acest adevăr fundamental este, de cele mai multe ori, stabilit prin consensul experţilor, care este inconsistent sau imperfect ştiinţific şi de aceea este o greşeală să construieşti un algoritm de IA pornind de la el.

Galenus dice:

IA nu poate încă reproduce procesul de gândire al medicului. În procesul de diagnostic intră date diverse la momente diferite. Istoricul şi examenul fizic determină ce analize trebuie cerute. În plus, rezultatul unei investigaţii îl poate determina pe medic să ceară o nouă analiză diferită. Pe baza acesteia, el construieşte o nouă ipoteză de diagnostic. Diagnosticul diferenţial rămâne regina judecăţii clinice. Algoritmul IA, fiind construit retroactiv, urmăreşte să ajungă la un diagnostic unic, şi nu la un spectru de diagnostice diferenţiale cu diferite probabilităţi de a exista. Algoritmul de fapt nu diagnostichează, ci doar detectează o anomalie. Nu poţi evalua performanţa medicului doar pe baza unei singure informaţii (imagistice în cazul nostru), când în mod uzual el foloseşte o mulţime de informaţii clinice şi paraclinice ca să stabilească un diagnostic cu probabilitate rezonabilă. Deci, sunt prea puţine cunoştinţe solide disponibile ca să putem compara IA cu medicii în privinţa diagnosticului. Deocamdată, tot ce putem spune este că IA nu este inferioară.