Știri

Acurateţea inteligenţei artificiale în analiza imaginilor cu alimente

Determinarea valorilor nutriţionale ale meselor este im­por­tan­tă pentru sănătatea publică.
George Vrapcea, Adriana-Daniela Socianu
28 Iunie 2024
Știri
28 Iunie 2024

Acurateţea inteligenţei artificiale în analiza imaginilor cu alimente

Determinarea valorilor nutriţionale ale meselor este im­por­tan­tă pentru sănătatea publică.
George Vrapcea, Adriana-Daniela Socianu

Introducere

Menţinerea calităţii dietei zilnice şi asigurarea unui consum echilibrat de nutrienţi esenţiali sunt aspecte importante pentru un stil de viaţă sănătos. Capacitatea de a determina cu exactitate valoarea nutriţională a unei mese este un factor-cheie în gestionarea afecţiunilor de sănătate, precum diabetul, obezitatea şi bolile cardiovasculare(1,2).

Metodele actuale de evaluare a aportului alimentar pot fi inexacte şi greu de utilizat, lipsa de precizie în evaluarea consumului de alimente din cauza erorilor umane afectând negativ şi fiabilitatea studiilor nutriţionale la nivel global. Modelele de limbaj nou apărute care folosesc inteligenţa artificială (IA) au potenţialul de a diminua aceste inexactităţi, însă acurateţea acestor predicţii ale IA rămâne incertă(3,4).

Analiza imaginilor cu alimente a devenit un subiect de mare interes datorită aplicaţiilor sale vaste în industrie, sănătate publică şi cercetare ştiinţifică. De la identificarea şi clasificarea alimentelor până la estimarea valorilor nutriţionale şi detectarea contaminanţilor, IA prezintă un potenţial de a facilita modul în care sunt gestionate alimentele(5,6,7).

În ultimii ani, informatica nutriţională a devenit un domeniu important de cercetare interdisciplinară. Unul dintre obiectivele ambiţioase ale acesteia este de a crea sisteme inteligente cuprinzătoare care pot genera în mod independent detalii despre o reţetă dintr-o imagine a preparatului culinar. Eficacitatea metodelor actuale de conversie a imaginilor în reţete depinde în mare măsură de dimensiunea şi varietatea setului de date, precum şi de calitatea datelor învăţate de modelul IA(8).

Tehnologiile de învăţare profundă (reţelele neuronale convoluţionale) sunt esenţiale în atingerea unor niveluri înalte de acurateţe în recunoaşterea şi clasificarea imaginilor cu alimente. Aceste tehnologii sunt capabile să proceseze un volum mare de date şi să identifice caracteristici complexe, care sunt dificil de detectat prin metode tradiţionale de procesare a imaginii(9).

Cercetări ample au explorat aplicaţiile ChatGPT în diverse domenii, precum medicină, sport, educaţie şi altele. Modelul GPT-4 are capacitatea de a gestiona o gamă largă de elemente, printre care şi imagini(10). Rezultatele studiului realizat de Johnson et al. (2023) evidenţiază capacităţile remarcabile ale GPT-4 în analiza imaginilor, cuprinzând sarcini precum identificarea, recunoaşterea şi înţelegerea contextuală a conţinutului vizual. Capacitatea GPT-4 de a identifica cu precizie obiectele din imaginile individuale îl poziţionează ca un instrument valoros pentru aplicaţii cuprinzătoare de detectare a obiectelor(11). În plus, un studiu a remarcat faptul că GPT-4  poate număra şi recunoaşte surprinzător de bine fructele din imagini(12).

În cursul unei cercetări care a evaluat funcţia de analiză a imaginilor preparatelor culinare cu aplicaţia Smart Cuisine (un sistem inovator care foloseşte tehnologie AI de actualitate) s-a constatat că acurateţea prezicerii reţetei corecte a fost considerabil mai mare când imaginea prezenta un preparat alimentar binecunoscut sau recunoscut la nivel global. Imaginile cu reţete mai puţin cunoscute sau locale au oferit o acurateţe mai mică. Acest fenomen poate fi atribuit limitărilor inerente setului de date folosit de modelul IA(13).

Acurateţea modelelor IA poate fi influenţată considerabil de complexitatea imaginilor cu alimente, care pot varia în funcţie de calitate, prezentare, iluminare şi perspective(14).

Dezvoltarea şi implementarea IA în analiza imaginilor cu alimente sunt facilitate de accesul crescut la date masive (big data) şi de progresele în hardware-ul de calcul, care permit antrenarea şi rularea algoritmilor de IA la scară largă(15). În plus, colaborarea interdisciplinară dintre experţi în nutriţie, inginerie şi informatică contribuie la dezvoltarea unor soluţii integrate şi inovatoare(16).

Obiectivul acestei lucrări a fost examinarea acurateţei GPT-4 în analiza imaginilor simple cu preparate culinare, evaluând precizia identificării alimentelor, a numărului acestora şi a valorilor nutriţionale pentru calorii, macronutrienţi şi micronutrienţi în comparaţie cu valorile generate de platforma Nutrition ARTS (care utilizează baza de date cu alimente Food and Nutrient Database for Dietary Studies de la USDA, tradusă în limba română) folosită ca referinţă(17).

Metodologie

Pentru a realiza obiectivul lucrării, am folosit trei imagini simple, reprezentând preparate culinare specifice:

  1. O farfurie cu diverse fructe, precum struguri albi, kiwi, portocale, căpşuni, zmeură şi afine.
  2. O farfurie cu legume colorate, incluzând roşii, măsline şi un castravete feliat.
  3. O farfurie cu produse de origine animală, incluzând friptură, ouă, dar şi orez, roşii şi sos salsa.

Am folosit un model personalizat GPT, denumit „Nutri-Check: Meal Analyzer & Diet Optimizer”, antrenat specific pentru analiza alimentelor şi a compoziţiei lor nutritive.

Imaginile au fost procesate prin acest model GPT pentru a obţine următoarele informaţii:

  • identificarea fiecărui aliment prezent în imagine şi a numărului de unităţi sau porţii;
  • estimarea valorilor nutriţionale, incluzând calorii, macronutrienţi (proteine, grăsimi, carbohidraţi) şi micronutrienţi (vitamine şi minerale).

Pentru verificarea rezultatelor obţinute, valorile generate de GPT-4 au fost comparate cu cele date de platforma Nutrition ARTS prin adăugarea manuală a alimentelor şi cantităţilor acestora în secţiunea „Reţete”. Am ales această platformă ca referinţă deoarece utilizează pentru calculele nutriţionale baza de date FNDDS de la USDA, tradusă în limba română. Pentru vizualizarea şi analiza datelor, am folosit Microsoft ExcelTM.

Rezultate

În privinţa identificării alimentelor şi a numărului acestora, pentru toate cele trei imagini, precizia a fost de 100%. Modelul GPT a reuşit să identifice fiecare aliment prezent în imagine şi să estimeze corect numărul de unităţi sau porţii.

În toate cele trei imagini, valorile caloriilor s-au apropiat de cele de referinţă, cu o diferenţă medie de ±5 kcal. Distribuţia macronutrienţilor a fost, de asemenea, similară (figura 1).
 

Figura 1. Distribuţia macronutrienţilor şi valorile caloriilor determinate prin cele două metode
Figura 1. Distribuţia macronutrienţilor şi valorile caloriilor determinate prin cele două metode

Referitor la gramajele specifice macronutrienţilor, diferenţa medie faţă de referinţă a fost: la proteine ±4,4 g, la glucide ±1,3 g şi la lipide ±0,7 g.

Micronutrienţii selectaţi de modelul GPT pentru a fi analizaţi nu au fost identici pentru toate cele trei imagini (tabelul 1).
 

Tabelul 1. Valorile micronutrienţilor selectaţi de modelul GPT pentru imaginile analizate şi cele generate de Nutrition ARTS (NA)
Tabelul 1. Valorile micronutrienţilor selectaţi de modelul GPT pentru imaginile analizate şi cele generate de Nutrition ARTS (NA)

Modelul GPT a afişat micronutrienţii cu următoarele diferenţe faţă de valoarea de referinţă (figura 2):

  • Prima imagine – vitamina C (+89%), vitamina K (+18%), vitamina B9 (-54%), potasiu (-39%).
  • A doua imagine – vitamina A (+183%), licopen (-5%), vitamina E (-86%), fier (-85%), potasiu (-21%).
  • A treia imagine – vitamina A (+172%), vitamina C (+2%), vitamina B12 (-9%), zinc (-18%), sodiu (-77%), fier (-45%), potasiu (-68%).
Figura 2. Diferenţe ale valorilor date de ChatGPT faţă de referinţă pentru micronutrienţi
Figura 2. Diferenţe ale valorilor date de ChatGPT faţă de referinţă pentru micronutrienţi

Concluzii

Rezultatele acestui studiu sugerează că modelul GPT este capabil să ofere o identificare precisă a alimentelor din imagini şi să estimeze corect numărul acestora. Pentru calorii şi macronutrienţi, valorile estimate de modelul GPT au avut variaţii mici faţă de cele de referinţă, obţinute prin utilizarea platformei Nutrition ARTS. Acurateţea estimărilor a fost considerată bună, indicând capacitatea modelului de a aproxima aceste valori în mod corect în cele trei imagini cu alimente analizate. Cu toate acestea, la analizarea micronutrienţilor, au fost observate diferenţe mai crescute între valorile estimate de modelul GPT şi cele de referinţă.

Rezultatele obţinute subliniază potenţialul, dar şi limitările acestui program IA în analiza imaginilor cu alimente. Cercetări ulterioare mai ample, pe un set mai mare de date, vor oferi informaţii mai relevante, care ar putea ajuta dezvoltatorii software la implementarea îmbunătăţirilor acestor modele IA.  

 

Autor pentru corespondenţă: George Vrapcea E-mail: george.vrapcea@gmail.com

Conflict of interests: none declared.

This work is permanently accessible online free of charge and published under the CC-BY.

A grey and black sign with a person in a circle

Description automatically generated

 

 

analiză nutriţionalăimagini alimenteinteligenţă artificialăvalori nutriţionale
Te-ar mai putea interesa
Știri

Intrare liberă la Şcoala de Vară SSIMA, în ziua dedicată inovaţiei în spitale

Cei interesaţi de domeniul inovaţiei medicale şi tehnologice în spitale pot participa gratuit la sesiunile de joi, 19 septembrie, din cadrul Şcolii Internaţionale de Imagistică cu Aplicaţii în Medicină (SSIMA), anunţă organizatorii conferin...

Știri

Deep Learning şi Inteligenţa Artificială, subiectele-vedetă ale Şcolii Internaţionale SSIMA 2019

Şcoala Internaţională de Imagistică cu Aplicaţii în Medicină (SSIMA) 2019, eveniment excepţional, ce se va desfăşura, în perioada 16-20 septembrie 2019, la Bucureşti, îşi propune să aducă profesioniştii din MedTech la acelaşi nivel informaţ...

Știri

Experţi globali din domeniul eHealth vin la Bucureşti

Despre revoluţia digitală în sănătate şi tehnologii care pot prelungi durata de viaţă la peste 100 de ani:...