Medicīna ir nozare, kurā ir nepieciešams apstrādāt daudz datu un pieejamo veselības datu apjoms arvien pieaug, tāpēc aktuāls ir jautājums, kā tos iespējami labāk analizēt, lai saņemtu papildu ieguvumu veselības aprūpē, diagnostikā un ārstēšanā. Latvijas Universitātes Klīniskās un profilaktiskās medicīnas institūta pēcdoktorante Inese Poļaka nodarbojas ar pētījumiem šajā jomā un 2021. gada 31. decembrī noslēgusi pēcdoktorantūraspētniecības atbalsta projektu (PostDoc Latvia) "Uz taksonomiju balstīta klasifikācija agrīnai kuņģa un kolorektālā vēža diagnostikai"(Nr. 1.1.1.2/VIAA/2/18/270).
Viņa pētījumā izstrādāja pieeju lielu medicīnas datu analīzei, kas balstās uz datu-centrisku mašīnmācīšanos. Tā vietā, lai arvien sīkāk pielāgotu algoritmus, šīs nozares pētnieki piedāvā pieejas, kā sagatavot datus tā, lai mašīnas mācītos labāk.
Mašīnmācīšanās ir svarīga medicīnas datu analīzei tāpēc, ka laika gaitā tiek uzkrāti dati par pacientiem, kuri var tikt izmantoti, lai novērtētu slimību riskus, uzlabotu diagnostiku, pielāgotu ārtēšanu u.tml. Šādu lielu datu analīzē parasti netiek apskatīts katrs pacients atsevišķi, bet gan tiek meklētas likumsakarības starp raksturojošiem parametriem. Taču šajā procesā svarīgi nepazaudēt svarīgāko, kas raksturo noteiktu risku, diagnozi u.tml. Tāpēc savā pētījumā Inese piedāvā meklēt dabīgas grupas, kuras apvieno cilvēkus ar līdzīgiem paradumiem, īpašībām un dzīves notikumiem, kas ietekmētu meklējamo risku u.tml.
Projektā tika pētīti cilvēku paradumi un dzīves pieredze, kas norādītu uz lielāku risku būt inficētam ar baktēriju H.Pylori, kuru PVO atzinusi par kancerogēnu (kuņģa vēža attīstību veicinošu) organismu. Tāpat tika veikta cilvēka izelpas analīze: mākslīgā deguna jeb īpaši pielāgotas sensoru kopas reakciju analīze, lai noteiktu, vai konkrētas izelpas "pirkstu nospiedums" sensoru reakcijā ir raksturīgs kuņģa vēža (vai kolorektālā vēža) pacientam vai veselam cilvēkam. Ar izstrādāto modeli šo atšķirību ir iespējams precīzi noteikt teju 8 cilvēkiem no 10.