terveys

Erikoistunut tekoäly lukee potilaskertomuksia tarkemmin kuin yleismallit

Kari Jaaskelainen

11 Mar 2026 — 2 min read

Terveydenhuollossa monen päätöksen taustalla on pieni, arkeen kätkeytynyt rutiini: joku kirjoittaa muistiin, mitä potilaalle oikeasti kuuluu. Lääkärin ja hoitajan tekstimuotoiset merkinnät venyvät vuosien mittaiseksi tarinaksi. Niiden seassa on vihjeitä sydänriskistä: kolesteroli nousi, lääke vaihdettiin, huimaus lisääntyi, suvussa on infarkteja. Silti nämä havainnot hautautuvat helposti järjestelmän välilehtiin – ja kiireeseen.

On pitkään ajateltu, että kaksi ratkaisua kilpailee tästä kaaoksesta: ihmisen tekemä hallinnollinen koodaus, jossa potilaalle annetaan luokitus käsityönä, tai uudet yleiskäyttöiset kielirobotit, jotka lupaavat lukea mitä tahansa tekstiä lennosta. Tuore arXivissa julkaistu tutkimus hollantilaisista potilaskertomuksista ehdottaa kolmatta: tehtävään erityisesti rakennettu malli, joka on opetettu lukemaan pitkiä hoitohistorioita, voi tehdä työn paremmin kuin kumpikaan vaihtoehto.

Tutkimuksen kohteena oli ikääntyneiden sydän- ja verisuonitautiriskien hallinta, terveydenhuollon arjen iso urakka. Aineistona käytettiin 3 482 potilaan pitkittäisiä, vapaamuotoisia merkintöjä Alankomaista. Kysymys oli yksinkertainen mutta käytännöllinen: voiko tietokone päätellä näiden tekstien perusteella, mihin riskiluokkaan potilas kuuluu – siis saman, jonka ihminen tavallisesti merkitsee erillisellä koodilla?

Tutkijat vertasivat kolmea lähestymistapaa. Ensin perinteisiä koneoppimenetelmiä, jotka pystyvät poimimaan avainsanoja ja usein esiintyviä ilmaisuja. Toiseksi erityistä pitkäjänteistä lukemista varten suunniteltua, syvää oppivaa mallia, joka jakaa vuosien merkinnät hallittaviin osiin, etsii olennaisen ja kokoaa johtopäätöksen. Kolmanneksi kokeiltiin yleiskäyttöisiä, suuria kielimalleja – käytännössä ChatGPT-tyyppisiä järjestelmiä – sellaisenaan, ilman että niitä opetettiin erikseen juuri tähän aineistoon.

Tulos oli tutkimuksen pääviesti: erikoistunut malli voitti. Se ylsi parhaisiin tuloksiin kahdella vakiintuneella tarkkuuden mittarilla ja päihitti sekä perinteiset menetelmät että suuret kielimallit, kun jälkimmäisiä pyydettiin luokittelemaan tekstejä ”nollaharjoittelulla”. Syyksi tarjoutuu arki: sydänriskiä määrittävät vihjeet voivat löytyä vuosien takaisesta merkinnästä, lääkityksen hienovaraisesta muutoksesta tai sanojen sävystä, jonka vain pitkän tekstin jäsentävä lukija hahmottaa. Yleisrobotille tällainen hetkenäkyvyys on vaikeaa, ellei sitä ole opetettu juuri tällaisten tekstien parissa.

Tutkimuksessa kokeiltiin myös yhdistelmää, jossa vapaatekstiin liitettiin rakenteisia tietoja, kuten lääkitykseen liittyviä piirteitä ja kehon mittoja koskevaa tietoa. Ajatus on ymmärrettävä: se, mitä potilaasta on kirjoitettu, kertoo tarinan; reseptit ja mitat täydentävät sen. Yhdistelmästrategia antaa vinkkiä siitä, mihin suuntaan käytännön järjestelmät voivat kehittyä – niin, että ne ottavat huomioon kaiken saatavilla olevan, eivät vain yhtä tiedon muotoa.

Mitä tämä tarkoittaa terveyskeskuksen arjessa? Ajatellaan 82-vuotiasta potilasta, jonka tiedoissa on kymmeniä vuosia merkintöjä. Yhdessä käynnissä lääkäri epäili sepelvaltimotautia, toisessa aloitettiin kolesterolilääke ja vuosia myöhemmin annostusta muutettiin. Verenpainemerkinnät sahaavat. Yhdenkäynnin perusteella päätös on epävarma. Erikoistunut malli, joka lukee koko tarinan, voi tunnistaa toistuvat viitteet ja tulkita, että potilas kuuluu tiukemman seurannan piiriin – tai yhtä perustellusti, ettei kuulu. Ihminen säästyy arkisesta seulonnasta, ja huomio kohdistuu niihin, joiden kohdalla päätöksenteko todella tarvitsee lääkärin ajattelua.

Tutkimus asettuu mielenkiintoiseen jännitteeseen vallitsevan keskustelun kanssa. Viime vuodet ovat opettaneet uskomaan, että yksi suuri, kaikkiin tilanteisiin taipuva kielimalli olisi ratkaisu myös terveydenhuollon dokumenttiviidakkoon. Nyt saadaan viitteitä päinvastaisesta: kun tehtävä on kapea, kieli paikallista ja historia pitkä, erikoistyökalu voi olla sekä tarkempi että käytännöllisempi.

On kuitenkin syytä olla varovainen. Aineisto on yhdestä maasta ja yhdeltä kieleltä; on epäselvää, kuinka hyvin tulokset siirtyvät toisiin järjestelmiin ja potilasryhmiin. Suuret kielimallit arvioitiin sellaisinaan, ilman erityistä opettamista tähän tehtävään. On mahdollista, että niitä räätälöimällä päästäisiin parempaan. Tutkimus ei myöskään kerro, missä määrin malli tekee sellaisia virheitä, joilla olisi kliinistä merkitystä – luokittelu on eri asia kuin hoitopäätös. Ja vaikka parhaat mallit toimivat hyvin, mikään niistä ei tee virheettömiä johtopäätöksiä.

Silti löydöksessä on käytännöllinen ydin. Terveydenhuollon työaikaa kuluu kirjauksiin ja niiden tulkintaan. Jos vapaamuotoinen teksti voidaan lukea luotettavasti ja toistettavasti, osa käsityöstä voidaan korvata automaatiolla – tai vähintäänkin tukea ihmistä tavalla, joka tekee seulonnasta johdonmukaisempaa. Tutkimuksen viesti on jalat maassa: ei ihmemallia kaikkeen, vaan tarkoitukseen sopiva, pitkää muistiota kestävä lukija.

Lopulta kysymys kuuluu: haluammeko sairaaloihin yhden kaiken nielevän yleisälyn vai joukon pieniä, tehtäviinsä viritettyjä lukijoita, jotka tuntevat paikalliset tavat ja kielen? Vastauksesta riippuu, millaista terveydenhuollon tekoälyä rakennamme – ja kenelle siitä on eniten hyötyä.

Paper: https://arxiv.org/abs/2603.09685v1

Register: https://www.AiFeta.com

terveys tekoäly potilastiedot sydänriskit tutkimus

Erikoistunut tekoäly lukee potilaskertomuksia tarkemmin kuin yleismallit

Kari Jaaskelainen

Read more

Kun päällekkäisyys ei olekaan virhe: hermoverkot voivat hyödyntää “hälyä”

Synteettinen data parantaa satelliittikuvien tekoälyä, kun sisältö tarkistetaan sanoin ja kuvin

Huipputulokset koetesteissä eivät vielä todista aidosta päättelystä

Tekoäly oppii katsomaan kuvia myös vietnamiksi, kun data ja mittarit päivitetään