Yksi tekoäly voi oppia lukemaan EKG:t, sydänultraäänet ja magneettikuvat yhdessä

Yksi tekoäly voi oppia lukemaan EKG:t, sydänultraäänet ja magneettikuvat yhdessä

Jos erilaiset sydäntutkimukset todella saadaan puhumaan keskenään, lääkärin työ voi seljetä – mutta todisteet tulevat vasta käytännöstä.

Kardiologin työhuoneessa ruudut vilkkuvat. Yhdellä ikkunalla kulkee sähköinen sydänkäyrä, toisella pyörii ultraäänivideo, kolmannella näkyy magneettikuvan siivuja. Kukin kertoo oman tarinansa. Yhteen tarinaan niistä ei kuitenkaan ole ollut helppo saada selkeyttä: laitteet eivät keskustele, ihminen kokoaa viestin kiireessä.

Viime vuodet ovat opettaneet meille kaksi ääripäätä tekoälystä. Toisessa päässä kone on taitava yhdessä tehtävässä, kuten yhden kuvan luokittelussa. Toisessa päässä ovat sujuvasti keskustelevat jättimallit, jotka kirjoittavat, mutta eivät välttämättä katso kunnolla. Uusi tutkimus ehdottaa, että näiden välissä on kolmas tie: järjestelmä, joka sekä katsoo että puhuu – ja osaa yhdistää useita sydäntutkimuksia samaan vastaukseen.

ArXiv-palvelussa julkaistussa esityksessä kuvataan MARCUS-niminen järjestelmä, joka tulkitsee sydämen tutkimuksia päästä päähän. Se käsittelee erikseen sähköisiä sydänkäyriä (EKG), sydämen ultraääniä ja sydänmagneettikuvia – ja tarvittaessa kaikkia kerralla. Ajatus on arkinen mutta kunnianhimoinen: koota useista erikoistuneista osista järjestelmä, jossa yksi "orkesterinjohtaja" pyytää kunkin osaajan näkemyksen ja muodostaa niistä vastauksen luonnollisella kielellä. Tekijöiden mukaan järjestelmän näköosat on opetettu nimenomaan sydänkuville, ja kieliosaa on hiottu useammassa vaiheessa, jotta selitys ei jäisi vain oikeaksi, vaan myös ymmärrettäväksi.

Todisteeksi esitetään luvut. Järjestelmä on opetettu suurella aineistolla: 13,5 miljoonaa kuvaa ja käyrää (noin 250 000 EKG:tä, 1,3 miljoonaa ultraäänikuvaa ja 12 miljoonaa magneettikuvaa) sekä asiantuntijoiden kokoama 1,6 miljoonan kysymyksen aineisto. Kun suorituskykyä mitattiin erillisillä testiaineistoilla kahdesta keskuksesta (sisäisesti Stanfordista ja ulkoisesti UCSF:stä), tarkkuus oli EKG-tehtävissä 87–91 prosenttia, sydänultrassa 67–86 prosenttia ja sydänmagneetissa 85–88 prosenttia. Kun tehtävä vaati usean tutkimuksen yhdistämistä, tarkkuus oli 70 prosenttia. Tekijät vertaavat tuloksia alan tunnetuimpiin yleismalleihin (kuten GPT-5 Thinking ja Gemini 2.5 Pro Deep Think) ja raportoivat, että ero oli selvä: multimodaalisissa tehtävissä järjestelmä oli lähes kolminkertaisesti tarkempi (70 prosenttia vastaan 22–28), ja myös vapaamuotoisten vastausten laatuarvioissa ero oli 1,7–3,0-kertainen. Ero oli heidän mukaansa tilastollisesti merkitsevä.

Miten tämä näyttäisi käytännössä? Kuvitellaan, että lääkäri kysyy: mitä näistä EKG:stä ja ultraäänivideoista voi päätellä potilaan hengenahdistuksesta? Sen sijaan, että kone antaisi listan erillisiä havaintoja, se katsoo käyrästä rytmin ja johtumisen, videosta sydämen pumppausliikkeen ja rakenteet, ja kirjoittaa vastauksen, jossa se kertoo, mihin kuvassa tai käyrässä havainto perustuu. Lääkäri voi kysyä perään, ja järjestelmä tarkentaa – pysyen kiinni niissä kuvissa ja käyrissä, joita se juuri käsitteli.

Kehittäjien mukaan järjestelmä teki vähemmän sellaista, mitä he kutsuvat "kangastusharkinnaksi": tilanteita, joissa malli rakentaa perustelun vihjeiden varaan, joita ei oikeasti ole kuvassa, tai jotka tulevat vahingossa tekstistä. Se on hiljainen mutta tärkeä lupaus. Jos kone ei keksikään kuviin ominaisuuksia, joita niissä ei oikeasti ole, lääkärin ei tarvitse käyttää aikaansa harhojen oikaisemiseen.

On silti syytä hengittää rauhallisesti. Kyse on esijulkaisusta, jota ei ole vertaisarvioitu. Näytöt ovat testiaineistoista, eivät potilastuloksista. Ulkopuolinen testaus on askel oikeaan suuntaan, mutta kaksi yhdysvaltalaista keskusta ei vielä kerro, miten järjestelmä toimii suomalaisessa terveyskeskuksessa tai kiireisellä päivystysosastolla. Ja 70 prosentin tarkkuus monimutkaisissa, useaa tutkimusta yhdistävissä tehtävissä kuulostaa lupaavalta, mutta tarkoittaa edelleen, että kolmessa tapauksessa kymmenestä vastaus on väärin. Lääkäri ei voi nojata siihen yksin.

Lisäksi jotkin yksityiskohdat jäävät vielä kysymysmerkeiksi. Abstrakti kuvaa tulkintaa ja keskustelevaa käyttöä, mutta ei kerro, miten järjestelmä sopisi olemassa oleviin potilastietojärjestelmiin, miten sitä valvottaisiin tai miten virheitä seurattaisiin. Samoin teksti ei kuvaa, mihin kysymyksiin se on heikoin – esimerkiksi harvinaisten löydösten kohdalla – tai miten nopeasti järjestelmä toimii kiireen keskellä. Nämä ovat käytännön kysymyksiä, joista lopulta syntyy potilaan kannalta merkitys.

Yksi kiinnostavimmista kohdista on kuitenkin lupaus avoimuudesta. Tekijät kertovat julkaisevansa mallinsa, koodinsa ja vertailuaineistonsa avoimesti. Se mahdollistaa sen, että muut voivat toistaa kokeet, arvioida vinoumia ja etsiä heikkouksia. Avoimuus tekee myös mahdollisen harhan näkyväksi – ja antaa kilpailijoille tilaisuuden yrittää parempaa.

Jos väite pitää – että erikoistuneista osista koottu, kuvia katsova ja tekstiä tuottava järjestelmä voi aidosti yhdistää sydäntutkimuksia ja perustella vastauksensa – seuraukset eivät rajoitu sydämeen. Lääketiede on täynnä paikkoja, joissa tieto tulee eri muodoissa: keuhkokuvat ja verikokeet, patologianäytteet ja potilaan kertomus. Kysymys kuuluu: kun kone oppii katsomaan ja puhumaan yhtä aikaa, mitä me päätämme antaa sen katsoa – ja kenen ääni kuuluu vastauksessa viimeisenä?

Paper: https://arxiv.org/abs/2603.22179v1

Register: https://www.AiFeta.com

tekoäly terveys sydän diagnostiikka lääketiede tutkimus arXiv

Read more

Tekoälykuvien pahin kompastuskivi on ollut sijainti – nyt sitä mitataan tarkasti

Tekoälykuvien pahin kompastuskivi on ollut sijainti – nyt sitä mitataan tarkasti

Jos pyydät tekoälyä piirtämään kuvan, jossa punainen muki on sinisen kirjan päällä vasemmassa alakulmassa ja vihreä kynä oikealla, lopputulos on usein kuin kiireessä katettu pöytä: tavarat ovat suunnilleen siellä päin, värit melkein oikein – mutta muki löytyy keskeltä, kirja kääntyy nurin ja kynä unohtuu taustalle. Yksityiskohdat eivät pysy paikoillaan. Vuosien ajan

By Kari Jaaskelainen
Kielimalleilla on heikko tilantaju – suhteisiin nojaava ohjaus paransi osumatarkkuutta

Kielimalleilla on heikko tilantaju – suhteisiin nojaava ohjaus paransi osumatarkkuutta

Kuvittele viesti älykkäälle kotisuunnittelijalle: ”Siirrä sohva ikkunan alle ja laita lattiavalaisin sen oikealle puolelle. Jätä kulkuväylä ovelle.” Ihminen ymmärtää heti, mikä on sohvan, ikkunan ja valaisimen välinen järjestys ja missä on ”oikea puoli”. Useimmat kielimallit eivät. Ne voivat selittää ohjeen uudelleen tai keksiä perusteluja, mutta ne kompastuvat siihen, miten tavarat

By Kari Jaaskelainen
Tekoäly puhuu kuin moraalifilosofi – mutta teot ja perustelut eivät aina kohtaa

Tekoäly puhuu kuin moraalifilosofi – mutta teot ja perustelut eivät aina kohtaa

Uusi analyysi vihjaa, että kielimallit oppivat moraalisen puheen kaavat paremmin kuin johdonmukaisen ajattelun – mikä haastaa käsityksen tekoälyn ”kypsyvästä” moraalista. Kuvittele esittäväsi tekoälylle ikuisen arjen kysymyksen: pitäisikö sääntöä rikkoa, jos sillä voi suojella jotakuta? Vastaus saapuu moitteettomana: punnitaan oikeuksia, seurauksia ja periaatteita. Tyyli on harkittu, jopa kypsä. Mutta onko se ajattelua

By Kari Jaaskelainen
Sairaalassa ajettava tekoäly yhdistää potilastiedot ja antaa perustellun ennusteen

Sairaalassa ajettava tekoäly yhdistää potilastiedot ja antaa perustellun ennusteen

Kevyempi malli lupaa yksityisyyttä, paremman todennäköisyyksien osumatarkkuuden ja vähemmän keksittyä selitystekstiä kuin suuret pilvipalvelut – ainakin yhdessä syöpäaineistossa. Syöpäpoliklinikalla lääkärin ruudulla on kaikennäköistä: vapaamuotoisia hoitomerkintöjä, laboratoriotaulukoita, kuvantamistuloksia ja genomiraportteja. Pöydän toisella puolella istuva potilas kysyy sen vaikeimman kysymyksen: mitä seuraavan vuoden aikana on odotettavissa? Dataa on paljon, aikaa vähän – eikä kaikkea

By Kari Jaaskelainen