tekoäly

Faktojen ketjuttaminen voi opettaa tekoälyn perustelemaan paremmin

Kari Jaaskelainen

22 Jan 2026 — 3 min read

Kun kysyy tekoälyltä terveysaiheisen kysymyksen, vastaus tulee usein sujuvasti – mutta syy-seurausketju jää piiloon. Jos pyytää perustelemaan askel askeleelta, malli alkaa helposti hapuilla. Tämä on tuttu ristiriita: kielimallit loistavat matematiikan kaavoissa ja ohjelmointitehtävissä, mutta kompuroivat erikoisalojen monivaiheisessa päättelyssä.

Viime vuodet ovat opettaneet yhden perusvireen: suurempi malli ja enemmän dataa tuottaa parempia vastauksia. Nyt tuore arXiv-julkaisu ehdottaa toisenlaista, maanläheisempää opetustapaa. Sen ydin on yksinkertainen: sen sijaan että palkitaan tekoälyä vain oikeasta lopputuloksesta, annetaan pisteitä myös oikeista välivaiheista – ja nämä välivaiheet sidotaan tarkistettaviin faktoihin.

Taustalla on ajatus niin sanotusta tietoverkosta (knowledge graph): verkko, jossa faktat ovat solmuja ja niiden väliset suhteet ovat kaaria. Esimerkiksi “A aiheuttaa B” ja “B hoidetaan C:llä”. Kun kysymys vaatii monen askeleen päättelyä, oikea vastaus löytyy seuraamalla verkon polkua A:sta C:hen. Tutkimuksen mukaan tällaisista poluista voidaan johtaa selkeitä, tarkistettavia signaaleja, joilla mallia ohjataan.

Mitä aiemmin ajateltiin – ja mitä nyt ehdotetaan

Perinteinen vahvistusoppiminen tekoälylle toimii usein niin, että malli saa “palkinnon” hyvästä lopputuloksesta. Tällä logiikalla malli oppii optimoimaan viimeisen sanan, ei välttämättä reittiä sinne. Uudessa työssä asetelma käännetään toisinpäin: malli sidotaan ensin perusfaktoihin ja niiden välisiin suhteisiin, ja sitä kannustetaan kokoamaan vastaus näistä palasista. Tutkijat kutsuvat tätä “alhaalta ylöspäin” eteneväksi oppimiseksi: ensin hallitaan aksioomat, sitten niiden yhdisteleminen uusiin, aiemmin näkemättömiin ongelmiin.

Käytännössä he rakensivat jälkikoulutusprosessin, jossa yhdistyvät opettajan esimerkit ja vahvistusoppiminen. Uutta on se, mistä “palkkiot” tulevat: ne johdetaan tietoverkon poluista. Näin malli saa kannustimen paitsi lopullisesta vastauksesta myös jokaisesta tosiasioihin perustuvasta väliväitteestä. Signaalit ovat tarkistettavia (polku on todennettavissa verkossa), skaalautuvia (polkuja voi tuottaa paljon) ja kiinni todellisissa tiedoissa (eivät synny mallin omista arvauksista).

Yksi konkreettinen esimerkki ilman matematiikkaa

Kuvitellaan, että tietoverkossa on kolme faktaa: “Tietyllä sairaudella on tietty oire”, “tätä oiretta hoidetaan lääkkeellä X” ja “lääke X on haitallinen tietyssä potilasryhmässä”. Jos kysytään, miksi potilasryhmässä Z pitää varoa tietyn sairauden hoitoa, vastaus löytyy ketjusta sairaus → oire → lääke → varoitus. Uudessa lähestymistavassa malli saa pisteitä jokaisesta oikein tunnistetusta nuolesta, ei vain lopullisesta varoituksesta. Tavoite on, että malli oppii liittämään faktoja toisiinsa kuin palapeliä, eikä arvailemaan loppukuvaa ilman reunoja.

Miten tutkijat testasivat ideaa

Tekijät sovelsivat menetelmää lääketieteeseen ja kouluttivat 14 miljardin parametrin mallia lyhyillä päättelypoluilla (yksi–kolme askelta). Sitten mallia koeteltiin tehtävillä, jotka vaativat pidempiä ketjuja (neljä–viisi askelta) – ilman että tällaisia pitkiä polkuja olisi käytetty harjoittelussa. Artikkelin mukaan poluista johdetut välipalkkiot toimivat siltana yksinkertaisista askeleista monimutkaisiin. Raportoiduissa kokeissa malli pärjäsi vaativimmissa tehtävissä paremmin kuin huomattavasti suuremmat kilpailijansa sekä niin kutsutut huippumallit, kuten GPT-5.2 ja Gemini 3 Pro.

Lisäksi tekijät kertovat testanneensa kestävyyttä “kiusantekopattereilla”: esimerkiksi monivalintakysymyksissä vastausvaihtoehtojen järjestystä sekoitettiin, jotta malli ei voisi tukeutua pinnallisiin vinkkeihin. Menetelmä kesti tällaisia muutoksia aiempaa paremmin, tutkimuksen mukaan.

Miksi tämä on kiinnostavaa – ja mitä emme vielä tiedä

Jos tekoäly oppii rakentamaan vastaukset tosiasioiden ketjuista, lopputulos voi olla sekä luotettavampi että selitettävämpi. Se on tervetullut ajatus etenkin erikoisaloilla, joissa yksittäiset virheet voivat olla kalliita. Lähestymistapa ehdottaa myös tehokkuutta: pienempi malli, joka käyttää faktoja viisaammin, voi haastaa massiiviset jättiläiset.

Silti monet kysymykset ovat auki. Kyseessä on esijulkaisu arXivissa, ei vertaisarvioitu artikkeli. Tulokset koskevat yhtä alaa, lääketiedettä, eivätkä välttämättä kerro, miten menetelmä skaalautuu muihin domain-alueisiin tai huomattavasti pidempiin päättelyketjuihin. Vertailu suurempiin malleihin on aina herkkä yksityiskohdille: millaiset tehtävät valittiin, miten mallien asetukset ja ohjeistus säädettiin, ja kuinka hyvin ulkopuoliset voisivat toistaa tulokset. Myös riippuvuus tietoverkon laadusta on ilmeinen: jos verkossa on puutteita tai virheitä, malli oppii palkitsemaan vääriä polkuja.

Lisäksi perusteltavuus ei tarkoita automaattisesti totuutta. Malli voi oppia tuottamaan kauniita, mutta edelleen virheellisiä perusteluketjuja, jos lähdetiedot ovat vajaita tai jos tietoverkon suhde todellisuuteen on epäsuora. Ja vaikka vaihtoehtojen sekoittaminen ei enää harhauta, on lukemattomia muita tapoja mitata sitkeyttä, joita tutkimus ei välttämättä vielä kattanut.

Silti suunta on ymmärrettävä. Avoimesti todennettavat välivaiheet voivat palauttaa tekoälyn opetuksen peruskysymyksen äärelle: mitä tosiasioita malli oikeasti tietää, ja miten se yhdistää ne? Jos tämä toimii laajemminkin, koulutus voisi muistuttaa vähemmän arvausleikkiä ja enemmän hyvää oppikirjaa, jossa näyttö ja johtopäätökset kulkevat käsi kädessä.

Jäljelle jää laajempi pohdinta. Kun yhä useampi päätös nojaa automaattiseen päättelyyn, haluammeko järjestelmän, joka antaa vastauksen – vai järjestelmän, joka näyttää reitin vastaukseen? Ja kenen vastuulla on varmistaa, että tuo reitti kulkee oikeiden faktojen kautta?

Paper: https://arxiv.org/abs/2601.15160v1

Register: https://www.AiFeta.com

tekoäly kielimallit lääketiede tutkimus päättely tietoverkot