Tekoälyn ei aina kannata miettiä pitkään

Tekoälyn ei aina kannata miettiä pitkään

Tuoreen tutkimuksen mukaan mallit voivat yltää parempiin vastauksiin ja säästää laskentaa, kun ne opetetaan etsimään mahdollisimman lyhyttä oikeaa selitystä pitkän jaarittelun sijaan.

Moni on kokenut sen: kysyt tekoälyltä arvoituksen tai pienen päässälaskun, ja saat vastaukseksi kymmenien rivien mittaisen selostuksen. Oikea lopputulos saattaa löytyä lopusta, mutta mieli kysyy: eikö tämän olisi voinut sanoa lyhyemmin?

Viime vuosien kehityksessä on vallinnut hiljainen oletus, että mitä pidempi ja yksityiskohtaisempi päättelyketju, sitä parempi vastaus. Uusimmat niin sanotut suuret päättelymallit – tekoälyt, jotka tuottavat perusteluja askel askeleelta – ovat tuoneet komeita läpimurtoja, mutta samalla ne ovat paisuttaneet sekä tekstiä että laskentakuluja. Ilmiölle on jo nimikin: yliajattelu.

Nyt joukko tutkijoita esittää toisenlaisen periaatteen: lyhyempi voi olla parempi – ja nimenomaan oikealla tavalla lyhyempi. ArXiv-palvelussa julkaistu työ (Fiorenzo Parascandolo ja kollegat) kuvaa menetelmän nimeltä BFS-PO, jonka ydinajatus on yksinkertainen: harjoittelun aikana mallia ohjataan etsimään lyhintä polkua oikeaan vastaukseen. Tavoitteena ei ole oikaista, vaan karsia turha rönsyily.

Jännite on selvä. Aiemmin monia malleja on koulutettu palkitsemalla ne siitä, että ne päätyvät oikeaan lopputulokseen – ja välillä myös siitä, että niiden päättely on pitkiä ja yksityiskohtaisia. Tällaiset palkitsemismenetelmät ovat jopa lisänneet yliajattelua, tutkijat muistuttavat. Uusi ehdotus kääntää suunnan: oikea vastaus on edelleen pakollinen, mutta lyhyempi ja selkeämpi reitti on arvossaan.

Miten tämä tehdään ilman matematiikan koukeroita? Ajattele päättelyä polkuna sokkelossa. Malli kulkee askel kerrallaan, ja jokaisessa risteyksessä on useita vaihtoehtoja. BFS-PO käyttää harjoittelussa hakua, jossa ensin tutkitaan lupaavimmalta näyttäviä risteyksiä – ikään kuin mentäisiin “paras ensin”. Jos polku päätyy umpikujaan tai väärään vastaukseen, menetelmä palaa taaksepäin juuri siihen kohtaan, jossa epävarmuus oli suurin, ja kokeilee toista suuntaa. Kun oikea ratkaisu löytyy, järjestelmä painottaa sitä reittiä, joka vei maaliin mahdollisimman vähin askelein. Vähitellen malli oppii tuottamaan selityksiä, jotka ovat yhtä aikaa täsmällisiä ja napakoita.

Konkreettinen esimerkki auttaa. Kuvittele arjen päässälasku: “Kolme omenaa maksaa kaksi euroa. Paljonko kuusi omenaa maksaa?” Yliajatteleva malli saattaa ensin kirjoittaa auki, mitä “omena” tarkoittaa, pohtia ostamisen logiikkaa, listata mahdollisia hintoja ja lopulta kertoa ratkaisun. Lyhyempi, silti oikea polku on tämä: jos kolme maksaa kaksi, samanlainen erä toisen kerran maksaa toiset kaksi – siis yhteensä neljä. BFS-PO-tyylinen koulutus suosii tätä lyhyttä polkua. Ei siksi, että yksinkertaistettaisiin liikaa, vaan siksi, että turhat sivupolut eivät tuo lisätarkkuutta.

Tutkijat väittävät, että lähestymistapa tuottaa kaksi hyötyä yhtä aikaa. Ensinnäkin vastaukset lyhenevät, mikä vähentää laskentaa ja karsii jaarittelua. Toiseksi tarkkuus paranee: harhailevien, pitkien ketjujen sijaan malli toistaa sellaisia reittejä, jotka harjoittelussa on todettu lyhyiksi ja oikeiksi. Julkaisun mukaan tulokset pitivät paikkaansa useilla eri testipankeilla ja erilaisten perusmallien päällä. Taustalla on havainto, että yliajattelu ei aina selkeytä ajatusta – joskus se vain peittää virheen pitkän perustelun alle.

Uutta ehdotusta kannattaa tarkastella myös kriittisesti. Lyhyyden ihannointi ei saa muuttua hätäisyydeksi. On ongelmia, jotka vaativat pitkiä perusteluja, välivaiheiden tarkkaa kirjaamista ja monen polun tutkimista. Tutkijat eivät väitä muuta: he puhuvat “lyhimmästä oikeasta” vastauksesta, eivät vain lyhyimmästä. Lisäksi julkaisu esittelee tuloksia rajatuissa testeissä. Se, että menetelmä toimi niissä, ei vielä takaa, että sama etu siirtyy kaikkiin tehtävätyyppeihin tai tuleviin, nykyistä suurempiin malleihin.

On myös hyvä muistaa, että lyhin reitti määritellään harjoittelun yhteydessä. Se riippuu siitä, miten mallin epävarmuutta mitataan ja mistä “risteyksistä” päätetään palata taaksepäin. Teknisessä mielessä tutkijat hyödyntävät kohtia, joissa malli on kaikkein epävarmin. Arkikielellä: jos päättely alkaa haparoida, käännytään mieluummin siellä kuin pitkän harhapolun perällä. Tämä kuulostaa järkevältä, mutta sen toimivuus käytännössä voi riippua ongelmasta ja datasta.

Silti ajatus on kiehtova, koska se haastaa ajankohtaisen kehityskaaren. Tekoälyalalla on viime kuukausina nähty malleja, jotka “miettivät” entistä pidempään ja kirjoittavat entistä enemmän. Se on tuonut edistysaskeleita, mutta samalla paisuttanut sekä laskennan hintaa että vastausten pituutta. Jos oikea tie kulkee lyhyemmän, ei pidemmän päättelyn kautta, se on sekä käyttäjälle että järjestelmiä pyörittäville koneille helpotus.

Taustalla oleva metakysymys on perin inhimillinen: pitäisikö tavoitteena olla “enemmän ajattelua” vai “parempaa ajattelua”? BFS-PO asettuu selvästi jälkimmäisen leiriin. Se ei palkitse sanojen määrää, vaan kykyä valita oikeat askeleet ja jättää turhat väliin. Jos tämä linja pitää, seuraava kilpailu ei käydäkään siitä, kuka kirjoittaa pisimmät perustelut, vaan siitä, kuka pääsee luotettavasti maaliin lyhintä reittiä. Ja jos koneet oppivat sen, pitäisikö meidänkin?

Paper: https://arxiv.org/abs/2602.14917v1

Register: https://www.AiFeta.com

tekoäly päättely kielimallit tutkimus laskenta

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen