Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän
Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä.
Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei toimi, on keksittävä vaihtoehtoja (ideointi). Sen jälkeen valitaan paras niistä (karsinta) ja lopulta seurataan ohjetta ruuvi ruuvilta (täsmällinen suoritus). Arki muistuttaa: ajattelutapoja on useita, ja niitä vaihdetaan lennossa.
Tekoälylle on usein opetettu toisenlainen tapa. Suosittu lähestymistapa on ollut pyytää suurta kielimallia “ajattelemaan ääneen” ja toistamaan samaa askel askeleelta -logiikkaa koko ongelman läpi. Ajatuksena on, että kärsivällinen, johdonmukainen eteneminen vähentää virheitä. Mutta entä jos sama ääni ei sovi kaikkiin kohtiin?
ArXivissa julkaistussa artikkelissa esitetään, että tekoälyn ei kannattaisi pitäytyä vain yhdessä otteessa. Kirjoittajat ehdottavat menetelmää nimeltä Chain of Mindset (CoM), joka jakaa päättelyn neljään erilaiseen “moodiin” ja vaihtelee niiden välillä vaihe vaiheelta. Nuo neljä ovat tutkimuksen sanastolla tilallinen (havainnoi ja järjestää asioita tilassa), laajentava eli divergentti (tuottaa vaihtoehtoja), supistava eli konvergentti (karsii ja valitsee) sekä algoritminen (seuraa sääntöjä täsmällisesti). Ylätason ohjain valitsee kulloinkin sopivimman otteen sen mukaan, missä kohtaa ratkaisua mennään, ja erillinen suodatin päättää, mitä tietoa kannattaa kuljettaa moodien välillä molempiin suuntiin.
Arkinen esimerkki auttaa hahmottamaan idean. Kuvittele, että tekoälyn tulisi selvittää, mahtuuko muuttokuorma yhteen pakettiautoon. Ensin se tarvitsee tilallista hahmotusta: miten sohva, sängynpohjat ja laatikot asettuvat. Kun palaset eivät tunnu menevän kohdilleen, on hyödyllistä ideoida vaihtoehtoisia järjestyksiä tai purkutapoja (laajentava mielentila). Sen jälkeen on karsittava käyttökelpoiset vaihtoehdot niihin, jotka todella sopivat auton mittoihin (supistava mielentila). Lopuksi valittu järjestys on toteutettava kurinalaisesti vaihe vaiheelta (algoritminen mielentila). Tutkimuksen ydinväite on, että sama vaihtaminen kannattaa opettaa myös kielimalleille – ei vain ihmisten hermoille.
Todisteena kirjoittajat esittävät kuusi vaativaa testikokonaisuutta, jotka kattavat matematiikan, koodin tuottamisen, tieteelliset kysymykset ja tilallisen päättelyn. Heidän mukaansa uusi ohjaustapa nosti kokonaistarkkuutta kahdessa vahvassa kielimallissa noin viidellä prosenttiyksiköllä: Qwen3‑VL‑32B‑Instructissa parannus oli 4,96 prosenttiyksikköä ja Gemini‑2.0‑Flashissa 4,72 prosenttiyksikköä. Samalla kirjoittajat korostavat, että laskennan tehokkuus pysyi tasapainossa – toisin sanoen lisäaskelia ei lisätty rajattomasti, vaan tietoa suodatettiin moodien välillä, jotta turha työ vähenisi. Koodi on julkisesti saatavilla, mikä mahdollistaa tarkistamisen ja jatkokehityksen.
Miksi tällä on väliä? Jos kielimallit alkavat käyttää eri otteita eri vaiheissa, ne saattavat törmätä vähemmän niihin kompastuksiin, jotka syntyvät, kun sama ajatusmalli yritetään venyttää joka paikkaan. Laajentava ote voi auttaa ideoinnissa, kun taas supistava sopii siihen, että vastauksesta tulee selkeä ja ytimekäs. Tilallinen hahmotus puolestaan on tarpeen tehtävissä, joissa pitää nähdä, miten asiat asettuvat kuvaan, karttaan tai kaavioon. Ja algoritminen kurinalaisuus estää poukkoilemasta, kun valittu polku on selvä.
On silti syytä lukea tuloksia maltilla. Ensinnäkin arXiv on esijulkaisupalvelu: artikkeli ei välttämättä ole käynyt läpi vertaisarviointia. Toiseksi “tila, ideointi, karsinta, suoritus” on kirjoittajien valitsema nelijako. Se on uskottava ja arkijärkeen käyvä, mutta ei ainoa mahdollinen. On vielä näyttämättä, miten hyvin tällainen ohjailu toimii tehtävissä, joita testipaketit eivät kata, tai tilanteissa, joissa ongelma itsessään muuttuu kesken suorituksen. Kolmanneksi parannus on mittakaavaltaan muutamia prosenttiyksikköjä. Se on merkittävä, kun lähtötaso on korkea, mutta ei mullistus. Neljänneksi “koulutusta vailla” tarkoittaa tässä yhteydessä, että perusmallia ei opeteta uudelleen, vaan sen päälle rakennetaan ohjaus. Se helpottaa käyttöönottoa, mutta tuo myös uuden kerroksen monimutkaisuutta: ohjain voi valita väärän otteen väärään aikaan tai suodattaa pois hyödyllistä tietoa.
Lisäksi tehokkuudesta puhuminen jättää avoimeksi käytännön kysymyksiä: miten paljon ohjaus hidastaa tai nopeuttaa vastauksen saamista eri tilanteissa? Miten valitsija reagoi epävarmuuteen – esimerkiksi, jos kuvat ovat suttuisia tai kysymys itsessään on moniselitteinen? Abstrakti lupaa tasapainoa, mutta yksityiskohdat ratkaisevat, kun tekniikkaa yritetään sovittaa todellisiin järjestelmiin.
Laajemmassa katsannossa ehdotus vie huomiota pois ajatuksesta, että “enemmän parametreja” aina ratkaisisi ongelmat. Ehkä seuraava harppaus ei tule pelkästään suuremmista malleista vaan paremmasta työnjaosta niiden sisällä: kuka tekee mitäkin, milloin ja millä tiedolla. Jos kone oppii vaihtamaan ajattelutapaansa tilanteen mukaan – kuten me ruuvimeisseli kädessä opimme – miten meidän pitäisi mitata sen älyä? Onko tärkeämpää lopputulos vai kyky vaihtaa välinettä kesken työn?
Paper: https://arxiv.org/abs/2602.10063v1
Register: https://www.AiFeta.com
tekoäly kielimallit päättely tutkimus tiede