Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä.

Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei toimi, on keksittävä vaihtoehtoja (ideointi). Sen jälkeen valitaan paras niistä (karsinta) ja lopulta seurataan ohjetta ruuvi ruuvilta (täsmällinen suoritus). Arki muistuttaa: ajattelutapoja on useita, ja niitä vaihdetaan lennossa.

Tekoälylle on usein opetettu toisenlainen tapa. Suosittu lähestymistapa on ollut pyytää suurta kielimallia “ajattelemaan ääneen” ja toistamaan samaa askel askeleelta -logiikkaa koko ongelman läpi. Ajatuksena on, että kärsivällinen, johdonmukainen eteneminen vähentää virheitä. Mutta entä jos sama ääni ei sovi kaikkiin kohtiin?

ArXivissa julkaistussa artikkelissa esitetään, että tekoälyn ei kannattaisi pitäytyä vain yhdessä otteessa. Kirjoittajat ehdottavat menetelmää nimeltä Chain of Mindset (CoM), joka jakaa päättelyn neljään erilaiseen “moodiin” ja vaihtelee niiden välillä vaihe vaiheelta. Nuo neljä ovat tutkimuksen sanastolla tilallinen (havainnoi ja järjestää asioita tilassa), laajentava eli divergentti (tuottaa vaihtoehtoja), supistava eli konvergentti (karsii ja valitsee) sekä algoritminen (seuraa sääntöjä täsmällisesti). Ylätason ohjain valitsee kulloinkin sopivimman otteen sen mukaan, missä kohtaa ratkaisua mennään, ja erillinen suodatin päättää, mitä tietoa kannattaa kuljettaa moodien välillä molempiin suuntiin.

Arkinen esimerkki auttaa hahmottamaan idean. Kuvittele, että tekoälyn tulisi selvittää, mahtuuko muuttokuorma yhteen pakettiautoon. Ensin se tarvitsee tilallista hahmotusta: miten sohva, sängynpohjat ja laatikot asettuvat. Kun palaset eivät tunnu menevän kohdilleen, on hyödyllistä ideoida vaihtoehtoisia järjestyksiä tai purkutapoja (laajentava mielentila). Sen jälkeen on karsittava käyttökelpoiset vaihtoehdot niihin, jotka todella sopivat auton mittoihin (supistava mielentila). Lopuksi valittu järjestys on toteutettava kurinalaisesti vaihe vaiheelta (algoritminen mielentila). Tutkimuksen ydinväite on, että sama vaihtaminen kannattaa opettaa myös kielimalleille – ei vain ihmisten hermoille.

Todisteena kirjoittajat esittävät kuusi vaativaa testikokonaisuutta, jotka kattavat matematiikan, koodin tuottamisen, tieteelliset kysymykset ja tilallisen päättelyn. Heidän mukaansa uusi ohjaustapa nosti kokonaistarkkuutta kahdessa vahvassa kielimallissa noin viidellä prosenttiyksiköllä: Qwen3‑VL‑32B‑Instructissa parannus oli 4,96 prosenttiyksikköä ja Gemini‑2.0‑Flashissa 4,72 prosenttiyksikköä. Samalla kirjoittajat korostavat, että laskennan tehokkuus pysyi tasapainossa – toisin sanoen lisäaskelia ei lisätty rajattomasti, vaan tietoa suodatettiin moodien välillä, jotta turha työ vähenisi. Koodi on julkisesti saatavilla, mikä mahdollistaa tarkistamisen ja jatkokehityksen.

Miksi tällä on väliä? Jos kielimallit alkavat käyttää eri otteita eri vaiheissa, ne saattavat törmätä vähemmän niihin kompastuksiin, jotka syntyvät, kun sama ajatusmalli yritetään venyttää joka paikkaan. Laajentava ote voi auttaa ideoinnissa, kun taas supistava sopii siihen, että vastauksesta tulee selkeä ja ytimekäs. Tilallinen hahmotus puolestaan on tarpeen tehtävissä, joissa pitää nähdä, miten asiat asettuvat kuvaan, karttaan tai kaavioon. Ja algoritminen kurinalaisuus estää poukkoilemasta, kun valittu polku on selvä.

On silti syytä lukea tuloksia maltilla. Ensinnäkin arXiv on esijulkaisupalvelu: artikkeli ei välttämättä ole käynyt läpi vertaisarviointia. Toiseksi “tila, ideointi, karsinta, suoritus” on kirjoittajien valitsema nelijako. Se on uskottava ja arkijärkeen käyvä, mutta ei ainoa mahdollinen. On vielä näyttämättä, miten hyvin tällainen ohjailu toimii tehtävissä, joita testipaketit eivät kata, tai tilanteissa, joissa ongelma itsessään muuttuu kesken suorituksen. Kolmanneksi parannus on mittakaavaltaan muutamia prosenttiyksikköjä. Se on merkittävä, kun lähtötaso on korkea, mutta ei mullistus. Neljänneksi “koulutusta vailla” tarkoittaa tässä yhteydessä, että perusmallia ei opeteta uudelleen, vaan sen päälle rakennetaan ohjaus. Se helpottaa käyttöönottoa, mutta tuo myös uuden kerroksen monimutkaisuutta: ohjain voi valita väärän otteen väärään aikaan tai suodattaa pois hyödyllistä tietoa.

Lisäksi tehokkuudesta puhuminen jättää avoimeksi käytännön kysymyksiä: miten paljon ohjaus hidastaa tai nopeuttaa vastauksen saamista eri tilanteissa? Miten valitsija reagoi epävarmuuteen – esimerkiksi, jos kuvat ovat suttuisia tai kysymys itsessään on moniselitteinen? Abstrakti lupaa tasapainoa, mutta yksityiskohdat ratkaisevat, kun tekniikkaa yritetään sovittaa todellisiin järjestelmiin.

Laajemmassa katsannossa ehdotus vie huomiota pois ajatuksesta, että “enemmän parametreja” aina ratkaisisi ongelmat. Ehkä seuraava harppaus ei tule pelkästään suuremmista malleista vaan paremmasta työnjaosta niiden sisällä: kuka tekee mitäkin, milloin ja millä tiedolla. Jos kone oppii vaihtamaan ajattelutapaansa tilanteen mukaan – kuten me ruuvimeisseli kädessä opimme – miten meidän pitäisi mitata sen älyä? Onko tärkeämpää lopputulos vai kyky vaihtaa välinettä kesken työn?

Paper: https://arxiv.org/abs/2602.10063v1

Register: https://www.AiFeta.com

tekoäly kielimallit päättely tutkimus tiede

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen