Tekoäly kompastuu alakoulun kuviin
Aidosta koemateriaalista koottu vertailu osoittaa, että kuvaa ja tekstiä yhdistelevät mallit pärjäävät laskemisessa mutta sekoavat, kun kuviota pitää kääntää, peilata tai taittaa – eikä tämä ole harmiton puute luokassa.
Keittiön pöydällä on läksypaperi täynnä nuolia, kolmioita ja tähtiä. Tehtävä kysyy, miltä kuvio näyttää peilin kautta tai mihin kohtaan paperia reikä osuu, kun arkki taitetaan. Aikuinen näkee vastauksen yhdellä vilkaisulla. Moni ajattelee, että samaan pystyisi jo myös tekoäly.
Näin ei välttämättä ole. Tuore tutkimus asettaa suoran peilin luokkiin hiipiville tekoälytyökaluille: ne ovat taitavia laskemaan kuvioita ja arvaamaan mittasuhteita, mutta menevät helposti harhaan, kun tehtävä vaatii kuvitteellista liikettä tai muodonmuutosta.
Viime vuosina suuria kielimalleja on kehuttu kyvyistään perustella asioita tekstissä. Kun samaan järjestelmään lisätään näköaisti – eli kyky lukea kuvia – voisi olettaa, että se auttaa myös alakoulun kuvallisissa tehtävissä. Tutkijoiden kokoama uusi vertailuaineisto, Visual Reasoning Benchmark (VRB), osoittaa rajan kulkevan toisaalla.
Vertailu on rakennettu 701 kysymyksestä, jotka on poimittu sellaisenaan alakoulun kokeista Sambiassa ja Intiassa. Kuvat ovat opettajien oikeasti käyttämiä, niissä on vähän tekstiä ja ne eivät ole laboratorioon siloiteltuja. Tehtävät kattavat esimerkiksi analogioita (”mikä sopii tähän samalla periaatteella”), kuviosarjojen täydentämistä ja kuvioiden vastaavuuden etsimistä.
Kun tutkijat syöttivät nämä kysymykset nykyisille malleille, tulos oli epätasainen. Yhdessä kulmassa kone on varma: se osaa laskea, montako tähteä on ruudukossa, ja päätellä, että jos neliön sivu kaksinkertaistuu, pinta-alaa on enemmän. Mutta raja tulee vastaan, kun homma muuttuu dynaamiseksi – kun pitää kuvitella, mitä tapahtuu peilissä, käännössä tai paperia taitettaessa.
Yksi konkreettinen esimerkki: Kokeessa näytetään nuoli, ja vaihtoehdoista pitää valita, miltä nuoli näyttää peilin kautta. Ihminen hahmottaa peilin suunnan ja kääntää nuolen mielessään. Tekoäly voi valita väärin, koska se tunnistaa muodon, mutta ei pidä lukua siitä, miten avaruudellinen suhde muuttuu peilauksessa. Toisessa tehtävässä paperiin on piirretty piste ja taitosviiva. Kysymys kuuluu, mihin kohtaan piste osuu, kun paperi taitetaan. Malli saattaa ehdottaa paikkaa, joka näyttää ”järkevältä”, mutta on väärällä puolella taitetta.
Tutkijat kuvaavat tätä ”sahalaitaiseksi” kyvykkyydeksi: joissain perustaitoja muistuttavissa asioissa mallit ovat kelvollisia, toisissa taas ne törmäävät ”tilalliseen kattoon”. Se on ongelma juuri niissä tilanteissa, joissa digitaalista apuria harkitaan luokkaan: automaattisessa arvioinnissa, apukysymysten laatimisessa tai oppilaan ohjaamisessa vaihe vaiheelta.
Miksi tällä on väliä? Koska virheet eivät jää vain kuriositeeteiksi. Tutkimus varoittaa kolmesta riskistä. Ensinnäkin malli voi merkitä oppilaan oikean vastauksen vääräksi tai päinvastoin. Toiseksi se voi tarjota vääränlaista tukea – ohjata oppilasta kohti ratkaisua, joka näyttää loogiselta mutta perustuu väärin ymmärrettyyn kuvaan. Kolmanneksi nämä väärät polut voivat vahvistaa oppilaan omia väärinkäsityksiä. Alakoulun matematiikassa moni asia opitaan juuri kuvien avulla; jos tulkinta on pielessä, oppi voi mennä vinoksi.
VRB:n arvo on sen aitoudessa. Koska kysymykset ovat oikeista kokeista ja niissä on vain vähän tekstiä, ne mittaavat sitä, mitä luokassa oikeasti tarvitaan. Malli ei voi nojata pitkään tehtävänantoon tai vihjeisiin, vaan sen on ymmärrettävä, mitä kuvassa tapahtuu. Juuri tässä ymmärtämisessä näkyy raja, joka ei aina paljastu silotelluissa esimerkeissä tai pelkän tekstin varassa.
On syytä olla tarkkana myös tulkinnassa. Vertailu kattaa alakoulun tehtäviä ja vain 701 kysymystä kahdesta maasta. Se ei kerro, miten mallit pärjäävät kaikentyyppisissä visuaalisissa ongelmissa tai vanhemmilla oppijoilla. Eri järjestelmät kehittyvät nopeasti, ja huomenna raja voi liikahtaa. Silti löydös – vahvuus laskemisessa, heikkous peilauksessa, käännöissä ja taittelussa – on linjakas ja käytännöllinen: se koskee juuri niitä askelia, joiden varassa opettaja rakentaa ymmärrystä kuvan ja käsitteen välille.
Mitä tästä seuraa koulujen kannalta? Yksi vastaus on maltti. Jos tekoälyä käytetään arviointiin tai tukeen, sen rajat pitää tuntea ja näyttää oppilaalle. Toinen vastaus on mittaaminen. Tutkijoiden viesti on, että koulukäyttöön tarvitaan nimenomaan opetuksen arjesta nousevia testejä, ei vain yleisiä älykkyyskokeita. Vasta silloin tiedetään, milloin kone on oikeasti hyödyksi – ja milloin se vain kuulostaa vakuuttavalta.
Laajemmin katsottuna havainto herättää vanhan kysymyksen uudella tavalla: jos järjestelmä ei vielä luotettavasti ”näe” sitä, minkä me näemme yhdellä silmäyksellä, mitä sen väitetty ymmärrys oikeastaan on? Kun tekoäly astuu luokkaan, opimme samalla jotakin ihmisestä: siitä, miten paljon ajattelustamme on tilan ja muodon hiljaista hahmottamista. Kuinka sen opettaisi koneelle – ja pitäisikö meidän edes yrittää, ennen kuin tiedämme, missä se on hyvä ja missä ei?
Paper: https://arxiv.org/abs/2602.12196v1
Register: https://www.AiFeta.com
tekoäly koulutus peruskoulu kuvallinen-päättely tutkimus kielimallit