Aivojen vasen puoli peilaa kielimallia vasta, kun malli oppii kieliopin

Aivojen vasen puoli peilaa kielimallia vasta, kun malli oppii kieliopin

Vasen–oikea-ero näyttää liittyvän nimenomaan kielioppiin, ei laskemiseen tai maailmantietoon.

Kokeile lukea ääneen lause: “Me menee kauppaan.” Heti jokin töksähtää. Emme tarvitse kieliopin sääntökirjaa tietääksemme, että jokin on pielessä. Jo pitkään on tiedetty, että ihmisen aivoissa etenkin vasen puoli on erikoistunut kieleen. Mutta mitä täsmälleen vasen puoli tekee – ja löytävätkö siihen koulutetut tekoälymallit siitä vastineen?

Viime vuosina on havaittu yllättävä yhteys: kun ihmiset ja suuret kielimallit käsittelevät samaa tekstiä, mallien sisäiset tilat ennustavat hämmästyttävän hyvin ihmisen aivojen toimintaa, kun sitä mitataan aivokuvantamisella. Yhteys ei kuitenkaan ole tasainen. Ennuste osuu useammin oikeaan vasemmalla puolella aivoja kuin oikealla – ja tämä ero kasvaa, mitä pidemmälle malli on koulutettu.

Mistä vasen–oikea-ero syntyy? Helppo arvaus olisi, että mitä “älykkäämpi” malli, sitä enemmän se muistuttaa aivoja kaikkine taitoineen: maailmantieto, päättely, matematiikka. Uusi analyysi ehdottaa toista tulkintaa: ratkaisevaa on ennen kaikkea kielen muoto – kieliopillisten kuvioiden hallinta – ei laskutehtävät eikä tietovisat.

Tutkijat seurasivat, miten yhden tunnetun kielimallin, OLMo-2:n, sisäinen kielitaito kehittyi koulutuksen eri vaiheissa. Samalla he mittasivat, kuinka hyvin kyseisen vaiheen malli auttoi ennustamaan aivokuvista, mitä tekstiä englanninkieliset osallistujat lukivat. Havainto oli johdonmukainen: mitä paremmaksi malli tuli nimenomaan muodollisissa kielitaidoissa, sitä selvemmäksi sen ja ihmisaivojen vastaavuus kasvoi vasemmassa aivopuoliskossa. Vastaavuus ei parantunut samaa tahtia oikealla puolella.

Mitä “muodollinen kielitaito” tarkoittaa? Kaksi arkista tapaa hahmottaa sitä riittää. Ensimmäinen on kyky erottaa hyvä lause huonosta silloin, kun merkitys lähes säilyy samana mutta kielioppi horjahtaa. Esimerkiksi “Koira, joka jahtasi kissaa, juoksi” on sujuva; “Koira, joka jahtasi kissaa, juoksivat” särähtää, koska verbi ei sovi yhteen subjektin kanssa. Kun malli oppii asettamaan todennäköisemmäksi tuollaiset sujuvat versiot kuin rikkonaiset parinsa, sen yhteys vasemman aivopuolen toimintaan vahvistuu.

Toinen tapa on tuottaminen: pystyykö malli laatimaan kokonaisia, hyvin muotoutuneita kappaleita, joissa lauseet rakentuvat oikein? Kun tämä onnistuu, vasemman puolen ennustettavuus kohenee. Sitä vastoin mallitaitojen kasvu sellaisissa tehtävissä kuin päässälasku tai sulkujen seuraaminen (tehtävissä, joissa pitää avata ja sulkea sulkuja oikeassa järjestyksessä) ei kulje käsi kädessä vasemman puolen edun kanssa. Sama pätee teksteihin, joissa tarvitaan maailmantietoa tai monen askeleen päättelyä: niissä paremmat pisteet eivät selitä vasemman ja oikean eroa.

Jotta tulos ei olisi vain yhden malliperheen oikku, tutkijat toistivat analyysinsä toisella mallisarjalla, Pythialla, ja tarkastelivat lisäksi ranskaa. Kuva säilyi: vasemman puolen etumatka mallien ennustettavuudessa kasvaa samaan aikaan, kun malli oppii kielen rakenteellisia kuvioita – kielioppia – myös toisessa kielessä.

Näin piirtyy jännite sen välille, mitä moni ehkä ajatteli ja mitä tulokset nyt vihjaavat. Aiemmin vaikutti uskottavalta, että vasemman puolen etu liittyisi mallien “yleisälykkyyteen”: mitä enemmän faktoja, logiikkaa ja laskua, sitä ihmismäisempi ajattelu. Nyt näyttää siltä, että vasen puoli on herkkä ennen kaikkea kielen muodolle. Kun malli oppii, miten sanat taipuvat ja liittyvät toisiinsa, sen sisäinen kartta alkaa muistuttaa vasemman aivopuoliskon kielenkäsittelyä – ja juuri silloin yhteensopivuus vahvistuu.

On kuitenkin syytä olla varovainen tulkinnoissa. Ensinnäkin yhteys on korrelaatio, ei todiste syystä ja seurauksesta. Se, että mallin kielioppi ja vasemman puolen ennustettavuus kehittyvät rinnakkain, ei vielä kerro, miksi näin käy. Toiseksi mittaus perustuu toiminnalliseen magneettikuvaukseen, joka näkee aivojen toiminnan “sumuisesti” ajassa: se kertoo, missä tapahtuu, mutta ei hienoaikaisia yksityiskohtia. Kolmanneksi muodollinen kielitaito mitattiin käytännöllisillä sijaismittareilla, kuten lauseparien sujuvuusvertailulla ja tekstin tuottamisen luontevuudella. Ne ovat järkeviä, mutta eivät kata kaikkea, mitä kieleen kuuluu.

Lisäksi ihmisten välillä on vaihtelua. Kaikilla kieli ei ole yhtä vahvasti vasemmalla, ja oikea aivopuolisko osallistuu kielen sävyihin – esimerkiksi sävelkulkuun ja kontekstiin – tavoilla, joita tässä ei ehkä tavoiteta. Eikä ole varmaa, että kaikki kielet käyttäytyvät samalla tavalla, vaikka ranskakin antoi samansuuntaisen kuvan.

Silti johtopäätös on kiinnostava: kun kielimalli oppii kielen rakenteen, siitä tulee parempi “ikkuna” vasempaan aivopuoliskoon. Tämä voi auttaa sekä tekoälytutkimusta että neurotiedettä. Kielimalleille se vihjaa, että pelkkä faktatiedon ja päättelyn hiominen ei yksinään tee niistä aivojen kaltaisia; kieliopin syvä hallinta on oma, ratkaiseva kehityspolkunsa. Aivotutkimukselle se tarjoaa työkalun kokeellisiin kysymyksiin: mitä aivopuoliskot tarkalleen ottaen edustavat, ja missä vaiheessa lapsen kielenoppimista vastaava “vasen etu” syntyy?

Yksi kysymys jää leijumaan: jos vasen puoli avautuu mallille kielen muodon kautta, millaisen mallin – ja millaisen kielen – kautta oikea puoli alkaisi näyttäytyä paremmin? Vastaus voi kertoa jotain olennaista siitä, mikä tekee kielestä muutakin kuin sääntöjä.

Paper: https://arxiv.org/abs/2602.12811v1

Register: https://www.AiFeta.com

tekoäly kieli aivot neurotiede fMRI tutkimus

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen