Isot tekoälymallit kätkevät jo valmiiksi tehtäväkohtaisia erikoistaitajia

Isot tekoälymallit kätkevät jo valmiiksi tehtäväkohtaisia erikoistaitajia

Pienet satunnaiset säädöt voivat paljastaa valmiit asiantuntijat suuren mallin sisältä – ja joskus korvata raskaan jälkikoulutuksen.

Vanhaa radiota virittäessä joskus riittää millin käännös nupista, ja rätinä vaihtuu kirkkaaksi puheeksi. Tekoälyn kanssa saatamme olla samankaltaisen ilmiön äärellä: suuret, valmiiksi opetetut mallit saattavat kätkeä sisäänsä joukon erikoistaitajia, jotka löytyvät pienellä horjutuksella.

Vallitseva ajatus on ollut, että esikoulutettu malli on vasta lähtöviiva. Sen jälkeen sitä muokataan pitkään ja järjestelmällisesti – tavallisesti menetelmillä, jotka säätävät mallin sisäisiä numeroita vähitellen parempaan suuntaan tai palkitsevat hyvät vastaukset ja rankaisevat huonoja. Uusi tutkimus ehdottaa toisenlaista näkökulmaa: esikoulutuksen lopputulos ei ole yksi piste vaan kokonainen alue mahdollisia asentoja, ja tämän alueen lähellä on yllättävän paljon tehtäväspesialisteja valmiina odottamassa.

Ajatus kuulostaa yksinkertaiselta: jos suuri malli on oppinut paljon maailmasta, ehkä sen ympärillä on monta lähes yhtä hyvää versiota, joista jokin on juuri tiettyyn tehtävään tavallista parempi. Tuore työ (Yulu Gan ja Phillip Isola) asettaa tämän väitteen koetukselle. Heidän havaintonsa on kaksijakoinen. Pienissä malleissa tällaiset erikoisratkaisut ovat harvinaisia – niitä on ”tilavuudeltaan” niin vähän, ettei niitä löydä arpomalla, vaan tarvitaan kurinalaista hakua. Mutta suurissa, hyvin esikoulutetuissa malleissa tilanne kääntyy: parempia tehtäväkohtaisia asetuksia löytyy tiheästi aivan lähtöpainojen lähistöltä.

Tämän näkökulman innoittamana tutkijat kokeilivat hätkähdyttävän mutkatonta menetelmää mallin parantamiseksi: otetaan suuri määrä pieniä satunnaisia nykäyksiä mallin ”säätöruuveihin”, testataan, mitkä versiot suoriutuvat halutusta tehtävästä parhaiten, valitaan parhaat ja annetaan niiden äänestää vastauksista. Toisin sanoen, ei uudelleenkouluteta yhtä mallia pitkään, vaan kerätään joukko läheisiä versioita ja tehdään niistä komitea.

Arjen esimerkki auttaa hahmottamaan idean. Kuvitellaan, että haluamme asiakaspalvelurobotin vastaavan täsmällisesti tietyntyyppisiin kysymyksiin. Perinteisesti mallia hienosäädetään pitkään nimenomaan tähän käyttöön. Tässä ehdotuksessa tehdään toisin: luodaan monta hyvin pientä muunnelmaa mallista, annetaan niille sama tehtävä, katsotaan mitkä muutamat suoriutuvat parhaiten, ja lopuksi kysytään usealta kerralla – enemmistön vastaus jää voimaan. Jos suuri perusmalli on hyvä, tällaisia pieniä ”asiantuntijamuunnelmia” löytyy sen läheltä paljon, ja ne voi koota yhteen.

Tutkijoiden mukaan tämä äärimmäisen rinnakkainen ja yksinkertainen ”kokeile ja valitse” -lähestymistapa yltää suorituskyvyssä kilpailemaan tunnettujen jatkokoulutusmenetelmien kanssa. Vertailukohtina olivat nykyisin laajasti käytetyt menetelmät, jotka jalostavat mallia vaihe vaiheelta palkitsemisen ja rangaistuksen avulla tai etsivät hyviä ratkaisuja evoluutionkaltaisella haulla. Se, että satunnaisotannalla, seulonnalla ja äänestyksellä voi yltää samoihin suorituksiin suurissa malleissa, haastaa aiemman oletuksen siitä, että parannus syntyy vain kurinalaisen, pitkän hienosäädön kautta.

Mitä tästä pitäisi ajatella? Ensinnäkin, havainto korostaa mittakaavan merkitystä. Kun malli on pieni, hyviä muunnelmia on vähän kuin harvassa metsässä: polulle osuu vain sattumalta. Kun malli on suuri ja esikoulutus on ollut onnistunut, sen ympäristö muistuttaa tiheikköä, jossa erilaisia hyödyllisiä polkuja on joka suunnassa. Toiseksi, tämä muuttaa hieman tapaa ajatella malleista: ne eivät ole yksittäisiä taitoja tiivistäviä pisteitä, vaan tiheitä alueita, joiden sisällä on runsaasti vaihtoehtoja – osa niistä sattuu olemaan tiettyyn tehtävään erinomaisia.

Samalla on syytä varoa ylitulkintaa. Tutkimuksen oma tulkinta on nimenomaan, että lähestymistapa on kilpailukykyinen, ei että se voittaisi kaikki perinteiset menetelmät tai sopisi aina ja kaikkialle. Lisäksi menetelmä tarvitsee tavan mitata, mikä muunnelma on parempi: jos tehtävässä ei ole selkeää oikeaa vastausta tai jos arviointi on hidasta, parhaiden yksilöiden valinta voi olla hankalaa. Äänestäminen taas toimii luontevimmin, kun vaihtoehdot ovat verrattavissa – se ei välttämättä auta avoimissa, luovissa tehtävissä.

On myös käytännön kustannuksia. Vaikka muunnelmien kokeilu on ”täysin rinnakkaista”, se ei ole ilmaista: usean version ylläpito ja vastausten äänestäminen kuluttaa laskentaa myös käyttöhetkellä. Toisissa yhteyksissä yksi huippuun asti hiottu malli voi siis olla yhä edullisempi. Ja koska pienissä malleissa hyviä muunnelmia on niukasti, siellä perinteiset, suunnattua hakua käyttävät menetelmät näyttävät edelleen välttämättömiltä.

Silti viesti on kiinnostava. Jos riittävän suuri ja hyvin esikoulutettu malli kätkee lähelleen monenlaisia valmiita osaajia, tekoälyn käyttö voi jatkossa muistuttaa vähemmän pitkää jälkikoulutusta ja enemmän valikointia ja kokoonpanoa: löydä omasi, kokoa pieneksi tiimiksi ja anna sen päättää. Silloin kysymys ei ole vain siitä, miten koulutamme malleja, vaan myös siitä, miten hyödynnämme niiden ympärille syntyvää ”tiheikköä”.

Entä jos tekoälyn seuraava tehokkuusloikka ei synnykään yhä raskaammista harjoitusleireistä, vaan taidosta etsiä ja yhdistää jo olemassa olevia erikoistaitoja? Jos vastaus on kyllä, se voi muuttaa, miten suunnittelemme järjestelmiä – ja kenellä on varaa käyttää niitä.

Paper: https://arxiv.org/abs/2603.12228v1

Register: https://www.AiFeta.com

tekoäly kielimallit tutkimus koneoppiminen

Read more

Koneiden käyttäytymistä ei tarvitse enää kirjoittaa kaavoiksi käsin

Koneiden käyttäytymistä ei tarvitse enää kirjoittaa kaavoiksi käsin

Kun hissi lähtee liikkeelle, ilmastointi säätää puhallusta tai robotti asettaa ruuvin paikalleen, taustalla on malli siitä, miten kone käyttäytyy. Niitä on perinteisesti rakennettu niin kuin hyviä reseptejä: asiantuntija kerää kokemusta, mittaa, kirjoittaa yhtälöitä ja virittää pitkään. Se vie aikaa – ja jokainen muutos laitteessa tai ympäristössä tarkoittaa uutta työtä. Viime vuosina

By Kari Jaaskelainen
Oppimalla ohjattu vedenalainen robotti löysi telakan – myös oikeassa vedessä

Oppimalla ohjattu vedenalainen robotti löysi telakan – myös oikeassa vedessä

Kun robotti-imuri hivuttautuu kotona lataustelakkaansa, kukaan ei pidä hetkeä ihmeenä. Veden alla sama temppu on kaikkea muuta kuin arkipäivää – näkyvyys on huono, virtaukset nykivät, eikä satelliittipaikannus auta. Silti juuri tähän suuntaan on otettu askel, joka voi venyttää vedenalaisten robottien toimintamatkaa ja -aikaa. Vuosia on ajateltu, että vedenalaisen telakoitumisen kaltaiset tehtävät

By Kari Jaaskelainen
Oppivat liikennevalot voivat lyhentää jonotusaikaa kymmenesosan

Oppivat liikennevalot voivat lyhentää jonotusaikaa kymmenesosan

Kaikki tietävät hetken, kun seisot punaisissa valoissa keskellä yötä, eikä mihinkään suuntaan näy autoja. Tai aamun, jolloin tavallinen risteys puuroutuu yllättäen, koska osa kuljettajista päättääkin kääntyä eri suuntaan kuin yleensä. Liikennevalot ovat sääntöjen koneita, mutta liikenne elää kuin säätila. Pitkään ratkaisuksi on ehdotettu ”älykkäitä” valoja, jotka oppivat liikenteestä ja säätävät

By Kari Jaaskelainen