Robotti voi oppia yhdestä esimerkistä – kun kokeilunhalulle asetetaan katto

Robotti voi oppia yhdestä esimerkistä – kun kokeilunhalulle asetetaan katto

Uusi menetelmä vähentää turhaa hapuilua ja rauhoittaa oppimisen heilahteluja, jolloin robotit voivat oppia tehtäviä kamerakuvista ja harvoista onnistumisista ilman valtavia datavarastoja.

Kuvittele kotirobotti, joka opetetaan avaamaan keittiönlaatikko. Jos se joutuu yrittämään satoja kertoja ennen kuin oppii oikean otteen ja liikesarjan, jokainen yritys on aikaa, rahaa ja mahdollisesti särkyneitä kahvikuppeja. Moni tekoälymenetelmä tarvitsee juuri tätä: valtavan määrän toistoja ja silti epävakaata etenemistä. Siksi robotit oppivat usein laboratorioissa, eivät olohuoneissa.

Yleinen ajatus on ollut, että koneoppiva robotti tarvitsee joko paljon valmista harjoitusaineistoa tai runsaasti ihmisen apua. Yksi suunta kerää isoja tietokokonaisuuksia ensin ja siirtää robottia sitten vähitellen todelliseen ympäristöön – mutta vaiheiden yhdistäminen on hermostunutta, ja tilastot voivat sakata. Toinen suunta nojaa jättimäisiin etukäteen opetettuihin malleihin, jotka auttavat oppimista, mutta niiden kouluttaminen ja hienosäätö ovat kalliita ja raskaita.

ArXivissa julkaistussa työssä Xiefeng Wu, Mingyu Hu ja Shu Zhang ehdottavat jalat maassa olevaa vaihtoehtoa. He kutsuvat menetelmäänsä SigEnt-SAC:ksi, mutta nimen voi unohtaa. Olennainen ajatus on yhteen arkiseen sanaan tiivistettävissä: kohtuus. Robotti saa edelleen kokeilla ja ottaa pieniä riskejä – sillä ilman kokeilua ei synny uutta – mutta sen varaan rakentuva innostus satunnaisiin kokeiluihin pannaan pehmeästi ylärajaan. Näin vältetään se, että oppiminen alkaa suosia täysin vieraita, ympäristöön sopimattomia liikkeitä vain siksi, että ne ovat erilaisia.

Käytännössä monet nykyiset menetelmät palkitsevat robottia jonkin verran “epävarmuudesta”, jotta se uskaltaa etsiä parempia ratkaisuja. Jos tämä palkinto kasvaa väärällä tavalla, oppiminen ajautuu kohti liiallista sähläystä. Tutkijoiden ratkaisu on säätää tätä palkintoa niin, että se kasvaa aluksi, kun kokeiluista on hyötyä, mutta lakkaa houkuttelemasta kohti ääripäitä. Samalla menetelmä hillitsee toista tuttua vaivaa: kun robotti arvioi, mikä teko on hyvä, arviot eivät enää poukkoile niin rajusti yrittämisestä toiseen.

Yksi esimerkki auttaa hahmottamaan idean. Ajatellaan, että robotille näytetään kerran, miten laatikko avataan. Tämän jälkeen robotti saa vain niukan palautteen: “onnistui” tai “ei onnistunut”. Kamera tarjoaa maailman sellaisena kuin se on – välillä tärähtäneenä ja varjojen sotkemana. Ilman varovaista kokeilunhalua robotti saattaa jäädä jumiin ensimmäisen yrityksen tapaan. Ilman rajoja se taas alkaa koetella kaikkea mahdollista: nykii kahvaa oudosta kulmasta, työntää ovea, yrittää kelvottomia otteita. Uudessa lähestymistavassa satunnaisuutta käytetään kuin suolaa: tarpeeksi, että maku herää, muttei niin paljon, että koko ruoka peittyy.

Tutkimus ei jää pelkkien kauniiden periaatteiden varaan. Tekijät kokeilivat menetelmäänsä ensin joukossa vakiintuneita simulaatiotehtäviä, joita ala käyttää vertailukohtina. Näissä koeajoissa uusi tapa vähensi oppimisen poukkoilua ja saavutti täyden onnistumisprosentin nopeammin kuin edustavat aiemmat menetelmät. Sen jälkeen he veivät idean oikeisiin robotteihin: neljässä erilaisessa tehtävässä, useilla robottityypeillä, kone oppi suoraan kamerakuvista ja niukoista palkkioista, eikä yrityksiä tarvittu suuria määriä. Tulokset viittaavat siihen, että tämä voi olla halvempi, käytännöllinen reitti robottien todellisen maailman oppimiseen.

Miksi tämä on kiinnostavaa? Koska oikeassa elämässä jokainen yritys maksaa. Simulaatioiden ja datan kerääminen on hidas, kallis urakka. Menetelmä, joka pärjää yhdellä asiantuntijan esimerkkisuorituksella ja selviää vähäisin yrityksin, madaltaa kynnystä ottaa oppivat robotit osaksi arkea: varastoissa, keittiöissä, kenties hoivakodeissa. Jos oppiminen ei enää vaadi tuhansia toistoja, pienetkin toimijat voivat kokeilla, mitä automaatio heille mahdollistaa.

On silti syytä pitää pää kylmänä. Ensinnäkin, “yksi esimerkki” ei ole taikasauva. Jos tuo esimerkki on huono tai poikkeava, robotti voi oppia harhapolun. Toiseksi, neljä onnistunutta tehtävää on vasta alku: emme vielä tiedä, miten laajalle menetelmä ulottuu, milloin se kompastuu ja millaista hienosäätöä se vaatii eri ympäristöissä. Kolmanneksi, vaikka yrityksiä tarvittaisiin vain vähän, ne ovat silti oikeita yrityksiä oikeassa maailmassa – turvallisuus, vahinkojen välttäminen ja vastuukysymykset eivät katoa. Ja vaikka arviot robottien teoista poukkoilevat vähemmän, ne eivät muutu kiveen hakatuiksi totuuksiksi.

On myös hyvä muistaa, että vertailut tehtiin tietyissä simulaatioissa ja valikoiduissa robottitehtävissä. “Nopeampi” ja “pienempi määrä yrityksiä” riippuvat tehtävästä. Tulokset antavat vahvan vihjeen menetelmän toimivuudesta, mutta eivät kerro kaikkea sen rajoista.

Silti suunta on selvä. Kun kokeilunhalua oppii säätelemään, robotti ei tarvitse loputonta kärsivällisyyttä – eikä meidän tarvitse varata sille loputonta aikaa. Jos oppivat järjestelmät voidaan opettaa onnistumaan harvoilla, huolellisilla yrityksillä, mitä uusia tehtäviä uskallamme antaa niille? Ja kenen kädessä on lopulta se säätönuppi, joka päättää, kuinka rohkea robotti saa olla?

Paper: https://arxiv.org/abs/2601.15761v1

Register: https://www.AiFeta.com

robotiikka tekoäly koneoppiminen tutkimus arxiv

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen