Tekoäly oppii parantelemaan taulukon sarakkeita – ja ennusteet tarkentuvat

Share
Tekoäly oppii parantelemaan taulukon sarakkeita – ja ennusteet tarkentuvat

Moni data-analyysi alkaa arkisesti taulukosta. Sarakkeissa ovat ikä, tulot, päivämäärä, osoite; riveillä asiakkaat, asunnot tai mittaukset. Silti ennusteet harvoin syntyvät näistä sarakkeista sellaisinaan. Ihminen keksii väliin uuden sarakkeen – iän syntymäajasta, viikonpäivän päiväyksestä, tulojen ja menojen suhteen – ja ennuste paranee. Tätä käsityötä kutsutaan ominaisuuksien suunnitteluksi, ja se on ollut vuosia koneoppimisen hiljainen kynnyskivi.

Perinteinen ajatus on ollut, että juuri tämä on ihmisen tonttia: kone oppii, mutta ihminen päättää, mitä siltä kysytään. Uusi tutkimus ehdottaa toista. Sen mukaan suuri kielimalli – samantyyppinen kuin nykyiset keskustelemaan kykenevät tekoälyt – voi itse keksiä, testata ja karsia näitä lisäsarakkeita ja vielä tehdä sen järjestelmällisesti.

Tutkijat esittelevät FAMOSE-nimisen toimintatavan, jossa kielimalli toimii kuin kärsivällinen analyytikko. Se etenee vuorossa kahdella tavalla: miettii ääneen, mitä seuraavaksi kannattaa kokeilla, ja tekee sitten pienen kokeen. Tätä vuorottelua (kirjoittajat kutsuvat sitä ReAct-menetelmäksi) toistetaan: malli ehdottaa uuden sarakkeen olemassa olevista – esimerkiksi erotuksen, suhdeluvun tai luokituksen – arvioi, auttoiko se ennustetta, kirjaa muistiin, mikä toimi ja mikä ei, ja yrittää uudelleen. Samalla se käyttää valmiita työkaluja sarakkeiden valintaan ja tulosten arviointiin. Lopputulos on paranneltu aineisto, jossa on vain hyödyllisiksi osoittautuneita lisäsarakkeita.

Miksi tämä olisi tärkeää? Taulukkomuotoisen datan parissa juuri uudet, fiksut muuttujat ratkaisevat usein, saako malli kiinni olennaisista ilmiöistä. Konkreettinen, mutta matemaattisesti simppeli esimerkki: jos halutaan ennustaa, pysyykö asiakas palvelussa, pelkkä käyttökertojen määrä ja kuukausimaksu voivat olla vähemmän paljastavia kuin niiden suhde – kuinka paljon asiakas saa eurolla. FAMOSE pyrkii keksimään tällaisia yhdistelmiä ja testaamaan ne yksi kerrallaan.

Tutkimus ei nojaudu näyttäviin temppuihin vaan siihen, että pienet parannukset kasautuvat. Kirjoittajien mukaan menetelmä yltää luokittelutehtävissä (joissa päätetään esimerkiksi ”kyllä/ei”) parhaiden joukkoon, etenkin kun aineisto on suuri: yli 10 000 rivin aineistoissa keskimääräinen parannus oli 0,23 prosenttiyksikköä mittarissa, joka kertoo, kuinka hyvin malli tunnistaa oikeat tapaukset vääristä. Regressiotehtävissä (joissa ennustetaan numeerista arvoa, kuten hinta tai kulutus) FAMOSE oli keskimäärin paras: ennusteiden keskivirhe pieneni 2,0 prosenttia. Lisäksi menetelmä osoittautui muita menetelmiä vakaammaksi virhetilanteissa.

Luvut ovat pieniä, mutta eivät välttämättä mitättömiä. Kun malli seuloo satoja tuhansia asiakastapauksia, kymmenesosien parannukset voivat tarkoittaa, että väärinluokiteltuja tapauksia on tuhansia vähemmän. Regressiossa 2 prosentin pienempi virhe voi näkyä tarkempina kysyntäarvioina tai parempina kustannusennusteina.

Mistä parannus syntyy? Kirjoittajat esittävät hypoteesin: koska malli kirjaa omat yrityksensä ja havaintonsa ”kontekstiinsa”, se ikään kuin opastaa itseään parempiin ideoihin – vähän kuin jos aiemmat esimerkit toimisivat muistilappuina. Tämä saattaisi selittää, miksi malli ei vain toista samoja kaavoja, vaan osaa keksiä uusia, hyödyllisiä yhdistelmiä olemassa olevista sarakkeista.

On myös syytä olla realisti. Tulokset eivät kerro, että kone syrjäyttäisi ihmisen kekseliäänä datan muokkaajana. Luokittelussa parannukset olivat keskimäärin niukkoja, ja ”huipputaso” tarkoittaa osin sitä, että menetelmä on muiden parhaiden veroinen, ei kaikkialla ylivoimainen. Lisäksi selitys siitä, miksi menetelmä toimii, on toistaiseksi tutkijoiden perusteltu arvaus, ei todistettu mekanismi. Menetelmä on tekijöiden mukaan ensimmäinen laatuaan juuri tällaisessa käytössä, mutta kenttä kehittyy nopeasti – vertailukohtia syntyy lisää.

Käytännön rajoista tutkimus antaa rivien välissä viitteitä. Menetelmä hyötyy erityisesti suurista aineistoista, mikä on loogista: mitä enemmän tapauksia, sitä paremmin pienetkin parannukset piirteissä näkyvät ennusteissa. Samalla se on rakennettu kielimallin varaan; jos malli olisi heikko tai sen ”muisti” lyhyt, järjestelmällinen kokeilu voisi ontua. Tutkimuksessa FAMOSE kuitenkin pärjäsi keskimäärin vakaammin virheiden keskellä kuin kilpailijat.

Silti oivallus on kiinnostava: jos tekoäly voi hoitaa osan juuri siitä luovasta, iteratiivisesta työstä, jota data-analyytikot ovat tehneet käsin, heidän roolinsa voi siirtyä kysymysten asettamiseen ja tulosten kohtuullistamiseen. Osaava ihminen keksii yhä relevantit ongelmat ja tietää, miltä järkevä vastaus näyttää. Kone voi auttaa löytämään siihen vievän oikopolun taulukon sisällä.

Laajempi kysymys kuuluu: jos kielimalliin pohjautuva, itseään kirjaava menetelmä parantaa ennusteita numeroaineistoissa, voisiko sama ajatus – päättelyn ja pienten kokeiden vuorottelu – auttaa myös muissa ongelmissa, joissa ratkaisu löytyy monesta pienestä oivalluksesta? Vastaus ei vielä ole varma, mutta suunta on selvä: taulukon sarakkeet ovat vasta alku.

Paper: https://arxiv.org/abs/2602.17641v1

Register: https://www.AiFeta.com

tekoäly koneoppiminen data tutkimus arXiv

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä,

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen