tekoäly

Tekoäly oppii parantelemaan taulukon sarakkeita – ja ennusteet tarkentuvat

Moni data-analyysi alkaa arkisesti taulukosta. Sarakkeissa ovat ikä, tulot, päivämäärä, osoite; riveillä asiakkaat, asunnot tai mittaukset. Silti ennusteet harvoin syntyvät näistä sarakkeista sellaisinaan. Ihminen keksii väliin uuden sarakkeen – iän syntymäajasta, viikonpäivän päiväyksestä, tulojen ja menojen suhteen – ja ennuste paranee. Tätä käsityötä kutsutaan ominaisuuksien suunnitteluksi, ja se on ollut vuosia koneoppimisen hiljainen kynnyskivi.

Perinteinen ajatus on ollut, että juuri tämä on ihmisen tonttia: kone oppii, mutta ihminen päättää, mitä siltä kysytään. Uusi tutkimus ehdottaa toista. Sen mukaan suuri kielimalli – samantyyppinen kuin nykyiset keskustelemaan kykenevät tekoälyt – voi itse keksiä, testata ja karsia näitä lisäsarakkeita ja vielä tehdä sen järjestelmällisesti.

Tutkijat esittelevät FAMOSE-nimisen toimintatavan, jossa kielimalli toimii kuin kärsivällinen analyytikko. Se etenee vuorossa kahdella tavalla: miettii ääneen, mitä seuraavaksi kannattaa kokeilla, ja tekee sitten pienen kokeen. Tätä vuorottelua (kirjoittajat kutsuvat sitä ReAct-menetelmäksi) toistetaan: malli ehdottaa uuden sarakkeen olemassa olevista – esimerkiksi erotuksen, suhdeluvun tai luokituksen – arvioi, auttoiko se ennustetta, kirjaa muistiin, mikä toimi ja mikä ei, ja yrittää uudelleen. Samalla se käyttää valmiita työkaluja sarakkeiden valintaan ja tulosten arviointiin. Lopputulos on paranneltu aineisto, jossa on vain hyödyllisiksi osoittautuneita lisäsarakkeita.

Miksi tämä olisi tärkeää? Taulukkomuotoisen datan parissa juuri uudet, fiksut muuttujat ratkaisevat usein, saako malli kiinni olennaisista ilmiöistä. Konkreettinen, mutta matemaattisesti simppeli esimerkki: jos halutaan ennustaa, pysyykö asiakas palvelussa, pelkkä käyttökertojen määrä ja kuukausimaksu voivat olla vähemmän paljastavia kuin niiden suhde – kuinka paljon asiakas saa eurolla. FAMOSE pyrkii keksimään tällaisia yhdistelmiä ja testaamaan ne yksi kerrallaan.

Tutkimus ei nojaudu näyttäviin temppuihin vaan siihen, että pienet parannukset kasautuvat. Kirjoittajien mukaan menetelmä yltää luokittelutehtävissä (joissa päätetään esimerkiksi ”kyllä/ei”) parhaiden joukkoon, etenkin kun aineisto on suuri: yli 10 000 rivin aineistoissa keskimääräinen parannus oli 0,23 prosenttiyksikköä mittarissa, joka kertoo, kuinka hyvin malli tunnistaa oikeat tapaukset vääristä. Regressiotehtävissä (joissa ennustetaan numeerista arvoa, kuten hinta tai kulutus) FAMOSE oli keskimäärin paras: ennusteiden keskivirhe pieneni 2,0 prosenttia. Lisäksi menetelmä osoittautui muita menetelmiä vakaammaksi virhetilanteissa.

Luvut ovat pieniä, mutta eivät välttämättä mitättömiä. Kun malli seuloo satoja tuhansia asiakastapauksia, kymmenesosien parannukset voivat tarkoittaa, että väärinluokiteltuja tapauksia on tuhansia vähemmän. Regressiossa 2 prosentin pienempi virhe voi näkyä tarkempina kysyntäarvioina tai parempina kustannusennusteina.

Mistä parannus syntyy? Kirjoittajat esittävät hypoteesin: koska malli kirjaa omat yrityksensä ja havaintonsa ”kontekstiinsa”, se ikään kuin opastaa itseään parempiin ideoihin – vähän kuin jos aiemmat esimerkit toimisivat muistilappuina. Tämä saattaisi selittää, miksi malli ei vain toista samoja kaavoja, vaan osaa keksiä uusia, hyödyllisiä yhdistelmiä olemassa olevista sarakkeista.

On myös syytä olla realisti. Tulokset eivät kerro, että kone syrjäyttäisi ihmisen kekseliäänä datan muokkaajana. Luokittelussa parannukset olivat keskimäärin niukkoja, ja ”huipputaso” tarkoittaa osin sitä, että menetelmä on muiden parhaiden veroinen, ei kaikkialla ylivoimainen. Lisäksi selitys siitä, miksi menetelmä toimii, on toistaiseksi tutkijoiden perusteltu arvaus, ei todistettu mekanismi. Menetelmä on tekijöiden mukaan ensimmäinen laatuaan juuri tällaisessa käytössä, mutta kenttä kehittyy nopeasti – vertailukohtia syntyy lisää.

Käytännön rajoista tutkimus antaa rivien välissä viitteitä. Menetelmä hyötyy erityisesti suurista aineistoista, mikä on loogista: mitä enemmän tapauksia, sitä paremmin pienetkin parannukset piirteissä näkyvät ennusteissa. Samalla se on rakennettu kielimallin varaan; jos malli olisi heikko tai sen ”muisti” lyhyt, järjestelmällinen kokeilu voisi ontua. Tutkimuksessa FAMOSE kuitenkin pärjäsi keskimäärin vakaammin virheiden keskellä kuin kilpailijat.

Silti oivallus on kiinnostava: jos tekoäly voi hoitaa osan juuri siitä luovasta, iteratiivisesta työstä, jota data-analyytikot ovat tehneet käsin, heidän roolinsa voi siirtyä kysymysten asettamiseen ja tulosten kohtuullistamiseen. Osaava ihminen keksii yhä relevantit ongelmat ja tietää, miltä järkevä vastaus näyttää. Kone voi auttaa löytämään siihen vievän oikopolun taulukon sisällä.

Laajempi kysymys kuuluu: jos kielimalliin pohjautuva, itseään kirjaava menetelmä parantaa ennusteita numeroaineistoissa, voisiko sama ajatus – päättelyn ja pienten kokeiden vuorottelu – auttaa myös muissa ongelmissa, joissa ratkaisu löytyy monesta pienestä oivalluksesta? Vastaus ei vielä ole varma, mutta suunta on selvä: taulukon sarakkeet ovat vasta alku.

Paper: https://arxiv.org/abs/2602.17641v1

Register: https://www.AiFeta.com

tekoäly koneoppiminen data tutkimus arXiv

Tekoäly oppii parantelemaan taulukon sarakkeita – ja ennusteet tarkentuvat

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla