Kaavoja keksivä tekoäly voidaan opettaa noudattamaan luonnon realiteetteja

Share
Kaavoja keksivä tekoäly voidaan opettaa noudattamaan luonnon realiteetteja

Kun yhtälöt oppivat sanomaan ei mahdottomalle, niistä tulee hyödyllisempiä – ja turvallisempia käyttää.

Moni on kokeillut taulukkolaskimessa trendiviivaa: valitset pisteet ja annat ohjelman piirtää kaaren, joka mukailee havaintoja. Usein viiva näyttää istuvan kauniisti – kunnes viet katseen hiukan datan ulkopuolelle. Yhtäkkiä se ennustaa miinusmerkkisiä etäisyyksiä tai lämpötiloja alle absoluuttisen nollapisteen. Viiva sopii menneeseen, mutta rikkoo todellisuuden rajoja.

Sama vaiva piinaa myös kunnianhimoisempia työkaluja, jotka yrittävät löytää datasta yksinkertaisia, ihmisen luettavia laskukaavoja. Tätä kutsutaan symboliseksi regressioksi: kone etsii palasista – plus- ja kertomerkeistä, juurista ja eksponenteista – kaavan, joka selittää mittaustulokset. Perinteinen tapa arvioida ehdokkaita on katsoa, mikä kaava osuu havaintoihin mahdollisimman tarkasti.

Mutta pelkkä osumatarkkuus on huono kompassi. Se houkuttelee niin sanottuun näennäiskaavaloukkuun: kaava näyttää tilastollisesti hyvältä, mutta on ristiriidassa perusfysiikan tai muun perustiedon kanssa. Arxiviin äsken ilmestynyt tutkimus ehdottaa, että tästä päästään eroon vain muuttamalla sitä, miten kaavoja etsitään. Yhtälöitä ei pidä etsiä tyhjiössä, vaan niiden vierelle pitää asettaa kiskot: sääntöjä, joita kaavat eivät saa rikkoa.

Työssä esitellään menetelmä, joka ohjaa kaavanetsintää tutkijan antamilla ennakkoehdoilla. Ajatus on yksinkertainen, mutta vaikutus on iso. Sen sijaan, että kone arvioisi vain, kuinka hyvin kaava istuu dataan, se myös tarkistaa, täyttääkö kaava ennalta kirjoitetut rajoitteet. Nämä voivat olla yleisiä periaatteita – ettei tulos voi olla fyysisesti mahdoton – tai yksinkertaisia suunnan sääntöjä, kuten että suure A kasvaa, kun suure B kasvaa.

Yksi konkreettinen esimerkki: jos tutkija tietää, että tietyssä ilmiössä mallin antaman arvon ei kuulu mennä negatiiviseksi, hän voi kirjata sen säännöksi. Tämän jälkeen algoritmi hylkää jo varhaisessa vaiheessa kaavat, jotka antaisivat miinusmerkkisiä tuloksia, vaikka ne muuten sopisivat dataan erinomaisesti. Lopputulos on vähemmän näyttävä käyrä – mutta enemmän totta.

Uuden lähestymistavan ydin on kolmivaiheinen prosessi. Ensin kone ”lämmittää” hakuansa tutustumalla dataan ja kartuttamalla hyviä rakennuspalikoita. Sen jälkeen se kehittää kaavaehdokkaita pisteittäen ne sekä sopivuuden että sääntöjen noudattamisen perusteella. Tämän vaiheen juju on, että sääntöjen painoarvoa kiristetään vähitellen: alkuvaiheessa annetaan tilaa luovuudelle, myöhemmin varmistetaan, etteivät lupaavat ideat riko perusraameja. Lopuksi lupaavimpia kaavoja hiotaan pienin korjauksin. Kirjoittajat kutsuvat ohjausta asteittain tiukkenevaksi sääntöarvioinniksi – termi on tekninen, mutta käytännössä kyse on nupin kiertämisestä: ensin kokeillaan, sitten kurinalaistetaan.

Tutkijat väittävät myös matemaattisesti perustellen, että tällainen ohjattu haku ei ainoastaan näytä järkevämmältä, vaan yleistää paremmin. Kun kiellettyjen kaavojen joukkoa kasvatetaan – siis kun sääntöjä on enemmän tai ne ovat tarkempia – mahdollisten vaihtoehtojen määrä pienenee. Se vähentää kiusausta löytää sattumalta dataan sopivia, mutta todellisuudessa väärään suuntaan vieviä muotoja. Yksinkertaistettuna: mitä vähemmän mielivaltaisia reittejä koneella on, sitä todennäköisemmin se päätyy reitille, joka pitää myös uusissa olosuhteissa.

Entä todisteet? Uusi menetelmä testattiin useilla eri aloilla. Tutkimuksen mukaan se voitti nykyiset kilpailijat kautta linjan ja pysyi toimintakykyisenä myös silloin, kun data oli meluista tai sitä oli vähän – olosuhteet, joissa näennäiskaavat yleensä juhlivat. Lisäksi ohjaus sieti sen, että ennakkoehdot eivät olleet täydellisiä: vaikka säännöt olivat karkeita tai osin virheellisiä, menetelmä pysyi kurssissa paremmin kuin vaihtoehdot, jotka eivät käyttäneet sääntöjä lainkaan.

Tämä kaikki kuulostaa järkevältä – ja on pitkälti tervetullut muistutus vanhasta opista: data ei yksin riitä. Silti kuvaan liittyy varjopuolia. Ensinnäkin menetelmä nojaa siihen, että joku osaa kirjoittaa säännöt koneen ymmärtämään muotoon. Se on oma taitonsa, eikä kaikilla tieteenaloilla ole selkeitä, yksiselitteisiä peruslakeja, jotka voisi näppärästi muotoilla ehdoiksi. Toiseksi ”tieteellinen johdonmukaisuus” riippuu joskus ajankohdasta ja koulukunnasta. Liian tiukat säännöt voivat myös lukita katseen vanhoihin totuuksiin ja tukkia tien oudoilta, mutta oikeilta löydöiltä.

Kolmanneksi, vaikka tutkimus raportoi hyviä tuloksia monissa olosuhteissa, sekin on lopulta joukko testejä rajatuissa ympäristöissä. Emme tiedä vielä, miten hyvin menetelmä toimii arvaamattomammissa tilanteissa, joissa mittausvirheet, harhat tai puuttuvat muuttujat sotkevat kuvaa tavoilla, joita säännöillä on vaikea ennakoida. Kirjoittajat korostavat kestävyyttä melua ja niukkuutta vastaan, mutta käytäntö on armoton tuomari.

Silti suunta on selvä. Kun tekoälyltä pyydetään kaavoja, meidän pitäisi pyytää niiltä myös luonnetta: kykyä sanoa ei mahdottomalle. Jos kone oppii yhdistämään tilastollisen istuvuuden ja perussäännöt, sen ehdotukset voivat olla paitsi tarkkoja, myös käyttökelpoisia. Ne auttavat tutkijaa näkemään metsän puilta ja säästävät aikaa, joka muuten kuluisi näennäiskaavojen perkaamiseen.

Laajempi kysymys kuuluu: jos pystymme ohjaamaan koneita karsimaan epäuskottavat selitykset, voisimmeko opettaa ne myös ehdottamaan lupaavia kysymyksiä – sellaista uteliaisuutta, joka ei vain sovi dataan, vaan avaa uuden oven todellisuuteen?

Paper: https://arxiv.org/abs/2602.13021v1

Register: https://www.AiFeta.com

tekoäly tiede data yhtälöt tutkimus

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä,

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen