Kaavoja keksivä tekoäly voidaan opettaa noudattamaan luonnon realiteetteja
Kun yhtälöt oppivat sanomaan ei mahdottomalle, niistä tulee hyödyllisempiä – ja turvallisempia käyttää.
Moni on kokeillut taulukkolaskimessa trendiviivaa: valitset pisteet ja annat ohjelman piirtää kaaren, joka mukailee havaintoja. Usein viiva näyttää istuvan kauniisti – kunnes viet katseen hiukan datan ulkopuolelle. Yhtäkkiä se ennustaa miinusmerkkisiä etäisyyksiä tai lämpötiloja alle absoluuttisen nollapisteen. Viiva sopii menneeseen, mutta rikkoo todellisuuden rajoja.
Sama vaiva piinaa myös kunnianhimoisempia työkaluja, jotka yrittävät löytää datasta yksinkertaisia, ihmisen luettavia laskukaavoja. Tätä kutsutaan symboliseksi regressioksi: kone etsii palasista – plus- ja kertomerkeistä, juurista ja eksponenteista – kaavan, joka selittää mittaustulokset. Perinteinen tapa arvioida ehdokkaita on katsoa, mikä kaava osuu havaintoihin mahdollisimman tarkasti.
Mutta pelkkä osumatarkkuus on huono kompassi. Se houkuttelee niin sanottuun näennäiskaavaloukkuun: kaava näyttää tilastollisesti hyvältä, mutta on ristiriidassa perusfysiikan tai muun perustiedon kanssa. Arxiviin äsken ilmestynyt tutkimus ehdottaa, että tästä päästään eroon vain muuttamalla sitä, miten kaavoja etsitään. Yhtälöitä ei pidä etsiä tyhjiössä, vaan niiden vierelle pitää asettaa kiskot: sääntöjä, joita kaavat eivät saa rikkoa.
Työssä esitellään menetelmä, joka ohjaa kaavanetsintää tutkijan antamilla ennakkoehdoilla. Ajatus on yksinkertainen, mutta vaikutus on iso. Sen sijaan, että kone arvioisi vain, kuinka hyvin kaava istuu dataan, se myös tarkistaa, täyttääkö kaava ennalta kirjoitetut rajoitteet. Nämä voivat olla yleisiä periaatteita – ettei tulos voi olla fyysisesti mahdoton – tai yksinkertaisia suunnan sääntöjä, kuten että suure A kasvaa, kun suure B kasvaa.
Yksi konkreettinen esimerkki: jos tutkija tietää, että tietyssä ilmiössä mallin antaman arvon ei kuulu mennä negatiiviseksi, hän voi kirjata sen säännöksi. Tämän jälkeen algoritmi hylkää jo varhaisessa vaiheessa kaavat, jotka antaisivat miinusmerkkisiä tuloksia, vaikka ne muuten sopisivat dataan erinomaisesti. Lopputulos on vähemmän näyttävä käyrä – mutta enemmän totta.
Uuden lähestymistavan ydin on kolmivaiheinen prosessi. Ensin kone ”lämmittää” hakuansa tutustumalla dataan ja kartuttamalla hyviä rakennuspalikoita. Sen jälkeen se kehittää kaavaehdokkaita pisteittäen ne sekä sopivuuden että sääntöjen noudattamisen perusteella. Tämän vaiheen juju on, että sääntöjen painoarvoa kiristetään vähitellen: alkuvaiheessa annetaan tilaa luovuudelle, myöhemmin varmistetaan, etteivät lupaavat ideat riko perusraameja. Lopuksi lupaavimpia kaavoja hiotaan pienin korjauksin. Kirjoittajat kutsuvat ohjausta asteittain tiukkenevaksi sääntöarvioinniksi – termi on tekninen, mutta käytännössä kyse on nupin kiertämisestä: ensin kokeillaan, sitten kurinalaistetaan.
Tutkijat väittävät myös matemaattisesti perustellen, että tällainen ohjattu haku ei ainoastaan näytä järkevämmältä, vaan yleistää paremmin. Kun kiellettyjen kaavojen joukkoa kasvatetaan – siis kun sääntöjä on enemmän tai ne ovat tarkempia – mahdollisten vaihtoehtojen määrä pienenee. Se vähentää kiusausta löytää sattumalta dataan sopivia, mutta todellisuudessa väärään suuntaan vieviä muotoja. Yksinkertaistettuna: mitä vähemmän mielivaltaisia reittejä koneella on, sitä todennäköisemmin se päätyy reitille, joka pitää myös uusissa olosuhteissa.
Entä todisteet? Uusi menetelmä testattiin useilla eri aloilla. Tutkimuksen mukaan se voitti nykyiset kilpailijat kautta linjan ja pysyi toimintakykyisenä myös silloin, kun data oli meluista tai sitä oli vähän – olosuhteet, joissa näennäiskaavat yleensä juhlivat. Lisäksi ohjaus sieti sen, että ennakkoehdot eivät olleet täydellisiä: vaikka säännöt olivat karkeita tai osin virheellisiä, menetelmä pysyi kurssissa paremmin kuin vaihtoehdot, jotka eivät käyttäneet sääntöjä lainkaan.
Tämä kaikki kuulostaa järkevältä – ja on pitkälti tervetullut muistutus vanhasta opista: data ei yksin riitä. Silti kuvaan liittyy varjopuolia. Ensinnäkin menetelmä nojaa siihen, että joku osaa kirjoittaa säännöt koneen ymmärtämään muotoon. Se on oma taitonsa, eikä kaikilla tieteenaloilla ole selkeitä, yksiselitteisiä peruslakeja, jotka voisi näppärästi muotoilla ehdoiksi. Toiseksi ”tieteellinen johdonmukaisuus” riippuu joskus ajankohdasta ja koulukunnasta. Liian tiukat säännöt voivat myös lukita katseen vanhoihin totuuksiin ja tukkia tien oudoilta, mutta oikeilta löydöiltä.
Kolmanneksi, vaikka tutkimus raportoi hyviä tuloksia monissa olosuhteissa, sekin on lopulta joukko testejä rajatuissa ympäristöissä. Emme tiedä vielä, miten hyvin menetelmä toimii arvaamattomammissa tilanteissa, joissa mittausvirheet, harhat tai puuttuvat muuttujat sotkevat kuvaa tavoilla, joita säännöillä on vaikea ennakoida. Kirjoittajat korostavat kestävyyttä melua ja niukkuutta vastaan, mutta käytäntö on armoton tuomari.
Silti suunta on selvä. Kun tekoälyltä pyydetään kaavoja, meidän pitäisi pyytää niiltä myös luonnetta: kykyä sanoa ei mahdottomalle. Jos kone oppii yhdistämään tilastollisen istuvuuden ja perussäännöt, sen ehdotukset voivat olla paitsi tarkkoja, myös käyttökelpoisia. Ne auttavat tutkijaa näkemään metsän puilta ja säästävät aikaa, joka muuten kuluisi näennäiskaavojen perkaamiseen.
Laajempi kysymys kuuluu: jos pystymme ohjaamaan koneita karsimaan epäuskottavat selitykset, voisimmeko opettaa ne myös ehdottamaan lupaavia kysymyksiä – sellaista uteliaisuutta, joka ei vain sovi dataan, vaan avaa uuden oven todellisuuteen?
Paper: https://arxiv.org/abs/2602.13021v1
Register: https://www.AiFeta.com
tekoäly tiede data yhtälöt tutkimus