Taustatieto ohjaa tekoälyn katseen oikeaan suuntaan, kun kaikkia paikkoja ei voi mitata

Share
Taustatieto ohjaa tekoälyn katseen oikeaan suuntaan, kun kaikkia paikkoja ei voi mitata

Kunnan viranhaltija seisoo kaivon kannella ja miettii, mihin mennä seuraavaksi. Laboratoriomittaus maksaa, polttoaine maksaa, aika on kortilla. Kaikkia kaivoja ei voi testata, mutta jostain on aloitettava: kenties lähellä lentokenttää, jossa sammutusvaahdot ovat saattaneet vuotaa maahan, vai pellon reunalta, jossa valumat kulkevat ojiin?

Tämä arjen päätös kiteyttää ongelman, joka toistuu ympäristön seurannassa, katastrofien jälkeisessä etsinnässä ja kansanterveydessä. Maailma on suuri, mittaaminen on kallista, ja olosuhteet muuttuvat. Pitää päättää, mihin suuntaamme katseemme seuraavaksi – ja tehdä se järkevästi.

Perinteisesti on turvauduttu joko yksinkertaisiin peukalosääntöihin tai koneoppimismalleihin, jotka etsivät tietoa sieltä, missä epävarmuus on suurin. Molemmissa on puutteensa. Peukalosäännöt eivät sopeudu uusiin tilanteisiin. Monet edistyneet mallit taas tarvitsevat paljon varmistettua maastotietoa, jota vain harvoin on tarjolla. Niin sanottu vahvistusoppiminen, joka oppii kokeilun kautta, on tässä maailmassa huono kumppani: todellisia kokeiluja on vähän, ne ovat kalliita ja usein vinoutuneita kohti helppoja tai aiemmin tunnettuja kohteita.

ArXivissa julkaistu tutkimus ehdottaa toisenlaista tapaa. Siinä kone ei tuijota tyhjää karttaa, vaan antaa painoarvoa asioille, joiden tiedetään liittyvän etsittyyn ilmiöön. Maankäyttö, etäisyys mahdollisiin päästölähteisiin tai jokin muu helposti saatava taustatieto ohjaa, mihin suuntaan epävarmuuden keskellä kannattaa kurkistaa. Menetelmä myös opettelee uutta sitä mukaa kun havaintoja kertyy – ei laboratoriossa valmiiksi, vaan kentällä lennossa – ja järjestää oppimisensa niin, että se kohtaa tarkoituksella monenlaisia esimerkkejä. Tämä vähentää vaaraa, että malli juuttuisi yhteen tyypilliseen tilanteeseen ja unohtaisi muun maailman.

Ajatus kuulostaa abstraktilta, mutta sen voi pukea konkreettiseksi valinnaksi. Kuvittele kaksi jokivarren mittauspistettä, A ja B. Molemmista tiedetään yhtä vähän: mallin mukaan kummassakin voi piillä ongelma. A sijaitsee kilometrin päässä vanhasta sotilaskentästä, jossa on käytetty vaahtoja; B on kaukana teollisuudesta, metsän ja peltomaiseman rajalla. Jos valitsisimme seuraavan näytteen vain epävarmuuden perusteella, A ja B olisivat tasavertaisia. Uudessa lähestymistavassa taustatieto kallistaa vaakaa: A saa suuremman painon, koska paikalliset olosuhteet viittaavat kohonneeseen riskiin. Malli ei silti lukkiudu ennakko-oletuksiin, vaan päivittää käsitystään jokaisen uuden näytteen myötä – jos B yllättäen osoittautuu ongelmaksi, se muuttaa kurssiaan.

Tutkijat esittelevät lähestymistapansa nimenomaan tällaisia valintoja varten: miten näytteet kannattaa valita, kun kaikkea ei voi mitata. He kuvaavat kaksi keskeistä oivallusta. Ensimmäinen on epävarmuuden painottaminen taustatiedolla: mitä vähemmän jostain tiedetään ja mitä vahvemmin paikalliset tekijät puhuvat ilmiön puolesta, sitä todennäköisemmin sinne kannattaa mennä. Toinen on tapa järjestää uutena opittu tieto pieniksi eriksi, jotka on koottu niin, että ne kattavat mahdollisimman erilaisia tilanteita. Tämän on tarkoitus parantaa kykyä yleistää myös muuttuvissa oloissa.

Menetelmän toimivuutta testattiin todellisella aineistolla liittyen PFAS-yhdisteiden saastumiin. Nämä pysyvät kemikaalit ovat herättäneet huolta terveysriskeistään, ja niiden kartoittaminen on työlästä. Tutkimuksen mukaan uusi lähestymistapa auttoi löytämään saastuneita kohteita niukalla datalla ja vaihtuvissa olosuhteissa. Lisäksi tekijät kokeilivat menetelmää muissa simuloiduissa ympäristöissä, joissa tavoitteena oli löytää harvinaisia kohteita laajalta alueelta.

Miksi tällä on väliä? Ympäristövalvonnassa, pelastustoimessa ja kansanterveystyössä resurssit ovat niukat ja paineet kovat. Olipa kyse pilaantuneista kaivoista, myrskyn kaatamien puiden alla loukkuun jääneistä ihmisistä tai tautipesäkkeistä, järkevä näytteenotto säästää aikaa ja rahaa – ja voi pelastaa henkiä. Vaikka tietokone ei korvaa paikallistuntemusta, se voi auttaa jäsentämään sitä: tekemään näkyväksi, mitä tiedämme ja mitä emme, ja ehdottamaan seuraavaa siirtoa selkeällä perusteella.

On silti syytä olla kriittinen. Lähestymistapa nojaa siihen, että saatavilla on taustatietoa, joka todella liittyy etsittyyn ilmiöön. Jos valitut tekijät ovat puutteellisia tai harhaanjohtavia – jos merkittävä saastelähde ei näy kartoissa tai "turvalliseksi" luokiteltu alue onkin riskialtis – malli voi oppia väärin. Todentietoa on edelleen vähän ja se voi olla vinoutunutta, mikä voi vahvistaa olemassa olevia katveita. Ja vaikka malli oppii lennossa, kaikki muutokset eivät näy heti eivätkä kaikki yllätykset mahdu siististi aiempien esimerkkien jatkoksi.

Lisäksi kyse on esijulkaisusta: tulokset ovat lupaavia, mutta niiden yleistettävyys on vielä koeteltava käytännön hankkeissa, joissa politiikka, logistiikka ja inhimilliset tekijät asettavat omat reunaehtonsa. Menetelmä ei myöskään ole taikasauva, joka korvaisi harkinnan. Se priorisoi, perustelee ja ehdottaa – mutta ei päätä kenenkään puolesta.

Silti suunta on kiinnostava. Yhdistämällä mallien epävarmuuden ja ihmisten jo tuntemat riskivihjeet voidaan kohdentaa niukkoja resursseja järkevämmin. Sama ajattelu voisi auttaa esimerkiksi dronien reittien suunnittelussa maanjäristyksen jälkeen tai näytteenotossa, kun etsitään mikrobeja jätevedestä. Jäljelle jää iso kysymys: kuka päättää, mitä taustatietoa pidetään "olennaisena" – ja miten varmistamme, ettei katseemme käänny järjestelmällisesti ohi ongelmien, joita emme vielä osaa nimetä?

Paper: https://arxiv.org/abs/2602.17605v1

Register: https://www.AiFeta.com

tekoäly ympäristö PFAS terveys data tutkimus julkinen_hallinto

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä,

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen