tekoäly

Robotti ei aina näe, mitä me näemme – ja sen harhauttaminen on pelottavan helppoa

Kari Jaaskelainen

31 Mar 2026 — 3 min read

Kun koneet tekevät päätöksiä näkemänsä perusteella, pienikin tahallinen harhautus voi muuttua turvallisuusriskiksi – tuore tutkimus korostaa, että tällaiset harhautukset on opittava havaitsemaan juuri robottien käyttämissä näkömalleissa.

Kuvittele siivousrobotti, joka värittää kamerakuvansa jokaisen pikselin: tässä on lattiaa, tuossa on kaapin ovi, tuossa varjo. Yhtäkkiä lattialla oleva huomaamaton kuvio saa sen tulkitsemaan osan lattiasta esteeksi. Robotti pysähtyy – tai mikä pahempaa, kiertää kuvion ja kolauttaa pöydänjalan. Näin toimii niin kutsuttu semanttinen segmentointi: kone oppii nimeämään jokaisen kuvan osan ja tekee sen varaan päätöksiä.

Vielä muutama vuosi sitten monen mielestä riitti, että tekoälyä "kovetetaan" häiriöitä vastaan. Valokuvien luokittelussa – onko kuvassa kissa vai koira – tätä onkin tutkittu uutterasti. Nyt tutkimus Detection of Adversarial Attacks in Robotic Perception muistuttaa, että robottien näkö on toisenlainen ongelma: niille tärkeää ei ole vain yksi sana koko kuvalle, vaan oikea tunniste jokaiselle pikselille. Ja että vaarallisinta ei aina ole se, että malli erehtyy, vaan se, että se erehdytetään.

Tällaisia tahallisia harhautuksia kutsutaan vastustajan hyökkäyksiksi. Ne ovat kuviin tehtyjä, ihmiselle lähes huomaamattomia muutoksia, jotka saavat syvät neuroverkot tekemään vääriä johtopäätöksiä. Tutkimuksen peruslähtökohta on selvä: vaikka neuroverkot ovat kehittyneet huimasti ja toimivat segmentoinnissa hyvin, ne ovat yhä haavoittuvia tällaisille hyökkäyksille. Se on ongelma nimenomaan siellä, missä koneen päätös kytkeytyy suoraan liikkeeseen – varastoissa, kaduilla, tehtaissa.

Jännite on siis tämä: aiemmin katse oli luokittelumalleissa ja niiden yleisessä kestävyydessä. Nyt tutkijat ehdottavat, että robottien käyttämää semanttista segmentointia on tarkasteltava omana lajinaan – ja että keskeistä on oppia havaitsemaan harhautukset ennen kuin ne muuttuvat liikkeiksi.

Mitä tämä tarkoittaa käytännössä? Yksi arkipäiväinen esimerkki: suojatien valkoiset raidat ja märän asfaltin harmaa voivat näyttää kameralle samalta, jos kuvaan on lisätty tietyntyyppistä, silmälle näkymätöntä kohinaa. Segmentointimalli saattaa "värittää" suojatien osittain tieksi. Jos joku haluaa tahallaan hämätä robottia – vaikkapa liimaamalla pieniä tarroja tai heijastimia – muutos voi olla riittävä. Havaitseminen tarkoittaa tällöin sitä, että järjestelmä oppii tunnistamaan, milloin sen oma näkö ei ole luotettava: pikselit vaihtavat luokkaa oudon epävarmasti, reunat hajoavat, tai samanlainen kuva on aiemmin tuottanut aivan toisenlaisen tulkinnan.

Tutkimus korostaa kahta asiaa. Ensinnäkin, segmentointiin sopivat arkkitehtuurit – siis tavat rakentaa ja kouluttaa näköverkko – ovat erilaisia kuin luokittelussa. Niinpä myös suojaukset ja varoitusmerkit pitää räätälöidä tälle tehtävälle. Toiseksi, pelkkä "kovettaminen" ei riitä: tarvitaan nimenomaan havaitsemista, kykyä nostaa käsi pystyyn ja sanoa, että nyt näkymä on epäilyttävä. Tämä voi tarkoittaa esimerkiksi erillistä valvojaa, joka syynää mallin tuottamia pikselikarttoja, tai sisäänrakennettuja mittareita, jotka seuraavat, poikkeaako mallin käytös normaalista. Yksityiskohtia paperi ei myy tuotteina, vaan argumentteina: robotiikan konteksti vaatii omat ratkaisunsa.

Tällainen valppaus ei ole ilmaista. Ensimmäinen rajoitus on aika: mobiilirobotti ei voi pysähtyä joka sekunti miettimään, onko kuvaan koskettu. Havaitsemisen on tapahduttava reaaliajassa. Toinen rajoitus on virheelliset hälytykset. Jos järjestelmä varoittaa liian helposti, robotti jarruttaa turhaan ja tuottavuus laskee. Jos se taas sietää liikaa, vaaralliset harhautukset livahtavat läpi. Kolmas epävarmuus on vastapuolen kekseliäisyys: kun puolustaja keksii tavan paljastaa tietynlaisen hyökkäyksen, hyökkääjä muuttaa tyyliä. Kyse on kilpajuoksusta, ei lopullisesta voitosta.

On myös käytännön kysymyksiä. Missä ympäristöissä mallit koulutetaan ja testataan? Laboratoriossa tuotetut harhautukset ovat usein siistejä ja toistettavia. Tehdashallissa, sateessa tai hämärässä optiikka käyttäytyy toisin. Entä laitteiston rajat: pienet kamerat ja edulliset suorittimet eivät jaksa pyörittää raskaita vartijoita näkömallin kyljessä. Nämä realiteetit eivät kumoa tutkimuksen johtopäätöstä, mutta ne asettavat sille reunaehdot.

Silti ajatus havaitsemisesta suojakerroksena on houkutteleva. Siinä on sama viisaus kuin ilmailun redundanssissa: ei oleteta, että yksikään osa on erehtymätön, vaan rakennetaan järjestelmä, joka huomaa, kun jokin alkaa toimia oudosti. Robottien kohdalla tämä voi tarkoittaa näkömallin sisäisiä tarkistuksia, toisten aistien – esimerkiksi syvyyskameran tai lidarin – ristiinvertailua, tai jopa käyttäytymistasolla tehtyjä testejä: jos jokin näyttää lätäköltä, mene lähemmäs ja katso uudelleen ennen kuin kierrät.

Tutkimuksen viesti on maltillinen mutta tärkeä: robottien näkö ei ole vain hienoa kuvankäsittelyä, vaan turvallisuuden perusta. Kun haavoittuvuus on nimenomaan pikselien tasolla, myös puolustus on rakennettava samalle tasolle. Eikä kyse ole vain itseajavista autoista. Varastorobotit, siivouslaitteet, sairaaloiden kuljetusrobotit – kaikki ne tekevät päätöksiä jokaisesta kuvapisteestä.

Ehkä suurin kysymys on lopulta inhimillinen: kuinka paljon epävarmuutta olemme valmiita sietämään koneiden silmissä? Jos hyväksymme, että täydellistä haavoittumattomuutta ei tule, opimmeko elämään järjestelmien kanssa, jotka välillä sanovat "en ole varma" – ja osaammeko rakentaa ympäristöt, joissa tällainen nöyryys on hyve, ei haitta?

Paper: https://arxiv.org/abs/2603.28594v1

Register: https://www.AiFeta.com

tekoäly robotiikka konenäkö kyberturvallisuus turvallisuus tutkimus

Robotti ei aina näe, mitä me näemme – ja sen harhauttaminen on pelottavan helppoa

Kari Jaaskelainen

Kun koneet tekevät päätöksiä näkemänsä perusteella, pienikin tahallinen harhautus voi muuttua turvallisuusriskiksi – tuore tutkimus korostaa, että tällaiset harhautukset on opittava havaitsemaan juuri robottien käyttämissä näkömalleissa.

Read more

Se, mitä pidämme kuvissa samanlaisena, riippuu sanoista

Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi

Tietokone, joka kuuntelee sanat, äänen ja ilmeet, voi kertoa myös miksi se epäilee masennusta

Keinoälystä on tulossa matemaatikon apuri, joka etsii poikkeukset ja ehdottaa polkuja