Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi
Kun tekoälyn tekemät kuvat yleistyvät, pelkkä arvaus alkuperästä ei riitä. Tuoreet kokeet osoittavat, että yksinkertainen, huomaamaton vesileima voi kertoa sekä onko kuva koneella tehty että kuka sen teki.
Sosiaalisen median virrassa kuva näyttää aina kuvalta: naurava hääseurue, tulviva katu, presidentti kättelemässä. Silti yhä useammin kysymys kuuluu, mistä kuva on peräisin ja voiko siihen luottaa. Sormenjäljen tapaiset näkyvät vesileimat ovat helppo poistaa, eikä pelkkä ”tekoälyn tekemä / ei tehty” -leima auta, jos pitäisi tietää myös tekijä tai lähde.
Pitkään on ajateltu, että jos kuvaan piilottaa monibittisen eli useita bittejä sisältävän viestin – esimerkiksi tekijän tunnisteen ja aikaleiman – jokin murtuu. Joko viesti jää lyhyeksi, katoaa pakkausten ja suodinten käsittelyssä tai sen lukeminen on hidas ja epävarma toimenpide. Nyt joukko tutkijoita ehdottaa toisenlaista periaatetta: vesileiman ei tarvitse olla monimutkainen toimiakseen. Se voi olla yksi, huomaamaton kuvio, joka ”taipuilee” eri suuntiin viestin bittien mukaan ja jonka voi myöhemmin lukea nopealla tarkistuksella.
Ajatuksen ydin on yllättävän arkinen. Kuvittele läpikuultava, heikko kuvio, joka lisätään kuvaan niin, ettei ihmissilmä erota sitä. Kun kuvioon käännetään pieniä ”vivahteita” bittien mukaan, syntyy kuin näkymätön viivakoodi. Jälkikäteen lukija ei yritä palauttaa koko kuvaa tai suorittaa vaikeaa hakua. Hän vain vertaa, kuinka hyvin tuo heikko kuvio ”istuu” kuvan pikseleihin. Jos istuvuus on tietyillä tavoilla korkea tai matala, siitä muodostuu bittijono.
Tätä periaatetta testattiin laajasti standardoidulla kuva-aineistolla. ArXivissa julkaistun artikkelin mukaan uusi menetelmä – nimeltään ADD, sanoista Add, Dot, Decode – ylsi 48 bitin viestin koodauksessa 100 prosentin oikeaan purkuun. Kun kuvia muokattiin monin tavoin, suorituskyky heikkeni korkeintaan kahdella prosenttiyksiköllä. Parhaisiin aiempiin menetelmiin verrattuna pudotus oli pieni: artikkeli raportoi näille keskimäärin 14 prosenttiyksikön heikennyksen vastaavissa kokeissa. Lisäksi vesileiman lisääminen oli noin kaksi kertaa ja purku 7,4 kertaa aiempaa nopeampaa nopeimpaan vertailukohtaan nähden.
Miksi tämä on olennaista? Siksi, että tieto kuka teki kuvan on usein tärkeämpi kuin tieto siitä, onko kuva koneen tekemä. Monesta aiemmasta lähestymistavasta on puuttunut juuri tämä kapasiteetti: on saatu kyllä yksi bitti – kyllä tai ei – mutta ei pitkää tunnistetta, jonka voisi kytkeä tekijään, lisenssiin tai vastuuseen.
Konkreettinen esimerkki auttaa. Uutistoimitus haluaa, että sen jakamat kuvat tunnistuvat myöhemminkin. Toimitus upottaa jokaiseen kuvaan 48 bitin koodin, joka vastaa sisäistä jäsennumeroa ja aikaleimaa. Kuva kiertää verkossa, sen kokoa muutetaan ja se pakataan uudelleen. Viikkoja myöhemmin kuva löytyy keskustelusta, jossa kiistellään sen aitoudesta. Toimitus syöttää kuvan lukijalle: koodi palautuu oikein, ja on todennettavissa, että kuva vastaa toimituksen julkaisemaa otosta. Jos sama menetelmä toimisi hyvin laajasti erilaisissa käsittelyissä, se voisi olla käytännöllinen palanen verkon luottamusinfrastruktuuria.
ADD-menetelmän lupaus ei perustu pelkkään insinööritemppuun, vaan artikkeli tarjoaa myös selitystä sille, miksi juuri tällainen lisäyksen ja vertailun yhdistelmä toimii. Vesileima – se heikko, opittu kuvio – ja sitä seuraava lukusääntö on suunniteltu samaan tarkoitukseen: tekemään viestistä erottuva vielä silloinkin, kun kuvaa on muokattu. Yksinkertaisuus on etu myös laskennallisesti. Kun upotus ja luku ovat suoraviivaisia operaatioita, ne sopivat paikkoihin, joissa kuvia syntyy ja liikkuu nopeasti: kameroihin, generatiivisiin malleihin, uutisvirtoihin.
Silti varovaisuus on paikallaan. Tulokset on raportoitu yhdellä laajasti käytetyllä testiaineistolla ja ”joukolla kuvamuokkauksia”, mutta arki tuo mukanaan monenlaisia tilanteita. Abstrakti ei erittele, mitä kaikkia muokkauksia kokeissa käytettiin. Se ei myöskään väitä, että vesileima kestäisi määrätietoisen poistoyrityksen – toisenlaisen algoritmin, jonka ainoa tehtävä on nimenomaan vesileiman etsiminen ja hämärtäminen. 48 bittiä on jo hyödyllinen, mutta entä jos pitäisi koodata enemmän tietoa? Abstrakti ei lupaa, miten menetelmä skaalautuu pidemmille viesteille tai miten se toimii kuvien ulkopuolella, kuten videoissa.
Lisäksi vesileima on vasta puolikas ratkaisu. Yhteentoimivuus ja käyttöönotto ratkaisevat, auttaako tekniikka todella harmaalla alueella, jossa aitous ja vastuu ovat kiistanalaisia. Kuka päättää, mitä koodiin kirjoitetaan? Kenen on oikeus lukea sitä? Miten varmistetaan, ettei koodi vuoda yksityisyyttä, mutta palvelee silti alkuperän todentamista? Tekniikka, joka on nopea ja kestävä laboratorio-olosuhteissa, tarvitsee tuekseen sopimuksia, standardeja ja valvontaa.
On silti merkillepantavaa, että kilpajuoksussa luotettavuudesta kaikkein lupaavimmaksi nousee joskus yksinkertaisin ajatus. Kun näkyvä maailma täyttyy kuvilta, joita emme voi paljain silmin erottaa toisistaan, ratkaisu voi olla juuri se, mitä emme näe: hento, opittu kuvio, joka kertoo riittävästi. Se herättää isomman kysymyksen. Jos näkymätön vesileima voi tehdä kuvista jälleen selontekovelvollisia, pitäisikö meidän nähdä samantapainen, käytännöllinen ajattelu myös muissa digitaalisen luottamuksen palasissa – ja kuka ottaa ensimmäisen askeleen?
Paper: https://arxiv.org/abs/2604.11491v1
Register: https://www.AiFeta.com
tekoäly kuvankäsittely vesileima disinformaatio tutkimus