Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi

Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi

Kun tekoälyn tekemät kuvat yleistyvät, pelkkä arvaus alkuperästä ei riitä. Tuoreet kokeet osoittavat, että yksinkertainen, huomaamaton vesileima voi kertoa sekä onko kuva koneella tehty että kuka sen teki.

Sosiaalisen median virrassa kuva näyttää aina kuvalta: naurava hääseurue, tulviva katu, presidentti kättelemässä. Silti yhä useammin kysymys kuuluu, mistä kuva on peräisin ja voiko siihen luottaa. Sormenjäljen tapaiset näkyvät vesileimat ovat helppo poistaa, eikä pelkkä ”tekoälyn tekemä / ei tehty” -leima auta, jos pitäisi tietää myös tekijä tai lähde.

Pitkään on ajateltu, että jos kuvaan piilottaa monibit­tisen eli useita bittejä sisältävän viestin – esimerkiksi tekijän tunnisteen ja aikaleiman – jokin murtuu. Joko viesti jää lyhyeksi, katoaa pakkausten ja suodinten käsittelyssä tai sen lukeminen on hidas ja epävarma toimenpide. Nyt joukko tutkijoita ehdottaa toisenlaista periaatetta: vesileiman ei tarvitse olla monimutkainen toimiakseen. Se voi olla yksi, huomaamaton kuvio, joka ”taipuilee” eri suuntiin viestin bittien mukaan ja jonka voi myöhemmin lukea nopealla tarkistuksella.

Ajatuksen ydin on yllättävän arkinen. Kuvittele läpikuultava, heikko kuvio, joka lisätään kuvaan niin, ettei ihmissilmä erota sitä. Kun kuvioon käännetään pieniä ”vivahteita” bittien mukaan, syntyy kuin näkymätön viivakoodi. Jälkikäteen lukija ei yritä palauttaa koko kuvaa tai suorittaa vaikeaa hakua. Hän vain vertaa, kuinka hyvin tuo heikko kuvio ”istuu” kuvan pikseleihin. Jos istuvuus on tietyillä tavoilla korkea tai matala, siitä muodostuu bittijono.

Tätä periaatetta testattiin laajasti standardoidulla kuva-aineistolla. ArXivissa julkaistun artikkelin mukaan uusi menetelmä – nimeltään ADD, sanoista Add, Dot, Decode – ylsi 48 bitin viestin koodauksessa 100 prosentin oikeaan purkuun. Kun kuvia muokattiin monin tavoin, suorituskyky heikkeni korkeintaan kahdella prosenttiyksiköllä. Parhaisiin aiempiin menetelmiin verrattuna pudotus oli pieni: artikkeli raportoi näille keskimäärin 14 prosenttiyksikön heikennyksen vastaavissa kokeissa. Lisäksi vesileiman lisääminen oli noin kaksi kertaa ja purku 7,4 kertaa aiempaa nopeampaa nopeimpaan vertailukohtaan nähden.

Miksi tämä on olennaista? Siksi, että tieto kuka teki kuvan on usein tärkeämpi kuin tieto siitä, onko kuva koneen tekemä. Monesta aiemmasta lähestymistavasta on puuttunut juuri tämä kapasiteetti: on saatu kyllä yksi bitti – kyllä tai ei – mutta ei pitkää tunnistetta, jonka voisi kytkeä tekijään, lisenssiin tai vastuuseen.

Konkreettinen esimerkki auttaa. Uutistoimitus haluaa, että sen jakamat kuvat tunnistuvat myöhemminkin. Toimitus upottaa jokaiseen kuvaan 48 bitin koodin, joka vastaa sisäistä jäsennumeroa ja aikaleimaa. Kuva kiertää verkossa, sen kokoa muutetaan ja se pakataan uudelleen. Viikkoja myöhemmin kuva löytyy keskustelusta, jossa kiistellään sen aitoudesta. Toimitus syöttää kuvan lukijalle: koodi palautuu oikein, ja on todennettavissa, että kuva vastaa toimituksen julkaisemaa otosta. Jos sama menetelmä toimisi hyvin laajasti erilaisissa käsittelyissä, se voisi olla käytännöllinen palanen verkon luottamusinfrastruktuuria.

ADD-menetelmän lupaus ei perustu pelkkään insinööritemppuun, vaan artikkeli tarjoaa myös selitystä sille, miksi juuri tällainen lisäyksen ja vertailun yhdistelmä toimii. Vesileima – se heikko, opittu kuvio – ja sitä seuraava lukusääntö on suunniteltu samaan tarkoitukseen: tekemään viestistä erottuva vielä silloinkin, kun kuvaa on muokattu. Yksinkertaisuus on etu myös laskennallisesti. Kun upotus ja luku ovat suoraviivaisia operaatioita, ne sopivat paikkoihin, joissa kuvia syntyy ja liikkuu nopeasti: kameroihin, generatiivisiin malleihin, uutisvirtoihin.

Silti varovaisuus on paikallaan. Tulokset on raportoitu yhdellä laajasti käytetyllä testiaineistolla ja ”joukolla kuvamuokkauksia”, mutta arki tuo mukanaan monenlaisia tilanteita. Abstrakti ei erittele, mitä kaikkia muokkauksia kokeissa käytettiin. Se ei myöskään väitä, että vesileima kestäisi määrätietoisen poistoyrityksen – toisenlaisen algoritmin, jonka ainoa tehtävä on nimenomaan vesileiman etsiminen ja hämärtäminen. 48 bittiä on jo hyödyllinen, mutta entä jos pitäisi koodata enemmän tietoa? Abstrakti ei lupaa, miten menetelmä skaalautuu pidemmille viesteille tai miten se toimii kuvien ulkopuolella, kuten videoissa.

Lisäksi vesileima on vasta puolikas ratkaisu. Yhteentoimivuus ja käyttöönotto ratkaisevat, auttaako tekniikka todella harmaalla alueella, jossa aitous ja vastuu ovat kiistanalaisia. Kuka päättää, mitä koodiin kirjoitetaan? Kenen on oikeus lukea sitä? Miten varmistetaan, ettei koodi vuoda yksityisyyttä, mutta palvelee silti alkuperän todentamista? Tekniikka, joka on nopea ja kestävä laboratorio-olosuhteissa, tarvitsee tuekseen sopimuksia, standardeja ja valvontaa.

On silti merkillepantavaa, että kilpajuoksussa luotettavuudesta kaikkein lupaavimmaksi nousee joskus yksinkertaisin ajatus. Kun näkyvä maailma täyttyy kuvilta, joita emme voi paljain silmin erottaa toisistaan, ratkaisu voi olla juuri se, mitä emme näe: hento, opittu kuvio, joka kertoo riittävästi. Se herättää isomman kysymyksen. Jos näkymätön vesileima voi tehdä kuvista jälleen selontekovelvollisia, pitäisikö meidän nähdä samantapainen, käytännöllinen ajattelu myös muissa digitaalisen luottamuksen palasissa – ja kuka ottaa ensimmäisen askeleen?

Paper: https://arxiv.org/abs/2604.11491v1

Register: https://www.AiFeta.com

tekoäly kuvankäsittely vesileima disinformaatio tutkimus

Read more

Se, mitä pidämme kuvissa samanlaisena, riippuu sanoista

Se, mitä pidämme kuvissa samanlaisena, riippuu sanoista

Olet etsimässä uutta takkia verkosta. Kirjoitat hakukenttään “villakangastakki”. Ensimmäiset osumat ovat järkeviä, mutta sinä mietit: haluaisin nimenomaan tummanharmaan, polvipituisen ja arkikäyttöön sopivan. Yhtäkkiä “samanlainen takki” tarkoittaakin eri asiaa kuin hetkeä aiemmin. Silti useimmat kuvahaun ja verkkokaupan järjestelmät vertaavat kuvia toisiinsa yhden ja saman, kiveen hakatun mittarin mukaan. Perinteinen oletus on

By Kari Jaaskelainen
Tietokone, joka kuuntelee sanat, äänen ja ilmeet, voi kertoa myös miksi se epäilee masennusta

Tietokone, joka kuuntelee sanat, äänen ja ilmeet, voi kertoa myös miksi se epäilee masennusta

Moni tunnistaa tilanteen terveyskeskuksessa tai videopuhelussa: kysymykseen ”mitä kuuluu?” on helpompi vastata ”ihan ok” kuin kertoa oikeasti, miltä tuntuu. Häpeä, kiire ja se, että oireet ovat lopulta vain omia kokemuksia, vaikeuttavat masennuksen huomaamista – sekä potilaalta että ammattilaiselta. Yleinen ajatus on ollut, että jos tekoäly oppisi poimimaan masennuksen merkkejä puheesta, tekstistä

By Kari Jaaskelainen
Keinoälystä on tulossa matemaatikon apuri, joka etsii poikkeukset ja ehdottaa polkuja

Keinoälystä on tulossa matemaatikon apuri, joka etsii poikkeukset ja ehdottaa polkuja

Koneet voivat oppia löytämään piilokuvioita, vinkata todistusten välivaiheita ja jopa keksiä yksittäisiä tapauksia, jotka kumoavat rohkeita väitteitä – ja se voi muuttaa tapaa, jolla uutta matematiikkaa syntyy. Arjessa riittää usein, että jokin toimii melkein aina. Matematiikassa yksi poikkeus riittää kaatamaan koko säännön. Jos väität, että jokaisessa bussissa on aina vapaa paikka,

By Kari Jaaskelainen
Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Moni on tuijottanut Exceliä ja toivonut voivansa vain kysyä: missä kaupunginosissa koti on kävelymatkan päässä terveysasemasta ja ruokakaupasta? Ihmismielelle yksinkertainen pyyntö muuttuu helposti tuntien suodatukseksi ja kaavanviilaukseksi. Tietokone kyllä tietää vastauksen – jos vain osaisimme puhua sen kieltä. Viime vuosina apua on pyydetty juttelevalta tekoälyltä. Se osaa etsiä ja tiivistää tekstejä,

By Kari Jaaskelainen