Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi

Share
Näkymätön lisäys kuvaan voi kantaa pitkän viestin – ja säilyä tavallisen muokkauksen läpi

Kun tekoälyn tekemät kuvat yleistyvät, pelkkä arvaus alkuperästä ei riitä. Tuoreet kokeet osoittavat, että yksinkertainen, huomaamaton vesileima voi kertoa sekä onko kuva koneella tehty että kuka sen teki.

Sosiaalisen median virrassa kuva näyttää aina kuvalta: naurava hääseurue, tulviva katu, presidentti kättelemässä. Silti yhä useammin kysymys kuuluu, mistä kuva on peräisin ja voiko siihen luottaa. Sormenjäljen tapaiset näkyvät vesileimat ovat helppo poistaa, eikä pelkkä ”tekoälyn tekemä / ei tehty” -leima auta, jos pitäisi tietää myös tekijä tai lähde.

Pitkään on ajateltu, että jos kuvaan piilottaa monibit­tisen eli useita bittejä sisältävän viestin – esimerkiksi tekijän tunnisteen ja aikaleiman – jokin murtuu. Joko viesti jää lyhyeksi, katoaa pakkausten ja suodinten käsittelyssä tai sen lukeminen on hidas ja epävarma toimenpide. Nyt joukko tutkijoita ehdottaa toisenlaista periaatetta: vesileiman ei tarvitse olla monimutkainen toimiakseen. Se voi olla yksi, huomaamaton kuvio, joka ”taipuilee” eri suuntiin viestin bittien mukaan ja jonka voi myöhemmin lukea nopealla tarkistuksella.

Ajatuksen ydin on yllättävän arkinen. Kuvittele läpikuultava, heikko kuvio, joka lisätään kuvaan niin, ettei ihmissilmä erota sitä. Kun kuvioon käännetään pieniä ”vivahteita” bittien mukaan, syntyy kuin näkymätön viivakoodi. Jälkikäteen lukija ei yritä palauttaa koko kuvaa tai suorittaa vaikeaa hakua. Hän vain vertaa, kuinka hyvin tuo heikko kuvio ”istuu” kuvan pikseleihin. Jos istuvuus on tietyillä tavoilla korkea tai matala, siitä muodostuu bittijono.

Tätä periaatetta testattiin laajasti standardoidulla kuva-aineistolla. ArXivissa julkaistun artikkelin mukaan uusi menetelmä – nimeltään ADD, sanoista Add, Dot, Decode – ylsi 48 bitin viestin koodauksessa 100 prosentin oikeaan purkuun. Kun kuvia muokattiin monin tavoin, suorituskyky heikkeni korkeintaan kahdella prosenttiyksiköllä. Parhaisiin aiempiin menetelmiin verrattuna pudotus oli pieni: artikkeli raportoi näille keskimäärin 14 prosenttiyksikön heikennyksen vastaavissa kokeissa. Lisäksi vesileiman lisääminen oli noin kaksi kertaa ja purku 7,4 kertaa aiempaa nopeampaa nopeimpaan vertailukohtaan nähden.

Miksi tämä on olennaista? Siksi, että tieto kuka teki kuvan on usein tärkeämpi kuin tieto siitä, onko kuva koneen tekemä. Monesta aiemmasta lähestymistavasta on puuttunut juuri tämä kapasiteetti: on saatu kyllä yksi bitti – kyllä tai ei – mutta ei pitkää tunnistetta, jonka voisi kytkeä tekijään, lisenssiin tai vastuuseen.

Konkreettinen esimerkki auttaa. Uutistoimitus haluaa, että sen jakamat kuvat tunnistuvat myöhemminkin. Toimitus upottaa jokaiseen kuvaan 48 bitin koodin, joka vastaa sisäistä jäsennumeroa ja aikaleimaa. Kuva kiertää verkossa, sen kokoa muutetaan ja se pakataan uudelleen. Viikkoja myöhemmin kuva löytyy keskustelusta, jossa kiistellään sen aitoudesta. Toimitus syöttää kuvan lukijalle: koodi palautuu oikein, ja on todennettavissa, että kuva vastaa toimituksen julkaisemaa otosta. Jos sama menetelmä toimisi hyvin laajasti erilaisissa käsittelyissä, se voisi olla käytännöllinen palanen verkon luottamusinfrastruktuuria.

ADD-menetelmän lupaus ei perustu pelkkään insinööritemppuun, vaan artikkeli tarjoaa myös selitystä sille, miksi juuri tällainen lisäyksen ja vertailun yhdistelmä toimii. Vesileima – se heikko, opittu kuvio – ja sitä seuraava lukusääntö on suunniteltu samaan tarkoitukseen: tekemään viestistä erottuva vielä silloinkin, kun kuvaa on muokattu. Yksinkertaisuus on etu myös laskennallisesti. Kun upotus ja luku ovat suoraviivaisia operaatioita, ne sopivat paikkoihin, joissa kuvia syntyy ja liikkuu nopeasti: kameroihin, generatiivisiin malleihin, uutisvirtoihin.

Silti varovaisuus on paikallaan. Tulokset on raportoitu yhdellä laajasti käytetyllä testiaineistolla ja ”joukolla kuvamuokkauksia”, mutta arki tuo mukanaan monenlaisia tilanteita. Abstrakti ei erittele, mitä kaikkia muokkauksia kokeissa käytettiin. Se ei myöskään väitä, että vesileima kestäisi määrätietoisen poistoyrityksen – toisenlaisen algoritmin, jonka ainoa tehtävä on nimenomaan vesileiman etsiminen ja hämärtäminen. 48 bittiä on jo hyödyllinen, mutta entä jos pitäisi koodata enemmän tietoa? Abstrakti ei lupaa, miten menetelmä skaalautuu pidemmille viesteille tai miten se toimii kuvien ulkopuolella, kuten videoissa.

Lisäksi vesileima on vasta puolikas ratkaisu. Yhteentoimivuus ja käyttöönotto ratkaisevat, auttaako tekniikka todella harmaalla alueella, jossa aitous ja vastuu ovat kiistanalaisia. Kuka päättää, mitä koodiin kirjoitetaan? Kenen on oikeus lukea sitä? Miten varmistetaan, ettei koodi vuoda yksityisyyttä, mutta palvelee silti alkuperän todentamista? Tekniikka, joka on nopea ja kestävä laboratorio-olosuhteissa, tarvitsee tuekseen sopimuksia, standardeja ja valvontaa.

On silti merkillepantavaa, että kilpajuoksussa luotettavuudesta kaikkein lupaavimmaksi nousee joskus yksinkertaisin ajatus. Kun näkyvä maailma täyttyy kuvilta, joita emme voi paljain silmin erottaa toisistaan, ratkaisu voi olla juuri se, mitä emme näe: hento, opittu kuvio, joka kertoo riittävästi. Se herättää isomman kysymyksen. Jos näkymätön vesileima voi tehdä kuvista jälleen selontekovelvollisia, pitäisikö meidän nähdä samantapainen, käytännöllinen ajattelu myös muissa digitaalisen luottamuksen palasissa – ja kuka ottaa ensimmäisen askeleen?

Paper: https://arxiv.org/abs/2604.11491v1

Register: https://www.AiFeta.com

tekoäly kuvankäsittely vesileima disinformaatio tutkimus

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä, mutta

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen