Tekoäly voi ajatella hiljaa – ja se voi suojata yksityisyyttä

Tekoäly voi ajatella hiljaa – ja se voi suojata yksityisyyttä

Kuvittele, että pyydät puhelimen avustajaa hoitamaan sinulle ajan lääkärille. Avustaja hoitaa asian, mutta ennen vastaustaan se “ajattelee ääneen”: kirjoittaa ruudulle välivaiheet, joissa se käy läpi terveystietojasi, sähköposteja ja kalenteriasi. Jos nuo välipohdinnat tallentuvat lokiin tai kulkeutuvat ulkoiseen palveluun, arkaluonteinen tieto voi karata huomaamatta.

Vuosia on ajateltu, että tekoäly ratkoo tehtäviä paremmin, kun se saa perustella vastauksensa vaihe vaiheelta. Tämä näkyvä ajatusjälki – mihin huomio kiinnittyi ja miksi näin päädyttiin – on auttanut malleja osumaan oikeaan. Samalla se on tuonut uuden riskin: jos välivaiheiden teksti sisältää nimiä, tunnisteita tai muuta henkilökohtaista, niiden vuotaminen on helppoa. Usein ratkaisu on ollut karsia selitykset pois vasta lopuksi tai luottaa siihen, ettei kukaan ulkopuolinen näe niitä.

Tuore tutkimus ehdottaa toista suuntaa: mallia voi opettaa noudattamaan ohjeita jo ajattelunsa sisällä, ei vain lopullisessa vastauksessa. Ajatus on yksinkertainen, joskin teknisesti vaativa. Tekoälylle annetaan kaksi sääntökirjaa – toinen kertoo, millainen vastauksen pitää olla, toinen, mitä ajatusjäljessä saa näkyä. Lisäksi mallin “miettiminen” ja “vastaaminen” erotetaan toisistaan: ne tuotetaan erillisillä lisäosilla, jolloin ajatus voi kulkea eri ehdoilla kuin julkinen vastaus.

Mitä tämä tarkoittaa arjessa

Palataan lääkäriajan varaukseen. Perinteinen, ääneen pohtiva malli saattaa kirjoittaa välivaiheisiinsa: “Etsi käyttäjän viestiketju, jossa mainitaan oire X, tarkista kalenterista vapaat ajat, yhdistä henkilötiedot varausta varten.” Jokaisessa kohdassa on riski, että tarpeetonta tietoa jää tekstiin, joka päätyy lokeihin.

Ohjattuun ajatteluun koulutettu malli toimii toisin. Sille on esimerkiksi sanottu: älä toista henkilötietoja ajatusjäljessä, äläkä kirjaa ylös muuta kuin kulloisenkin vaiheen kannalta välttämättömän. Silloin välivaihe voisi näyttää tältä: “Tarkista tarvittavat tiedot” – ilman, että se lausuu niitä ääneen. Lopullinen vastaus on silti informatiivinen: “Varasin sinulle ajan torstaille klo 10.” Ajatusjälki ei itsessään vuoda mitään uutta, vaikka se tallentuisi.

Koeasetelma ja tulokset

Tutkimuksessa hienosäädettiin useita eri kokoisia kielimalleja uudella aineistolla, jossa oli nimenomaiset rajoitukset ajatusjäljelle. Mallit arvioitiin kahdenlaisilla testeillä: ensinnäkin sillä, kuinka hyvin ne noudattivat ohjeita, ja toiseksi sillä, kuinka hyvin ne välttivät yksityisten tietojen lipsauttamista ajatusjäljessä.

Tulokset olivat rohkaisevia. Ohjattu ajattelu nosti ohjeiden noudattamisen tasoa selvästi – parhaimmillaan yli 20 pisteellä valituissa testeissä – ja ennen kaikkea paransi yksityisyyttä mittaavien kokeiden tuloksia jopa 51,9 prosenttiyksikköä. Tätä kokeiltiin kuudella mallilla kahdesta malliperheestä.

Hyöty ei kuitenkaan tullut ilmaiseksi. Kun mallia kiristetään noudattamaan tiukkoja sääntöjä ajatusjäljessä, se voi joskus ratkaista tehtävän vähemmän taitavasti. Tutkijat kuvaavat tätä ristiriitana päättelyn vapauden ja ohjeiden noudattamisen välillä: mitä kurinalaisemmin malli pidättää tietoa välivaiheissaan, sitä suurempi on riski, että myös varsinainen ajattelu köyhtyy. Käytännössä tämä voi näkyä liian niukkana välipohdintana tilanteissa, joissa perusteellisempi hahmottelu auttaisi löytämään paremman ratkaisun.

Miksi tällä on väliä

Uudet tekoälyavustajat tekevät muutakin kuin vastaavat kysymyksiin: ne selaavat sähköposteja, täyttävät lomakkeita ja juttelevat muiden palveluiden kanssa. Jotta ne pystyvät tähän, niiden on usein nähtävä paljon käyttäjän aineistoa. Usein ne myös kirjaavat välivaiheen tekstiä, jota kehittäjät käyttävät mallien parantamiseen. Siinä missä julkinen vastaus voidaan helposti suodattaa, ajatusjälki on hankalampi kahlehtia – ellei mallia ole opetettu jo lähtökohtaisesti pitämään se kurissa.

Tutkimus tarjoaa tähän konkreettisen keinon: opetetaan malli noudattamaan yksityisyyssääntöjä siellä, missä lipsahdukset syntyvät. Ajatus ja vastaus erotetaan toisistaan, jolloin niille voi asettaa eri rajoitukset. Tämä kuulostaa pieneltä muutokselta, mutta sitä on yllättävän vaikea toteuttaa ilman, että malli menettää osan tehtäväkyvykkyydestään. Siksi on merkittävää, että parannukset yksityisyydessä olivat suuria, vaikka välillä tehtävien suorituskyky hieman heikkeni. Koodi ja aineistot on lisäksi julkaistu avoimesti, mikä helpottaa riippumatonta tarkastelua.

Mitä emme vielä tiedä

Yksikään koe ei kerro koko totuutta. Testit, joilla yksityisyyttä mitataan, ovat väistämättä rajattuja – ne eivät voi kattaa kaikkia arjen tilanteita, joissa ajatusjälkeen voisi livahtaa arkaluonteista. Myös se, mikä on “yksityistä”, riippuu kontekstista ja sovituista säännöistä. On eri asia suodattaa henkilötunnus kuin arvioida, onko jokin harmittomalta tuntuva faktanpalanen yhdistettävissä muuhun tietoon.

Lisäksi tulokset koskevat tietyn kokoisia, kokeissa käytettyjä malleja. Emme vielä tiedä, miten hyvin sama menetelmä toimii huomattavasti suuremmissa tai täysin toisenlaisissa järjestelmissä, tai ympäristöissä, joissa ajatukset lähetetään aktiivisesti ulkoisiin työkaluihin. Entä jos käyttäjä haluaa perustelut näkyviin – kuinka yhdistää läpinäkyvyys ja varovaisuus? Ristiriita ei katoa, vaikka malleja opetettaisiin paremmiksi.

Silti suunta on selvä. Jos tekoälyltä vaaditaan sekä hyödyllisyyttä että yksityisyyttä, pelkkä lopputuloksen siistiminen ei riitä. Tarvitaan malleja, jotka osaavat olla varovaisia jo miettiessään. Ehkä seuraava suuri kysymys ei ole, miten tekoäly selittää vastauksensa kauniisti, vaan milloin sen kannattaa olla hiljaa – ja kuka päättää, mitä hiljaisuus peittää ja mitä sen pitäisi paljastaa.

Paper: https://arxiv.org/abs/2602.24210v1

Register: https://www.AiFeta.com

tekoäly yksityisyys kielimallit tutkimus tietosuoja

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen