Joukko tekoälyagentteja ei vielä keskustele – se puhuu ohi
Laaja aineisto AI-agenttien somealustalta osoittaa, että näyttävä kuhina tuottaa vähän sisältöä ilman erikseen suunniteltua yhteispeliä.
Kuvittele vilkas keskusteluketju verkossa. Kommentteja ilmestyy ruudulle kymmeniä minuutissa, kiitoksia ja peukkuja satelee, ja sävy on kohtelias. Silti, kun yrität saada kysymykseesi vastauksen, huomaat lukevasi toistuvia yleistyksiä, irrallisia huomioita ja hehkutusta, joka ei oikeasti liity aiheeseen. Näin voi näyttää myös maailma, jossa keskustelijat ovat tekoälyagentteja – ohjelmia, jotka kirjoittavat itsenäisesti ja vuorovaikutteisesti.
Viime vuosina on ollut helppo uskoa, että kun tällaisia agentteja pannaan isoksi joukoksi samaan tilaan, niistä syntyy yhdessä jotain enemmän kuin osiensa summa: väitteitä, vastaväitteitä, yhteistä ymmärrystä. Tuore empiirinen katsaus ehdottaa päinvastaista. Kun agentteja ei ohjata tarkasti, suuri määrä ei jalostu keskusteluksi, vaan rinnakkaisiksi, toisiaan sivuaviksi puheenvuoroiksi.
Todisteena toimii erikoinen aineisto: Moltbook, verkkoalusta, jossa keskustelijoina ovat pelkästään tekoälyagentit. Tutkimuksessa analysoitiin 800 000 julkaisua, 3,5 miljoonaa kommenttia ja 78 000 agentin profiilia. Kirjoitukset olivat kielellisesti sujuvia ja vaihtelevia. Pinta näytti siltä kuin keskustelu olisi käynnissä – mutta sisältö ei kantanut.
Mitä tämä tarkoittaa käytännössä? Tutkijat tarkastelivat, kuinka usein kommentit ottivat oikeasti kiinni siitä, mitä alkuperäinen julkaisu sanoi. He katsovat sekä sanoja että merkityksiä: onko yhteisiä asiasanoja, ja muistuttavatko lauseiden sisällöt toisiaan. Lisäksi he pyysivät toista kielimallia toimimaan tuomarina ja luokittelemaan kommentteja esimerkiksi mainosroskaksi tai aiheen vierestä meneväksi.
Kuva oli yllättävän yksitoikkoinen. Vaikka valtaosa agenteista (67,5 prosenttia) muunteli kirjoitustapaansa tilanteen mukaan, noin 65 prosenttia kommenteista ei jakanut yhtään erottavaa sisältösanaa sen viestin kanssa, jonka alle ne oli kirjoitettu. Toisin sanoen ne kuulostivat asiallisilta, mutta eivät tarttuneet olennaiseen. Kun ketjuihin kertyi lisää vastauksia, uutta tietoa tuli nopeasti vähemmän: lisäkommenttien informaatioarvo hiipui vauhdilla.
Kun tuomariksi pyydetty kielimalli arvioi kommentteja, se luokitteli yleisimmät tyypit mainosmaiseksi roskaksi (28 prosenttia) ja aiheen sivuuttavaksi sisällöksi (22 prosenttia). Merkitystä mittaava analyysi tuki havaintoa: lexikaalisesti yleiset kommentit olivat myös sisällöltään yleisiä. Vain viisi prosenttia kommenteista kytkeytyi säikeisiin, joissa agentit jatkoivat toistensa ajatuksia. Yleisemmin ne kirjoittivat itsenäisiä, ketjun alimmalle tasolle pudotettuja vastauksia – ikään kuin jokainen puhuisi omalle yleisölleen, ei toisilleen.
Yksi esimerkki riittää havainnollistamaan ilmiötä. Kuvittele julkaisua, jossa kysytään: ”Miten pienentää kerrostalokodin energiankulutusta talvella?” Asiallinen vastaus viittaisi lämpöhäviöihin, termostaatteihin tai taloyhtiön säätöihin. Sen sijaan agenttiketjussa saatetaan nähdä kymmeniä variaatioita kuten ”Kiitos tärkeästä aiheesta!” tai ”Loistava muistutus huolehtia kodista ja ympäristöstä!” sekä joukko irrallisia vinkkejä, jotka sopivat melkein mihin tahansa: ”Pysy positiivisena ja juo tarpeeksi vettä.” Yksikään ei ole varsinaisesti väärässä – mutta harva vastaa kysymykseen.
Tämä ei tarkoita, että agentit olisivat kyvyttömiä. Aineisto kertoo päinvastoin, että ne osaavat tuottaa monenlaista, kieliopillisesti siistiä tekstiä. Ongelma on koordinoinnissa: ilman selkeitä sääntöjä siitä, kuka puhuu milloin, mihin aiempaan viestiin pitää tarttua ja millä tavoitteella edetään, vuorovaikutus ei nivoudu keskusteluksi. Suuren joukon spontaani toiminta ei yksin riitä. Tarvitaan nimenomaisesti suunniteltuja mekanismeja – keskustelunohjausta muistikirjasta ja viiteviittauksista yhteisiin tavoitteisiin ja roolituksiin – jotta puheenvuorot rakentuisivat toistensa päälle.
Miksi tämä on tärkeää juuri nyt? Moni visio tulevista tekoälysovelluksista nojaa agenttien väliseen yhteistyöhön: ohjelmat delegoivat tehtäviä toisilleen, tarkistavat toistensa työn ja keskustelevat ratkaisuista. Jos perusmuotoinen vuorovaikutus tuottaa lähinnä rinnakkaisia monologeja, näiden visioiden pohja horjuu. Myös moderointi- ja laatujärjestelmien tarve korostuu: näyttävä kuhina voi helposti peittää alleen sen, että uutta sisältöä syntyy vain nimeksi.
On kuitenkin syytä katsoa asetelmaa kriittisesti. Tutkimus tarkastelee yhtä alustaa, jolla käyttäjät ovat pelkästään agentteja; ihmisten ja agenttien välinen vuoropuhelu voi toimia eri tavoin. Osa arvioista perustuu sekin tekoälyn tekemiin luokituksiin, jotka voivat vääristyä. Lisäksi tulokset eivät kerro, miten agentit käyttäytyvät ympäristöissä, joissa on tiukat säännöt, selkeä työnjako tai eksplisiittinen palkitseminen siitä, että viestit viittaavat aiempiin sisältöihin.
Silti havainto on selkeä: ilman ohjausta suuret agenttijoukot eivät vielä muodosta keskustelua, vaan luovat sen näköistä pintaa. Tätä taustaa vasten kysymys kuuluu, millaisia pelisääntöjä ja rakenteita haluamme rakentaa, jos aiomme luottaa tekoälyjen keskinäiseen neuvonpitoon. Tarvitaanko digitaalisiin foorumeihin samanlaista keskustelunohjausta ja muistia kuin hyvään seminaariin – ja kuka sen suunnittelee? Vastaus määrittää, syntyykö agenttien teatterista joskus myös yhteistä ajattelua.
Paper: https://arxiv.org/abs/2602.20059v1
Register: https://www.AiFeta.com
tekoäly kielimallit viestintä tutkimus digitaaliset-agentit