Ihmisten tekemä opetusdata elää tekijöidensä mukana

Share
Ihmisten tekemä opetusdata elää tekijöidensä mukana

Moni kuvittelee, että tekoälyn opetusdata on kuin mittanauha: kerran kalibroitu ja aina samalla tavalla toimiva. Arkisemmin sen huomaa vaikkapa silloin, kun sovellus kysyy, onko viesti ystävällinen vai vihamielinen – vastaus kirjataan järjestelmään, ja äly ottaa opikseen. Mutta entä jos mitta itse venyy? Entä jos ihmiset, jotka tekevät näitä päätöksiä, muuttuvat työn myötä – ja muuttavat samalla myös tekoälyn oppimaa maailmaa?

Perinteinen ajatus on ollut, että ihmisten tekemät merkinnät ovat ”kultainen totuus”. Ne kelpaavat mittapuuksi, jonka varaan mallit opetetaan, testataan ja julkaistaan. Uusi tutkimus kuitenkin ehdottaa jotain vähemmän mukavaa mutta todenmukaisempaa: itse merkintätyö näyttää kouluttavan merkitsijöitä. Kun heidän käsityksensä ilmiöstä terävöityy, myös tulkinnat alkavat elää. Se, mitä eilen pidettiin pelkkänä keskusteluna, saatetaan huomenna nähdä vaikuttamisyrityksenä. Ja jos ihmiset muuttuvat, muuttuu myös data – ja sen mukana mallit, jotka dataa seuraavat.

Todisteita tästä on nyt koottu järjestelmällisesti. Tutkijat pyysivät 25 ihmistä viidestä eri ryhmästä – mukana sekä asiantuntijoita että maallikoita – tulkitsemaan 1 021 lyhyttä keskustelua. Tehtävä oli tunnistaa keskusteluista sosiaalisen vaikuttamisen keinoja, sekä arvioida puhujien aikeita, kuulijoiden reaktioita ja seurauksia. Jotta muutosta voisi mitata, 150 tekstiä annettiin samoille ihmisille kahdesti: heti alussa ja uudestaan urakan jälkeen.

Muodon vuoksi ei tyydytty vain numeroihin. Aineistoa analysoitiin määrällisesti ja laadullisesti, merkitsijöitä haastateltiin puolistrukturoidusti, he arvioivat osaamistaan itse – ja lisäksi samoilla merkinnöillä koulutettiin ja testattiin suuria kielimalleja. Näin nähtiin, muuttuuko paitsi ihmisten luottamus itseensä myös se, millaista oppia koneet heidän työstään saavat.

Tulokset vetävät yhteen kaksi ilmeistä havaintoa. Ensiksi, ihmiset kokivat osaamisensa ja varmuutensa kasvaneen selvästi. Toiseksi, myös itse data muuttui: merkintöjen laatu siirtyi suuntaan, joka viittaa siihen, että prosessi todella kartutti taitoa. Muutos näkyi erityisesti asiantuntijaryhmissä. Eikä kyse ollut vain ihmisistä: myös kielimallit käyttäytyivät eri tavoin sen mukaan, oliko ne opetettu urakan alun vai lopun merkinnöillä.

Konkreettinen esimerkki auttaa hahmottamaan vaikutusta. Kuvitellaan, että merkitsejä saa eteensä lyhyen viestinvaihdon. Alussa hän näkee siinä enimmäkseen tietojen vaihtoa eikä katso, että puhuja yrittää vaikuttaa kuulijaan. Viikkoja myöhemmin, kymmenien vastaavien tapausten jälkeen, sama henkilö saattaa huomata vivahteita, jotka aiemmin jäivät pimentoon: sävyjä, sanajärjestyksiä tai seurauksia, jotka paljastavat tarkoitushakuisuuden. Kun yhä useampi tekee saman havainnon, ”rajapyykki” sen välillä, mikä on vaikutusyritys ja mikä ei, siirtyy. Vastaavasti malli, joka oppii varhaisista tulkinnoista, päätyy toisenlaiseen käsitykseen todellisuudesta kuin malli, joka oppii myöhemmistä.

On helppo nähdä, miksi tämä on tärkeää. Jos data elää tekijöidensä mukana, niin myös mallit elävät. Tämä voi olla hyvä asia: mitä taitavammiksi ihmiset tulevat, sitä johdonmukaisempaa ja harkitumpaa on opetusmateriaali. Samalla syntyy kiusallinen ongelma toistettavuuden kanssa. Jos ”totuus” liikahtaa, kuinka verrata eri aikoina koulutettuja malleja? Ja mitä tapahtuu, jos järjestelmä nojaa kriittisissä tehtävissä – vaikkapa asiakaspalvelun päätöksissä tai sisällön moderoinnissa – rajoihin, jotka ovat liukuvia?

Tutkimus ei väitä enempää kuin mihin sen aineisto yltää, ja se on hyvä pitää mielessä. Tehtävä oli rajattu: sosiaalisen vaikuttamisen tunnistaminen keskusteluista on vaikea ja tulkinnanvarainen aihepiiri. Osallistujia oli 25, ja ennen–jälkeen-vertailu perustui 150 tekstiin. Ihmisten oma arvio osaamisestaan on vain yksi mittari, vaikka sitä tuettiin myös havaituilla muutoksilla datassa. Eikä mallien erilainen käyttäytyminen vielä kerro, kumpi opetusvaihe tuotti ”oikeamman” vastauksen – ainoastaan, että ero on olemassa ja sillä on merkitystä.

  • Yleistettävyys on auki: pätevätkö havainnot muihin tehtäviin ja kieliin?
  • Aikajänne on rajallinen: kuinka pysyväksi opittu taito jää?
  • ”Parempi laatu” on varovainen johtopäätös: mitä kulloinkin pidetään laadukkaana, riippuu tehtävän määritelmästä.

Silti viesti on selvä: kun rakennamme tekoälyjärjestelmiä ihmisarvioiden varaan, rakennamme myös ihmisten kehittymisen varaan. Sen voi kääntää vahvuudeksi. Merkintätyöstä kannattaa ajatella oppimisena, ei pelkkänä tuotantona. Se tarkoittaa esimerkiksi selkeitä ohjeita, palautekierroksia ja sitä, että osaa aineistosta merkitään uudelleen myöhemmin – ei siksi, että aiempi työ oli turhaa, vaan koska raja-aidat tarkentuvat. Samalla pitäisi raportoida avoimesti, milloin ja millä kokemuksella data on syntynyt. Se tekisi mallien tulkinnasta reilumpaa myös niille, jotka eivät ole olleet paikalla, kun rajoja vedettiin.

Lopulta kyse on laajemmasta kysymyksestä kuin yhden tutkimuksen asetelma. Jos ”kultainen totuus” on ihmisten yhdessä tuottama, ja ihmiset oppivat tehdessään, kuka määrittelee, milloin totuus on valmis – ja pitäisikö sen olla?

Paper: https://arxiv.org/abs/2604.02951v1

Register: https://www.AiFeta.com

tekoäly data ihmistekijät kielimallit tutkimus

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä,

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen