Kohti autoa, jolle voi sanoa: “älä kaistaile, pidä väliä”

Share
Kohti autoa, jolle voi sanoa: “älä kaistaile, pidä väliä”

Oletko koskaan toivonut kyydissä, että kuski ajaisi vähän pehmeämmin, vaihtaisi kaistaa harvemmin tai antaisi enemmän tilaa edellä menevälle? Navigaattori osaa kertoa reitin ja nopeusrajoitukset, mutta se ei ymmärrä tyyliä. Entä jos auto itse ymmärtäisi arkisia ohjeita – ja ottaisi ne huomioon päätöksissään?

Automaattinen ajaminen on tähän asti nojannut pääosin kameroihin, tutkiin ja sääntöihin. Parhaimmillaankin järjestelmät ovat tulkinneet kieltä lähinnä sivuroolissa: kuvailemaan, mitä ympärillä näkyy, ei varsinaisesti ohjaamaan autoa. Uusi suuntaus ehdottaa toisin. Sen mukaan kielen pitäisi saada paikka ratissa – ei yksin, vaan yhdessä näköhavainnon ja ympäristön ennakoinnin kanssa.

Tuore arXiv-työ tuo todisteita siihen suuntaan. Tutkijat kokosivat suuren opetusaineiston, jossa on noin satatuhatta ajotilannetta. Jokaisessa tilanteessa on mukana lyhyitä, luonnollisella kielellä annettuja ajamisen ohjeita sekä vastaavat kuljettajan tekemät ajolinjat. Aineistoa käytettiin kouluttamaan järjestelmää, joka yhdistää kolme asiaa: mitä auto näkee, mitä sille sanotaan ja mitä todennäköisesti tapahtuu seuraavaksi. Tavoitteena on, että auto ei vain ymmärrä ympäristöä, vaan myös seuraa kohtuudella annettuja ohjeita – ilman että turvallisuus unohtuu.

Käytännössä järjestelmä toimii kahdella tavalla yhtä aikaa. Ensinnäkin se “lukee” kamerakuvia ja ohjeita askel askeleelta, kuin matkustaja vieressä neuvoisi: pidä isompi turvaväli, vältä turhaa kaistanvaihtoa, käänny seuraavasta. Toiseksi se “kuvittele” useita mahdollisia tulevaisuuksia – missä muut autot liikkuvat, miten liikenne soljuu – ja piirtää niihin sopivan reitin. Näiden prosessien ytimessä on mekanismi, joka pakottaa järjestelmän katsomaan ja kuuntelemaan samaan aikaan: sanallinen vihje vaikuttaa siihen, mihin kuvassa kiinnitetään huomiota, ja päinvastoin.

Mitä tämä voisi tarkoittaa arjessa? Kuvitellaan ohje: “Vältä turhaa kaistanvaihtoa ja pidä rauhallinen vauhti.” Järjestelmä tulkitsee sen tavoitteeksi ajaa tasaisesti ja maltillisesti. Kun auto lähestyy vilkasta liittymää, se punnitsee tulevia vaihtoehtoja ja valitsee sellaisen ajolinjan ja -nopeuden, joka minimoi kaistanvaihdot mutta pitää riittävän turvavälin. Jos taas ohje kuuluu “priorisoi oikea kaista seuraavaa liittymää varten”, auto pyrkii ajoissa asemoitumaan oikealle, kunhan edessä ei ole estettä tai vaaratilannetta. Tärkeää on, että ohje ei ole pelkkä koristus, vaan vaikuttaa siihen, miten ajosuunnitelma muodostetaan.

Tutkijat esittelevät järjestelmän nimellä Vega ja kutsuvat lähestymistapaa “näkö–kieli–maailma–toiminta” -malliksi. Nimi kuulostaa tekniseltä, mutta ajatus on selkeä: päätökset syntyvät vain, jos kuva, sanat ja käsitys tulevasta kohtaamisesta pelaavat yhteen. Työssä korostetaan myös, että eri aistimusten ja ohjeiden käsittelylle annetaan omat “sisäänmenot”, jotta järjestelmä tunnistaa, mikä tieto on kuvaa, mikä sanoja ja mikä ennustetta. Laajojen kokeiden kerrotaan parantaneen ajosuunnittelun tarkkuutta ja kykyä seurata ohjeita verrattuna aiempiin lähestymistapoihin, joissa kieli jäi taustalle.

On silti syytä hengittää rauhallisesti. Yhteenvedon perusteella on vaikea päätellä, missä olosuhteissa tulokset on saavutettu: ovatko kaikki testit olleet tallennetuissa tilanteissa vai myös oikealla tiellä, miten monimuotoisia ohjeet olivat ja millaisia vertailukohteita käytettiin. Yhtä tärkeää on kysyä, miten järjestelmä käsittelee ristiriitoja. Mitä tapahtuu, jos annettu ohje on epätarkka, keskenään ristiriitainen tai vastoin liikennesääntöjä? Tutkimus tiivistelmän tasolla ei kerro tätä, eikä sen tarvitsekaan – mutta juuri näissä rajapinnoissa käytäntö tekee tiedettä nöyräksi.

Toinen avoin kysymys liittyy yleistettävyyteen. Sata tuhatta tilannetta on tekoälymaailmassa paljon, mutta liikenteessä se on vain raapaisu pinnasta. Eri maiden tieliikenne, sää, tavat ja jopa tienmerkintöjen kulumat tuovat vaihtelua, jota on vaikea paketoida aineistoon. Jos ohjeet ovat esimerkiksi “pysy vasemmalla kaistalla kun mahdollista”, se tarkoittaa yhtä Euroopassa ja toista maissa, joissa vasemmalla ajaminen on sääntö. Kielikin on kimuranttia: sävy, konteksti ja paikalliset ilmaukset vaikuttavat siihen, miten ohje ymmärretään.

Lisäksi on kysymys rajasta toiveen ja vastuun välillä. Personoitu ajotyyli kuulostaa miellyttävältä, mutta kuka kantaa vastuun, jos ohje “aja ripeästi” tulkitaan väärin – toivottavasti ei kukaan, sillä järjestelmän pitäisi aina asettaa lait ja turvallisuus etusijalle. Tämä periaate on helppo lausua, mutta sen koodaaminen selkeäksi toiminnaksi monimutkaisessa liikenteessä on vaikeaa.

Kaikesta huolimatta suunta on kiinnostava. Kieli on ihmiselle luontaisin käyttöliittymä, ja jos itseohjautuvat järjestelmät pystyvät käyttämään sitä turvallisesti ja läpinäkyvästi, ajamisesta voi tulla ymmärrettävämpää. Sen sijaan, että auto tekisi “jotain mustan laatikon sisällä”, matkustaja voisi kertoa, mitä toivoo, ja nähdä, miten toive muokkaa reittiä. Samalla kehittäjät saisivat palautetta suoraan siltä kieleltä, jolla me oikeasti kommunikoimme.

Lopulta kyse on vallasta ratissa – ei siitä, siirtyykö se ihmiseltä koneelle, vaan siitä, voimmeko jakaa sitä järkevällä tavalla. Jos auto oppii kuuntelemaan, mitä me oikeasti tarkoitamme, opimmeko mekin puhumaan sille oikein? Ja missä kulkee raja, jossa toiveista tulee vaarallisia?

Paper: https://arxiv.org/abs/2603.25741v1

Register: https://www.AiFeta.com

tekoäly robottiautot liikenne tutkimus kieliteknologia

Read more

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Tekoälyapuria ei kannata valita pelkän esittelytekstin perusteella

Uusi vertailu osoittaa, että sanat ja teot eivät kulje käsi kädessä: oikeat koesuoritukset parantavat hakutuloksia, kun etsitään sopivaa tekoälyapuria tuhansien joukosta. Olet etsimässä verkosta apuria, joka hoitaisi puolestasi arjen askareita: täyttäisi lomakkeen, järjestäisi matkasuunnitelman tai seulisi pitkän asiakirjakasan ydinkohdat. Vastassa on valikoima, joka muistuttaa sovelluskauppaa steroideilla. Jokainen ”tekoälyagentti” lupaa paljon

By Kari Jaaskelainen
Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Hakutulosten kannattaa olla hyödyllisiä, ei vain samankaltaisia

Kielimallien taustahaku paranee, kun osumat valitaan sen mukaan, auttavatko ne vastausta — ja se voi olla yli satakertaisesti nopeampaa kuin nykyinen tapa. Kuvittele, että kysyt työpaikan chat-robotilta: “Mitä viime kuun kokouspäiväkirjassa päätettiin etätyöpäivistä?” Robotti selaa arkistoja ja poimii sinulle pätkän, jossa toistellaan, mitä etätyö tarkoittaa. Teksti on aiheeltaan lähellä kysymystä,

By Kari Jaaskelainen
Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Yksi malli voi pian puhua, soittaa ja kolista – pelkillä tekstiohjeilla

Kun tekee kotivideota, ääni on usein suurin vaiva. Juonto syntyy yhdellä sovelluksella, taustamusiikki toisella ja ukkosen jyrinä kolmannella. Jokainen työkalu ymmärtää erilaisia komentoja, eikä mikään niistä oikein “puhu” toistensa kanssa. Lopputulos on pienen palapelityön tulos. Vuosia on ajateltu, että näin tämän kuuluukin mennä. Puhe on sanoja ja lauseita – hyvin jäsenneltyä.

By Kari Jaaskelainen
Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Tekoälyn kanssa pärjäämme paremmin sopimalla kuin komentamalla

Puhelimesi suosittelee seuraavaa kappaletta, karttasovellus ehdottaa nopeinta reittiä, tekstinkorjaus päättää puolestasi, mitä olit ehkä sanomassa. Harva näistä järjestelmistä tottelee sinua sokeasti. Useammin huomaat itse muokkaavasi tapojasi niiden mukaan – ja ne puolestaan mukautuvat sinuun. Arkinen kokemus paljastaa: emme enää elä maailmassa, jossa kone on vain hiljainen renki. Silti puhe tekoälystä palaa

By Kari Jaaskelainen