Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Moni on tuijottanut Exceliä ja toivonut voivansa vain kysyä: missä kaupunginosissa koti on kävelymatkan päässä terveysasemasta ja ruokakaupasta? Ihmismielelle yksinkertainen pyyntö muuttuu helposti tuntien suodatukseksi ja kaavanviilaukseksi. Tietokone kyllä tietää vastauksen – jos vain osaisimme puhua sen kieltä.

Viime vuosina apua on pyydetty juttelevalta tekoälyltä. Se osaa etsiä ja tiivistää tekstejä, mutta hämmentyy taulukoista ja numeroista. Kun kysymys edellyttää täsmällistä suodatusta – vaikkapa ”paikat, joissa sekä apteekki että päiväkoti ovat alle kilometrin päässä” – tavallinen chatbot ei välttämättä tiedä, miten siitä tehdään täsmäisku tietokantaan.

Tuore arXiv-julkaisu ehdottaa toisenlaista lähestymistapaa: annetaan mallin itse kirjoittaa tietokoneen ymmärtämä kysely. Sen sijaan, että tekoäly kaivaisi vastauksen teksteistä, se kääntää arkikielen käskyiksi, jotka voidaan suorittaa suoraan taulukkoa tai tietokantaa vasten. Näin kysymys ”missä?” vaihtuu muotoon, jonka tietokone osaa käsitellä yksiselitteisesti.

Tutkimus toimii todisteena idean toimivuudesta. Tekijät rakensivat avoimen menetelmän, joka opettaa pienen kielimallin tekemään täsmällisiä tietokantakyselyjä. Opetusdataa – kysymys–vastaus-pareja – tuotettiin synteettisesti, eli automaattisesti, mutta silti niin, että ne vastaavat aidon käyttäjän tarkoitusta ja taulukon merkityksiä. Varsinainen malli on kevyt (DeepSeek R1 Distill 8B), ja sitä harjoitettiin lisää muistia säästävällä tekniikalla, jossa mallin sisäistä esitystä tiivistetään neljän bitin tarkkuuteen. Käytännössä tämä tarkoittaa, että järjestelmä voidaan ajaa tavallisella koneella ilman konesaliluokan laitteita.

Menetelmää testattiin konkreettisessa aineistossa: Espanjan Durangaldean alueen tiedoissa, jotka kuvaavat asukkaiden pääsyä välttämättömiin palveluihin. Kysymykset saattoivat koskea esimerkiksi, mitkä kylät ovat kymmenen minuutin bussimatkan päässä terveyskeskuksesta ja ruokakaupasta tai missä apteekki ja koulu sijaitsevat samassa taajamassa. Mallin tehtävä ei ollut päätellä vastauksia ”mututuntumalla”, vaan tuottaa kysely, joka suodattaa taulukosta juuri ne rivit, jotka täyttävät ehdot.

Tulokset olivat tekijöiden mukaan tarkkoja ja kestäviä. Malli vastasi hyvin yhdellä kielellä, useilla kielillä ja jopa tilanteissa, joissa kysyttiin paikasta, jota se ei ollut aiemmin ”nähnyt”, kunhan taulukon rakenne pysyi samankaltaisena. Tämä on tärkeää, sillä oikeassa elämässä dataa käytetään ristiin: käyttäjät vaihtavat kieltä, ja taulukot kuvaavat uusia alueita tai ajanjaksoja.

Miksi tämä on merkittävää? Suuri osa julkisesta tiedosta on taulukoissa: budjetteja, sairaaloiden jonotietoja, joukkoliikenteen aikatauluja, koulujen sijainteja. Jos arkikysymykset saa käännettyä täsmällisiksi ha’uiksi ilman, että täytyy opetella SQL:n kaltaista tietokantakieltä, kynnys hyödyntää dataa madaltuu. Ja koska malli on pieni ja avoin, sen voi ottaa käyttöön kunnantalolla, luokkahuoneessa tai toimituksessa ilman pilvipalvelun lukkoja tai lisenssikuluja.

Taustalla on myös kriittinen havainto nykyisistä juttelevista järjestelmistä. Suosittu toimintatapa, jossa malli ensin hakee asiakirjoja ja sitten kirjoittaa vastauksen niiden pohjalta, toimii hyvin tarinallisen tekstin kanssa. Numeroiden ja tarkkojen ehtojen kohdalla se kuitenkin horjuu: ”lähinnä” oikein ei riitä, kun täytyy palauttaa juuri ne rivit, jotka täyttävät vaatimukset. Uusi menetelmä kiertää ongelman teettämällä mallilla ensin yksikäsitteisen käskyn tietokannalle.

Esimerkki auttaa hahmottamaan eron. Kysyjällä on taulukko, jossa on kunkin kylän etäisyys terveyskeskuksesta, päiväkodista ja kaupasta. Hän kysyy suomeksi: ”Mitkä kylät täyttävät ehdon: terveyskeskus enintään 10 minuuttia bussilla ja kauppa enintään kilometrin päässä?” Perinteinen chatbot pyrkii selittämään, mitkä paikat ”vaikuttavat” sopivilta, ja voi erehtyä, jos koulutustiedoissa ei ole juuri tätä taulukkoa. Uusi malli kirjoittaa kyselykielen lauseen, joka tarkistaa ehdot taulukosta ja palauttaa vain ne kylät, jotka molemmat rajat täyttävät. Vastauksena ei ole arvaus vaan listaus, joka syntyy suorasta hausta.

Onko tämä ongelmaton ratkaisu? Ei. Tutkimus näyttää lupaavalta yhdessä tärkeässä aineistossa, mutta toistaiseksi näyttö on rajattu: yksi aihepiiri, yksi alue, vaikka kysymysten kieli vaihtuikin. Tekijät uskovat menetelmän soveltuvan laajemminkin, mutta se on vielä osoitettava eri aloilla ja erilaisten taulukkorakenteiden kanssa. Synteettinen opetusdata on tehokas keino, mutta se voi ohittaa reunatapauksia, joita oikeat käyttäjät kysyvät. Ja vaikka malli tuottaa suoritettavia kyselyjä, on varmistettava, että ne suoritetaan vain luotettuihin tietolähteisiin eivätkä paljasta tai vahingoita mitään – kysely on lopulta käsky.

On myös inhimillinen näkökulma. Kun kysymisen kynnys madaltuu, vastuun rajat hämärtyvät: jos vastaus tulee suoraan taulukosta, mutta taulukko on puutteellinen, kuka huomaa sen? Ja jos malli toimii pienelläkin koneella, sen käyttöönotto on helppoa – mutta myös helpompi unohtaa dokumentoida, mitä tarkalleen kysyttiin.

Silti suunta on selvä. Sen sijaan, että opetamme ihmiset puhumaan tietokannan kieltä, opetamme pienen, avoimen mallin puhumaan ihmisen kieltä yhteen suuntaan ja tietokannan kieltä toiseen. Jos tämä yleistyy, dataan kytkeytyvät kysymykset voivat muuttua yhtä luonnollisiksi kuin kartan zoomaus. Seuraava askel onkin käytännöllinen: kun kunta, toimitus tai kansalaisjärjestö voi kysyä taulukoilta suoraan, mitä uutta julkisesta datasta alamme huomata, kun sitä voi vihdoin kysyä kuin ihmistä?

Paper: https://arxiv.org/abs/2604.03057v1

Register: https://www.AiFeta.com

tekoäly data tietokannat luonnollinen_kieli julkistieto tutkimus Espanja

Read more

Tekoäly vastaa fiksummin, kun sille annetaan oikea tieto oikealla tavalla

Tekoäly vastaa fiksummin, kun sille annetaan oikea tieto oikealla tavalla

Katsaus kokoaa, miten kielimalleja voi vahvistaa antamalla niille jäsenneltyä lisätietoa vastaushetkellä – yksinkertaisista vihjeistä aina syy–seurausketjuiksi järjestettyyn taustaan. Kuvittele, että pyydät tekoälyä selittämään, mitä uusi lakimuutos tarkoittaa pienyrittäjälle. Yleismallinen kielimalli osaa puhua aiheesta sujuvasti, mutta jos laki on muuttunut äskettäin, vastauksessa voi olla vanhaa tietoa tai epävarmoja arvailuja. Sama kokemus

By Kari Jaaskelainen
Tekoäly voi olla sekä nopea että säästeliäs – jos se oppii milloin ajatella ääneen

Tekoäly voi olla sekä nopea että säästeliäs – jos se oppii milloin ajatella ääneen

Kuvittele chat-ikkuna, jossa vastaus alkaa rönsyillä: ensin pari perustelua, sitten varmistus, lopulta vielä varmistuksen varmistus. Käyttäjä odottaa, laskutus juoksee. Tekoälymallit hinnoitellaan usein “tokeneina” – sananpaloina – joten jokainen turha kiemura maksaa sekä aikaa että rahaa. Vuosia alalla vallitsi hiljainen oletus: mitä enemmän mallilla on laskentatehoa ja mitä pidemmin se ”miettii”, sitä parempaa

By Kari Jaaskelainen