Marsia voi pian kysyä sanoin, ei vain pikselein

Marsia voi pian kysyä sanoin, ei vain pikselein

Kun kirjoitamme puhelimen karttaan “kahvila puiston lähellä”, sovellus ymmärtää mistä puhumme ja näyttää ehdotukset hetkessä. Avaruustutkijoiden arki on ollut toisenlainen: miljardit kuvat toisen planeetan pinnasta ovat olleet riveinä ja sarakkeina, pikseleinä ilman sanoja. Jos halusit etsiä jokiuoman tai tuulen muovaaman harjanteen Marsista, piti ensin päättää, millaisia muotoja ylipäätään etsitään, määritellä ne tarkasti ja opettaa koneelle esimerkkejä. Vasta sitten saattoi ryhtyä selaamaan.

Nyt tätä rutiinia ehdotetaan käännettäväksi nurin. ArXivissa julkaistu tutkimus esittelee menetelmän, joka antaa Marsin kartoitukseen hakukentän: kirjoitat kuvauksen arkikielellä, ja järjestelmä poimii koko planeetan kattavasta kuvavarannosta kohdat, jotka vastaavat pyyntöäsi. Ei valmiiksi laadittuja luokkia, ei käsin tehtyä luokitusta – vain kysymys ja vastaus.

Jännite on selvä. Aiempi tapa nojasi ennalta määrättyihin laatikoihin: “kraatteri”, “dyyni”, “laavauoma”. Menetelmä toimi hyvin, kun tiedettiin tarkalleen, mitä etsitään. Huonosti se taipui avoimiin kysymyksiin – sellaisiin, joita tutkija muotoilee työn edetessä. Uusi lähestymistapa yrittää tehdä kartoituksesta yhtä joustavaa kuin nettihaku.

Tutkimuksessa kuvattu työkalu, MarScope, yhdistää kuvat ja sanat samaan “ymmärrykseen” maailmasta. Se on opetettu yli 200 000 kuvasta ja niitä kuvailevasta tekstistä. Ajatuksena on, että kone oppii, minkälaiset visuaaliset piirteet liittyvät esimerkiksi kraattereihin, jokiuomiin tai tuulen kasaamiin alueisiin – ei valmiiksi koodattuina, vaan esimerkkien kautta. Kun käyttäjä kirjoittaa pyynnön, järjestelmä etsii planeetan laajuisesta kuva-arkistosta kohdat, jotka muistuttavat pyyntöä vastaavia esimerkkejä.

Mitä tämä tarkoittaa käytännössä? Kuvittele, että haluat kysyä: “Missä näkyy tuulen kasaamia, aallonharjamaisia hiekkakumpuja?” Sen sijaan, että kokoaisit opetuspaketin “dyyni”-luokasta, kirjoitat kuvauksen. Menetelmä käy läpi Marsin kuvia ja nostaa esiin alueet, joissa esiintyy hakua vastaavia kuvioita. Tai: löydät yhdestä alueesta kiinnostavan, mahdollisesti veden muovaaman uoman. Voit pyytää järjestelmää etsimään “samankaltaisia uomia” muualta – ei siksi, että niille olisi valmiiksi annettu luokka, vaan siksi, että ne näyttävät samalta.

Tutkijat raportoivat, että haut läpi koko planeetan valmistuvat noin viidessä sekunnissa heidän kokeissaan. Suorituskykyä mitattiin muun muassa F1-luvulla, joka yhdistää kahden arkijärjellä ymmärrettävän asian – kuinka usein järjestelmä osuu oikeaan ja kuinka paljon oikeista kohteista se todella löytää – yhdeksi mittariksi. Parhaimmillaan luku ylsi arvoon 0,978, mikä viittaa erittäin hyvään osuvuuteen arvioiduissa tehtävissä.

Uutta ei ole vain hakukenttä. Tutkimuksen mukaan menetelmä ei rajoitu muotojen nimeämiseen, vaan voi auttaa tulkitsemaan myös prosesseja: onko jokin piirre todennäköisesti virtaavan nesteen vai tuulen työn tulosta? Lisäksi se voi kartoittaa “samankaltaisuutta” laajoilla alueilla, mikä on geologille hyödyllistä, kun etsitään analogioita ja poikkeuksia. Tällainen joustavuus on ollut vaikeaa järjestelmille, jotka nojaavat ennalta päätettyihin kategorioihin.

On silti syytä pysyä maltillisena. Menetelmä oppii siitä, mistä se on opetettu. Koska MarScope on koulutettu yli 200 000 kuva–teksti-parilla Marsista, sen kyky ymmärtää ja yleistää rajoittuu väistämättä siihen, millaisia esimerkkejä opetusaineistossa on ollut. Jos jokin piirre on harvinainen tai huonosti kuvattu, sen löytäminen on vaikeaa myös älykkäälle haulle. Sanojen monimerkityksisyys voi sekin sotkea: “kanava” voi viitata uomaan, mutta myös ihmisen tekemään rakenteeseen, joita Marsissa ei ole. Siksi hakujen laatiminen ja tulosten tulkinta vaatii edelleen asiantuntijan harkintaa.

Myös suorituskyvyn numerot ansaitsevat kontekstin. F1-luku 0,978 on korkea, mutta se on “jopa” arvo – ei kaikissa tehtävissä saavutettu keskiarvo. Ja viiden sekunnin vastausaika kertoo siitä, miten järjestelmä toimi tutkimusympäristössä, ei lupaa jokaiselle käyttäjälle missä tahansa. Nämä huomiot eivät vähennä tuloksen kiinnostavuutta, mutta muistuttavat, että kyse on tutkimusvaiheessa olevasta tekniikasta, joka kehittyy ja jota pitää koetella erilaisissa olosuhteissa.

Silti suunnanmuutos on merkittävä. Avaruuden kuvavarastot – Marsin lisäksi Kuun, asteroidien ja oman Maamme – kasvavat kiihtyvää tahtia. Tutkijoiden aika ei. Jos kuvien selailu muuttuu kysymysten esittämiseksi suoraan omalla kielellä, kynnys kokeilla, yhdistellä ja etsiä yllättävää madaltuu. Tutkimus vihjaa vielä suurempaan lupaukseen: että sama ajatus, kuvien ja sanojen yhteinen “kieli”, voisi toimia yleisenä rajapintana valtaviin paikkatietoaineistoihin. Se olisi uusi tapa tehdä löytöjä, ei vain uusi työkalu vanhaan prosessiin.

Entä jos tulevaisuuden avaruuslaboratoriossa ensimmäinen analyysi ei olekaan koodinpätkä tai luokituskaavio, vaan kysymys: “Mitä täällä oikeastaan tapahtui?” Jos kone osaa vastata nopeasti ja riittävän hyvin, seuraava kysymys kuuluu meille: mitä alamme kysyä, kun pikseleistä tulee sanoja?

Paper: https://arxiv.org/abs/2601.15949v1

Register: https://www.AiFeta.com

Mars tekoäly kuvantaminen paikkatieto tiede

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen