Lääkekehityksen aarteet piilevät yhä useammin kielimuurien takana

Lääkekehityksen aarteet piilevät yhä useammin kielimuurien takana

Kun suurin osa patenteista ja kasvava tutkimus syntyy Yhdysvaltain ulkopuolella, englanninkielisiin lähteisiin nojaava tiedonhaku jättää löytöjä pöydälle – tuore esijulkaisu ehdottaa lääkekohteiden etsintään ankarampaa testiä ja näyttää, että uudentyyppinen tekoäly voi paikata aukkoja.

Kuvittele sijoittaja, joka etsii uutta lupaavaa lääkeideaa. Hän kirjoittaa englanniksi avainsanat tuttuihin tietokantoihin ja saa listan samoja nimiä, jotka kaikki kilpakumppanitkin näkevät. Samaan aikaan toisella puolella maailmaa paikallinen yhtiö julkaisee varhaiset tulokset alueellisessa arkistossa – kiinaksi. Se ei näy englanninkielisissä hakutuloksissa eikä päädy kansainvälisiin uutiskirjeisiin. Mahdollisuus lipeää ohi, koska sitä ei koskaan nähty.

Biolääkkeissä on pitkään eletty oletuksella, että tärkein tieto löytää tiensä suurten länsimaisten julkaisujen, tietokantojen ja konferenssien kautta kaikkien ulottuville. Tuore arXiv-esijulkaisu ravistelee tätä käsitystä esittämällä yksinkertaisen, mutta hankalan faktan: yhä suurempi osa uusista lääkeaihioista syntyy ja esitellään kanavissa, jotka eivät ole englanniksi eivätkä Yhdysvalloissa.

Luvut ovat hätkähdyttäviä. Tekijöiden kokoamien tilastojen mukaan yli 85 prosenttia patenteista jätetään Yhdysvaltain ulkopuolella, ja Kiina vastaa lähes puolesta maailman patenttivirtaa. Myös tieteellisten julkaisujen painopiste on liukumassa muualle. Alan arvioissa Kiina vastaa jo noin 30 prosentista globaalia lääkekehitystä, yli 1 200 uuden lääke-ehdokkaan voimin. Jos etsintä kohdistuu vain englanninkielisiin lähteisiin, iso osa todellisista vaihtoehdoista jää piiloon.

Tässä on jännite, joka määrittää miljardien eurojen pelejä: aikaisemmin ajateltiin, että hyvä haku on nopea ja terävä – parhaat nimet nousevat pintaan kuin itsestään. Nyt ehdotetaan, että tärkeintä on kattavuus: löytää myös ne hiljaiset, paikalliset signaalit ilman että kone keksii omiaan. Tutkimus käyttää tätä väitettä todisteena siitä, että nykyiset ”syvän haun” tekoälytyökalut kompuroivat kahdessa vaikeassa asiassa yhtä aikaa: monikielisyydessä ja sirpaleisissa lähteissä.

Tekijät eivät julkaisseet vain uutta työkalua, vaan myös ankaramman testin, jolla lääkekohteiden etsintää voi mitata. He rakensivat monikielisen testiaineiston, jossa käyttäjien kysymykset ovat hankalia ja ”oikeat vastaukset” eli lupaavat lääkeaihioiden nimet löytyvät usein Yhdysvallat-keskeisen tutkan ulkopuolelta. Kysymysten lähtökohtina käytettiin sijoittajien ja yritysostojen ammattilaisten todellisia seulontateemoja, jotta tilanne muistuttaisi tosielämää. Vastaukset arvioitiin tekoälyarvioijalla, jonka kriteerit sovitettiin yhteen asiantuntijoiden mielipiteiden kanssa.

Tämän kehikon sisällä tekijät vertasivat omaa ”Bioptic Agent” -nimistä järjestelmäänsä useisiin tunnettuihin tekoälyihin ja verkkotutkimustyökaluihin (mukaan lukien Claude Opus 4.6, GPT-5.2 Pro, Perplexity Deep Research, Gemini 3 Pro + Deep Research ja Exa Websets). Mittarina käytettiin pistelukua, joka palkitsee sekä sen, kuinka monta oikeaa kohdetta löytyy, että sen, kuinka vähän virheitä tehtiin. Bioptic Agent ylsi 79,7 pisteeseen. Seuraavina tulivat Claude (56,2), Gemini (50,6), GPT (46,6), Perplexity (44,2) ja Exa (26,9). Ero on suuri – ja käytännössä se tarkoittaa, että uusi menetelmä löysi useammin oikeat nimet ilman turhia harharetkiä.

Miten tämä näkyy arjessa? Otetaan konkreettinen esimerkki. Sijoittaja etsii varhaisen vaiheen lääkkeitä harvinaiseen syöpään. Osa kehittäjistä on pieniä yhtiöitä Aasiassa, ja tiedonjyvät on ripoteltu paikallisiin patenttitietokantoihin, alueellisiin uutisartikkeleihin ja yliopistojen sivuille. Tavallinen haku löytää ne yritykset, jotka jo puhuvat englanniksi ja ovat mukana kansainvälisissä rekistereissä. Uudenlainen agentti taas lähestyy tehtävää kuin seikkailija kartalla: se tekee useita rinnakkaisia hakuja eri kielillä, kokoaa löydökset yhteen, tarkistaa lähteet ristiin ja karsii näkyviin vain sen, mikä on varmistettavissa. Silloin myös hiljaiset signaalit nousevat: nimi, joka ei ole vielä jokaisen tutkalla.

Tekijät korostavat, että suorituskyky paranee jyrkästi, kun agentille antaa lisää laskenta-aikaa ja -tehoa. Siinä on samalla lupaus ja varoitus. Laskentateho maksaa rahaa ja energiaa, eikä kaikilla ole varaa tai halua pyörittää pitkiä hakuja. Jos paras kattavuus edellyttää raskasta konevoimaa, syntyy helposti kuilu niiden välille, jotka voivat sitä ostaa, ja niiden, joille jää kevyemmät, osittaiset näkymät.

Tutkimuksessa on muitakin rajoitteita. Aineisto, jolla menetelmiä mitattiin, on tekijöiden rakentama – ja vaikka he tekivät sen monikielisesti ja asiantuntijoiden lähtöehdoilla, jokainen testi suosii väistämättä tietynlaista lähestymistapaa. Arviointi tehtiin tekoälyn avulla, tosin asiantuntijoiden kalibroimana. Se on käytännöllistä, mutta herättää kysymyksen: palkitseeko tuomari piirteitä, joita se itse ymmärtää parhaiten? Lisäksi esijulkaisu ei ole vertaisarvioitu, eikä se kerro, miten järjestelmä pärjää esimerkiksi maksullisten tietokantojen tai rajattujen kumppanidatojen kanssa – paikkojen, joissa iso osa tosielämän etsinnästä tapahtuu. Ja vaikka tavoitteena on ”ei keksittyjä vastauksia”, mikään malli ei ole erehtymätön.

Silti viesti on selvä ja tärkeä: jos lääkeinnovaatio virtaa yhä useammin alueellisissa kanavissa ja muilla kielillä, kilpailu ei ratkea sillä, kuka huutaa kovimmin, vaan sillä, kuka kuulee hiljaisimman kuiskauksen. Se muuttaa myös vastuunjakoa. Onko oikein, että tulevaisuuden lääkelöydöt riippuvat siitä, kenen tekoäly ehtii ensimmäisenä lukemaan kaikki kielet läpi? Vai pitäisikö julkisten rekisterien ja julkaisujen muuttua niin, että olennaiset signaalit ovat aidosti kaikkien nähtävissä – myös ilman superkoneita?

Paper: https://arxiv.org/abs/2602.15019v1

Register: https://www.AiFeta.com

tekoäly lääkekehitys tutkimus kielimuuri sijoittaminen Kiina patentit

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

By Kari Jaaskelainen
Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

By Kari Jaaskelainen
Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

By Kari Jaaskelainen
Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,

By Kari Jaaskelainen