RxSafeBench: A reality check on AI medication safety

RxSafeBench: A reality check on AI medication safety

AI assistants are getting better at healthcare tasks—but are they safe when it comes to medications? A new study introduces RxSafeBench, a realistic test to see whether large language models (LLMs) can spot medication risks during simulated doctor-patient chats.

Using a curated RxRisk DB (6,725 contraindications, 28,781 drug interactions, 14,906 indication-drug pairs) and a two-stage clinical review, the team built 2,443 high-quality consultation scenarios with embedded risks. Leading open and proprietary LLMs were asked to choose safe treatments based on each patient's context.

  • Result: Current LLMs often miss contraindications and interactions—especially when the danger is implied, not stated.
  • Implication: Better prompting and task-specific tuning help, but safety gaps remain.
  • Contribution: RxSafeBench offers the first comprehensive benchmark for medication safety in LLMs.

Why it matters: Reliable AI should protect patients from harmful prescriptions, not just provide quick answers. This benchmark gives researchers and developers a common yardstick to build—and verify—safer clinical AI.

Paper: http://arxiv.org/abs/2511.04328v1

Paper: http://arxiv.org/abs/2511.04328v1

Register: https://www.AiFeta.com

#AI #Healthcare #PatientSafety #MedicationSafety #LLMs #NLP #ClinicalAI #Benchmark #Pharmacovigilance

Read more

Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Pieni kielimalli oppi kysymään taulukoilta ihmisen puolesta

Moni on tuijottanut Exceliä ja toivonut voivansa vain kysyä: missä kaupunginosissa koti on kävelymatkan päässä terveysasemasta ja ruokakaupasta? Ihmismielelle yksinkertainen pyyntö muuttuu helposti tuntien suodatukseksi ja kaavanviilaukseksi. Tietokone kyllä tietää vastauksen – jos vain osaisimme puhua sen kieltä. Viime vuosina apua on pyydetty juttelevalta tekoälyltä. Se osaa etsiä ja tiivistää tekstejä,

By Kari Jaaskelainen
Tekoäly vastaa fiksummin, kun sille annetaan oikea tieto oikealla tavalla

Tekoäly vastaa fiksummin, kun sille annetaan oikea tieto oikealla tavalla

Katsaus kokoaa, miten kielimalleja voi vahvistaa antamalla niille jäsenneltyä lisätietoa vastaushetkellä – yksinkertaisista vihjeistä aina syy–seurausketjuiksi järjestettyyn taustaan. Kuvittele, että pyydät tekoälyä selittämään, mitä uusi lakimuutos tarkoittaa pienyrittäjälle. Yleismallinen kielimalli osaa puhua aiheesta sujuvasti, mutta jos laki on muuttunut äskettäin, vastauksessa voi olla vanhaa tietoa tai epävarmoja arvailuja. Sama kokemus

By Kari Jaaskelainen
Tekoäly voi olla sekä nopea että säästeliäs – jos se oppii milloin ajatella ääneen

Tekoäly voi olla sekä nopea että säästeliäs – jos se oppii milloin ajatella ääneen

Kuvittele chat-ikkuna, jossa vastaus alkaa rönsyillä: ensin pari perustelua, sitten varmistus, lopulta vielä varmistuksen varmistus. Käyttäjä odottaa, laskutus juoksee. Tekoälymallit hinnoitellaan usein “tokeneina” – sananpaloina – joten jokainen turha kiemura maksaa sekä aikaa että rahaa. Vuosia alalla vallitsi hiljainen oletus: mitä enemmän mallilla on laskentatehoa ja mitä pidemmin se ”miettii”, sitä parempaa

By Kari Jaaskelainen