RxSafeBench: A reality check on AI medication safety

Share
RxSafeBench: A reality check on AI medication safety

AI assistants are getting better at healthcare tasks—but are they safe when it comes to medications? A new study introduces RxSafeBench, a realistic test to see whether large language models (LLMs) can spot medication risks during simulated doctor-patient chats.

Using a curated RxRisk DB (6,725 contraindications, 28,781 drug interactions, 14,906 indication-drug pairs) and a two-stage clinical review, the team built 2,443 high-quality consultation scenarios with embedded risks. Leading open and proprietary LLMs were asked to choose safe treatments based on each patient's context.

  • Result: Current LLMs often miss contraindications and interactions—especially when the danger is implied, not stated.
  • Implication: Better prompting and task-specific tuning help, but safety gaps remain.
  • Contribution: RxSafeBench offers the first comprehensive benchmark for medication safety in LLMs.

Why it matters: Reliable AI should protect patients from harmful prescriptions, not just provide quick answers. This benchmark gives researchers and developers a common yardstick to build—and verify—safer clinical AI.

Paper: http://arxiv.org/abs/2511.04328v1

Paper: http://arxiv.org/abs/2511.04328v1

Register: https://www.AiFeta.com

#AI #Healthcare #PatientSafety #MedicationSafety #LLMs #NLP #ClinicalAI #Benchmark #Pharmacovigilance

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen