Open-weight genome AI: why data filtering isn't enough

Share
Open-weight genome AI: why data filtering isn't enough

Can we keep open-weight genome AI models safe just by removing pathogen sequences from their training data? A new study tests that idea and finds it's not enough.

  • Researchers assessed a state-of-the-art genomic language model and showed that post-release fine-tuning on sensitive pathogen data can partially restore risky capabilities.
  • The fine-tuned model performed better on unseen viral sequences and even generalized to spot immune-evading variants, despite not seeing those exact viruses during fine-tuning.
  • Bottom line: dataset filtering alone is brittle for safeguarding open-weight biology models.

The authors urge layered safeguards: stronger model evaluations, clearer release norms for open weights, and technical mitigations that hold up under adversarial fine-tuning.

Paper: https://arxiv.org/abs/2511.19299v1

Paper: https://arxiv.org/abs/2511.19299v1

Register: https://www.AiFeta.com

#Genomics #AI #Biosecurity #ResponsibleAI #OpenSource #ML #Safety

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen