When Bias Pretends to Be Truth in AI

Share
When Bias Pretends to Be Truth in AI

Large language models can sound confident even when they are wrong. This study pinpoints a sneaky culprit: spurious correlations — statistical shortcuts like linking certain surnames to a nationality. Models absorb these patterns from data and then answer with high certainty, even when the link is false.

What the researchers found

  • These bias-driven errors are produced confidently.
  • Making models bigger does not fix them.
  • Popular detectors — confidence filters and inner-state probing — often miss them.
  • They persist even after refusal or safety fine-tuning.

Why? A model’s confidence often tracks how common a pattern is in training data, not whether it is true. When the pattern is spurious, confidence misleads both the model and our detectors.

What’s needed: methods that audit correlations, run counterfactual checks, and stress-test models with controlled synthetic data — instead of trusting confidence alone.

Bias can masquerade as truth — and our detectors can be fooled, too.

Paper by Shaowen Wang, Yiqi Dong, Ruinian Chang, Tansheng Zhu, Yuebo Sun, Kaifeng Lyu, and Jian Li. Read: http://arxiv.org/abs/2511.07318

Paper: http://arxiv.org/abs/2511.07318v1

Register: https://www.AiFeta.com

ai llms hallucinations bias spuriouscorrelations trustworthyai evaluation machinelearning research

Read more

Kielimallit tekevät vaatimuskysymyksiä eri tyyleillä – ja tyyli riippuu käyttötarkoituksesta

Kielimallit tekevät vaatimuskysymyksiä eri tyyleillä – ja tyyli riippuu käyttötarkoituksesta

Uusi vertailu näyttää, että tekoälyn tapa muotoilla järjestelmävaatimuksia luonnollisen kielen kysymyksiksi vaihtelee mallin ja aiheen mukaan. Siksi tärkeintä ei ole valita ”parasta” mallia, vaan tilanteeseen sopiva. Kuvitellaan tuttu kokous: pöydän ääressä yritetään päättää, mitä uuden tietojärjestelmän pitää pystyä tekemään. Syntyy lista kysymyksiä, joihin järjestelmän on osattava vastata. Esimerkiksi: ”Mitkä lääkkeet

By Kari Jaaskelainen
Julkaistu ajattelu voidaan jo purkaa tekoälyksi

Julkaistu ajattelu voidaan jo purkaa tekoälyksi

Kun tutkija jättää työpöytänsä, hänen äänensä ei välttämättä vaikene. Pelkistä julkaisuista voidaan jo rakentaa tekoäly, joka ohjaa väitöskirjaa, arvioi artikkeleita ja väittelee paneelissa – uskottavasti. Useimmat meistä ajattelevat tutkimusartikkeleita kirjastoiksi: hyllyriveiksi ajatuksia, joihin muut voivat palata. Uusi arXivissa julkaistu esityspaperi ehdottaa toisenlaista kuvaa. Julkaisut ovatkin rakennuspiirustuksia, joista voidaan koota tekijänsä ajattelutapa

By Kari Jaaskelainen
Konferenssien suunta ei ole pakko syntyä suljettujen ovien takana

Konferenssien suunta ei ole pakko syntyä suljettujen ovien takana

Moni tietää tunteen seminaarin päätteeksi: ohjelma oli kiinnostava, mutta kuka päätti, mistä puhuttiin ja mistä ei? Usein vastaus on pieni ohjelmakomitea, joka tekee valinnat ennakkoon. Yleisö kuuntelee, harva vaikuttaa. Eräässä tekoälyn yhteiskunnallisia vaikutuksia käsittelevässä kansainvälisessä konferenssissa kokeiltiin toisenlaista tapaa. Osallistujat eivät vain tulleet paikalle – he auttoivat muokkaamaan itse tilaisuuden suuntaa.

By Kari Jaaskelainen