Illusions of Confidence? Testing LLM Truthfulness with Neighborhood Consistency

Illusions of Confidence? Testing LLM Truthfulness with Neighborhood Consistency

TL;DR

Large language models can sound confident, but if you nudge the context, their beliefs can fall apart. This paper proposes a better way to check if an AI keeps its story straight.

  • Problem: Popular checks like self-consistency can hide brittle knowledge. Answers that look reliable vanish under mild rewording or distracting details.
  • Solution — Neighbor-Consistency Belief (NCB): Measure whether answers stay coherent across a neighborhood of related prompts and contexts.
  • Stress test: A cognitive interference protocol that perturbs context to probe stability.
  • Results: High-NCB data resists interference, and a new Structure-Aware Training method cuts long-tail brittleness by ~30%.
  • Why it matters: More truthful, robust AIs for real-world use—not just confident-sounding ones.

Paper: https://arxiv.org/abs/2601.05905

Code: https://github.com/zjunlp/belief

Paper: https://arxiv.org/abs/2601.05905v1

Register: https://www.AiFeta.com

AI LLM NLP Robustness TrustworthyAI MachineLearning Research Evaluation

Read more

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Keittiössä pieni muutos reseptiin – ripaus suolaa vähemmän tai tilkka sitruunaa enemmän – voi muuttaa ruoan luonteen. Tekoälyä opetettaessa resepti on data: kuvat, tekstit ja äänitteet, joista malli oppii. Uusi esijulkaistu tutkimus väittää, että aivan pienet, lähes huomaamattomat muokkaukset tähän aineistoon voivat riittää kääntämään mallin käytöstä haluttuun suuntaan. Moni on tottunut ajatukseen,

By Kari Jaaskelainen
Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä. Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei

By Kari Jaaskelainen