Can AI Spot Nonsense in Pictures? Meet UAIT

Can AI Spot Nonsense in Pictures? Meet UAIT

Can AI spot nonsense in pictures?

Humans can tell that “A sandwich cuts a chef” is grammatically fine but semantically absurd. Many vision-language models (VLMs) can’t. UAIT (Uncommon-sense Action Image-Text) is a new benchmark that stress-tests whether VLMs truly understand who is doing what to whom—and what’s physically possible.

  • Synthesized uncommon action scenes via large language models, prompt engineering, and text-to-image tools.
  • Each image–caption pair comes with a carefully designed multiple-choice question for fine-grained reasoning.
  • Evaluated state-of-the-art VLMs against humans and contrastive baselines.

Findings: All models trail humans by a wide margin, especially when distinguishing grammatical correctness from real-world plausibility. Yet even lightweight models improve notably with targeted fine-tuning—showing strong potential for directional adaptation.

Why it matters: Beyond pattern-matching, next-gen AI must build real visual semantic reasoning. UAIT is both a diagnostic tool and a roadmap for training more robust, commonsense-aware systems.

Paper: https://arxiv.org/abs/2601.07737v1 — by Chen Ling and Nai Ding.

Paper: https://arxiv.org/abs/2601.07737v1

Register: https://www.AiFeta.com

AI ComputerVision VLM MachineLearning Commonsense Dataset Benchmark Research

Read more

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Keittiössä pieni muutos reseptiin – ripaus suolaa vähemmän tai tilkka sitruunaa enemmän – voi muuttaa ruoan luonteen. Tekoälyä opetettaessa resepti on data: kuvat, tekstit ja äänitteet, joista malli oppii. Uusi esijulkaistu tutkimus väittää, että aivan pienet, lähes huomaamattomat muokkaukset tähän aineistoon voivat riittää kääntämään mallin käytöstä haluttuun suuntaan. Moni on tottunut ajatukseen,

By Kari Jaaskelainen
Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä. Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei

By Kari Jaaskelainen