Validity Is What You Need

Share
Validity Is What You Need

What is "Agentic AI" really? Sebastian Benthall and Andrew Clark argue it’s best seen as a software delivery mechanism—like SaaS—that lets an application work autonomously inside complex enterprises.

  • Applications first: Agentic AI systems should be judged as products, not as foundation models.
  • Validate with users: Success depends on measures that principal users and stakeholders can check in real workflows—very different from LLM benchmark scores.
  • Simpler can win: Once you have solid validation, the core logic can often be handled by simpler, faster, more interpretable models.
  • LLMs are a means, not the end: They’re one option to reach validated performance—not a requirement.
When it comes to Agentic AI, validity is what you need.

Bottom line: Build for operational validity, then choose the simplest tech that passes the bar.

Paper: http://arxiv.org/abs/2510.27628v1

Register: https://www.AiFeta.com

AgenticAI AI Validation LLM SaaS Enterprise ProductManagement MLOps Reliability

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen