DigiData: Training and Evaluating General-Purpose Mobile Control Agents

Share
DigiData: Training and Evaluating General-Purpose Mobile Control Agents

Meet DigiData: AI that can use your phone

Imagine an assistant that taps, swipes, and navigates apps to finish tasks for you. This paper introduces DigiData—a large, diverse, multi-modal dataset built to train mobile control agents to do exactly that.

  • Richer goals: Instead of scraping random user logs, DigiData maps app features through systematic exploration, yielding harder, more human-relevant tasks.
  • Real-world testing: DigiData-Bench evaluates agents on complex mobile workflows, not toy demos.
  • Better metrics: The popular “step accuracy” score can mislead. The authors propose dynamic protocols and AI-powered reviews that judge whether an agent actually completes the task.

Why it matters: Stronger data and fairer evaluations speed up progress toward trustworthy, helpful phone agents—and safer automation of everyday digital chores.

Paper: http://arxiv.org/abs/2511.07413v1

Paper: http://arxiv.org/abs/2511.07413v1

Register: https://www.AiFeta.com

#AI #Mobile #Agents #Dataset #Benchmark #MachineLearning #HCI #UX #Evaluation #MobileAI

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen