Teaching Humanoid Robots to Team Up—By Watching Humans

Teaching Humanoid Robots to Team Up—By Watching Humans

Humanoid robots need to coordinate physically with people—lifting, handing over, steadying—but we lack data of humans interacting with robots. What if they learned from humans interacting with humans? The catch: simply mapping human motions onto a robot often breaks crucial touches and supports.

The team proposes PAIR (Physics-Aware Interaction Retargeting), which keeps contact semantics—like handshakes, pushes, and holds—consistent despite different body shapes. PAIR generates physically believable human–robot training data from abundant human–human videos.

Data alone isn’t enough. Conventional imitation just mimics trajectories. Their policy, D-STAR (Decoupled Spatio-Temporal Action Reasoner), separates when to act from where to act: Phase Attention learns timing, a Multi-Scale Spatial module picks targets, and a diffusion head blends them for synchronized whole‑body behavior.

In extensive simulations, this combo produces more responsive, coordinated interactions than baseline methods—pointing to a practical path for teaching robots collaborative skills from widely available human–human footage. Paper: https://arxiv.org/abs/2601.09518v1

Paper: https://arxiv.org/abs/2601.09518v1

Register: https://www.AiFeta.com

Robotics Humanoid AI ImitationLearning HumanRobotInteraction ComputerVision Simulation DiffusionModels

Read more

Tekoälyavustaja on taitavimmillaan, kun se ponnistelee vain silloin kun päätös on aidosti vaikea

Tekoälyavustaja on taitavimmillaan, kun se ponnistelee vain silloin kun päätös on aidosti vaikea

Kuka tahansa on klikkaillut verkkopalvelussa väärää nappia ja huomannut olevansa takaisin lähtöruudussa. Ihminen oppii nopeasti: selvässä tilanteessa ei jäädä märehtimään, epävarmassa pysähdytään ja tarkistetaan. Sama periaate alkaa hiipiä myös verkkosivuilla toimiviin tekoälyavustajiin. Vielä hiljattain ajateltiin, että tekoälyn suoritusta voi parantaa yksinkertaisesti antamalla sille enemmän ”miettimisaikaa” joka vaiheessa. Kun malli kirjoittaa,

By Kari Jaaskelainen
Kielimallin huomio toimii yllättävän hyvin pitkien tekstien hakijana

Kielimallin huomio toimii yllättävän hyvin pitkien tekstien hakijana

Moni tuntee tilanteen: edessä on 180-sivuinen raportti, ja pitäisi löytää vastaus yhteen täsmäkysymykseen. Hakutoiminto löytää kymmeniä osumia, mutta oikea kohta on aina sen taulukon alaviitteessä tai liitteessä, johon teksti viittaa. Sama ongelma vaivaa myös älykkäitä keskustelubotteja. Ne lupaavat lukea pitkät tiedostot, mutta harhailevat helposti väärään kappaleeseen tai vastaavat luottavaisesti hutiin.

By Kari Jaaskelainen
Koneesta tulee tarkempi, kun sille antaa hetken miettiä

Koneesta tulee tarkempi, kun sille antaa hetken miettiä

Moni kuvankäsittelysovellus lupaa taikoja yhdellä napilla: poista kahvikuppi pöydältä, kirkasta kasvot, vaihda tausta. Usein tulos on kelvollinen – kunnes pieni yksityiskohta lipsahtaa. Nenäkatse jää epätarkaksi, varjo unohtuu tai reunaan jää outo haamu. Taustalla on tyypillinen tapa, jolla tekoälyä on käytetty: se antaa vastauksen kerralla, ilman että pysähtyy tarkistamaan itseään. Ajatus, että

By Kari Jaaskelainen