Adversarial Exploitation of Policy Imitation

Share
Adversarial Exploitation of Policy Imitation

Can someone copy a black-box robot brain just by watching how it acts? This study says yes.

Researchers Vahid Behzadan and William Hsu show that deep reinforcement learning (DRL) agents—used in games, robotics, and trading—can be cloned via policy imitation. An attacker who can repeatedly query an agent (ask for its action in many situations) can build a new dataset and learn a look‑alike policy. That replica then enables black‑box attacks that push the original agent toward bad decisions, threatening both confidentiality (the policy can be stolen) and integrity (it can be manipulated).

Why it matters: Unlike classic classifier theft, this attack leverages imitation learning—a standard DRL tool—so extraction is practical without access to rewards or model internals.

Mitigations discussed include rate‑limiting and auditing queries, adding randomness or noise to outputs, watermarking behaviors, detecting imitation attempts, and training with adversarial scenarios.

Paper: http://arxiv.org/abs/1906.01121v1

Paper: http://arxiv.org/abs/1906.01121v1

Register: https://www.AiFeta.com

#AI #ReinforcementLearning #Security #AdversarialML #ModelExtraction #ImitationLearning #DRL

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen