Meet GRACE: a moral governor for safer, more transparent AI

Meet GRACE: a moral governor for safer, more transparent AI

AI agents are getting powerful—so how do we make sure they do the right thing, not just the effective thing?

Meet GRACE, a reason-based moral governor that keeps AI behavior aligned with human norms by separating moral reasoning from goal-driven decision-making.

  • Moral Module: uses deontic logic and explicit reasons to decide which high-level actions are permissible.
  • Decision-Making Module: the wrapped AI plans optimal low-level actions, but only within the moral boundaries.
  • Guard: monitors and enforces compliance, enabling formal checks and statistical guarantees.

Because GRACE reasons with explicit, symbolic factors, its decisions are interpretable, contestable, and justifiable—so stakeholders can inspect, debate, and refine what counts as acceptable behavior.

The authors demo GRACE on a therapy assistant built on an LLM, showing how the system prevents harmful suggestions while still being helpful.

Paper: https://arxiv.org/abs/2601.10520v1

Paper: https://arxiv.org/abs/2601.10520v1

Register: https://www.AiFeta.com

AI AIAlignment AIEthics Safety NeuroSymbolic DeonticLogic LLM ResponsibleAI

Read more

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Keittiössä pieni muutos reseptiin – ripaus suolaa vähemmän tai tilkka sitruunaa enemmän – voi muuttaa ruoan luonteen. Tekoälyä opetettaessa resepti on data: kuvat, tekstit ja äänitteet, joista malli oppii. Uusi esijulkaistu tutkimus väittää, että aivan pienet, lähes huomaamattomat muokkaukset tähän aineistoon voivat riittää kääntämään mallin käytöstä haluttuun suuntaan. Moni on tottunut ajatukseen,

By Kari Jaaskelainen
Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä. Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei

By Kari Jaaskelainen