Reward models are metrics in disguise—let’s bridge the fields

Two tribes, one problem. 🎭📏🧠🔧

This position paper argues that reward models (used in post-training) and evaluation metrics tackle the same task: judging output quality. Yet they’ve grown apart—duplicating terms and mistakes. The authors survey both areas, show cases where metrics beat reward models, and chart shared challenges: spurious correlations, reward hacking, data quality, and meta-evaluation.

Why it matters: Unifying practices can yield better preferences, less gaming, and more calibrated evaluation.

If you tune models or score them, this is your handshake moment.

Paper: http://arxiv.org/abs/2510.03231v1
Register: https://www.AiFeta.com

Paper: http://arxiv.org/abs/2510.03231v1

Register: https://www.AiFeta.com

#RLHF #RewardModels #Evaluation #Metrics #NLP #AIAlignment #RewardHacking #MetaEvaluation

Read more

Tekijöiden rehellinen itsearvio voi parantaa tiedekonferenssien palkintovalintoja

Tekijöiden rehellinen itsearvio voi parantaa tiedekonferenssien palkintovalintoja

Jokainen, joka on joskus osallistunut suuren tieteenalan palkintoraatiin, tuntee tunteen: satojen ehdokkaiden joukosta pitäisi löytää ne muutamat, jotka todella erottuvat. Tekoälyn ja koneoppimisen suurkonferensseissa tilanne on viety äärimmilleen. Niihin virtaa nykyään kymmeniä tuhansia käsikirjoituksia, ja parhaiden paperien palkintoja jaetaan, vaikka arviointi nojaa kiireisten vapaaehtoisten tekemiin pisteisiin ja hajanaisiin kommentteihin. Arkijärki

By Kari Jaaskelainen
Pelkkä pidempi muisti ei riitä tekoälylle, kun tieto on hajallaan

Pelkkä pidempi muisti ei riitä tekoälylle, kun tieto on hajallaan

Uusi, poikkeuksellisen laaja testi vihjaa, että nykyiset kielimallit eivät vielä hallitse kokonaisia arkistoja – ja että toisenlainen tapa järjestää niiden työ voisi toimia paremmin. Moni tunnistaa tunteen: etsit yhtä lukua kymmenistä raporteista tai yhtä nimeä vuosien sähköposteista. Vastaus ei ole yhdessä kohdassa, vaan pilkottuna sinne tänne. Ihmiselle tämä on työlästä – tekoälylle

By Kari Jaaskelainen
Tekoälylle voi antaa asiointioikeuden ilman pääavainta

Tekoälylle voi antaa asiointioikeuden ilman pääavainta

Oletko koskaan jättänyt naapurille valtuutuksen hakea paketin puolestasi? Arkinen paperilappu riittää tiskillä, kunhan nimi täsmää. Verkossa sama tilanne on pulmallisempi: miten antaa toiselle – tai tekoälylle – lupa toimia puolestasi paljastamatta koko elämääsi, salasanojasi tai luottokorttiasi? Digitaalisessa maailmassa on pitkään eletty kahden huonon vaihtoehdon välissä. Joko jaetaan pääsyyn tarvittava avain – salasana, token

By Kari Jaaskelainen