Reward models are metrics in disguise

Different labels, same pitfalls.

This position paper argues that reward models (for RL-based LLM training) and evaluation metrics face overlapping challenges—spurious correlations, reward hacking, data quality, and meta-evaluation. In some tasks, metrics even outperform reward models.

Why it matters: Aligning these research communities could improve preference elicitation, robustness to spurious signals, and calibration-aware evaluation.

It’s two sides of the same coin; flip it wisely. 🪙🧠🔍

Explore the survey and proposed research directions—then share where unifying efforts could help most.

Paper: http://arxiv.org/abs/2510.03231v1

Register: https://www.AiFeta.com

Paper: http://arxiv.org/abs/2510.03231v1

Register: https://www.AiFeta.com

#LLM #RLHF #Evaluation #AIAlignment #Metrics #RewardModels #MLResearch

Read more

Tekijöiden rehellinen itsearvio voi parantaa tiedekonferenssien palkintovalintoja

Tekijöiden rehellinen itsearvio voi parantaa tiedekonferenssien palkintovalintoja

Jokainen, joka on joskus osallistunut suuren tieteenalan palkintoraatiin, tuntee tunteen: satojen ehdokkaiden joukosta pitäisi löytää ne muutamat, jotka todella erottuvat. Tekoälyn ja koneoppimisen suurkonferensseissa tilanne on viety äärimmilleen. Niihin virtaa nykyään kymmeniä tuhansia käsikirjoituksia, ja parhaiden paperien palkintoja jaetaan, vaikka arviointi nojaa kiireisten vapaaehtoisten tekemiin pisteisiin ja hajanaisiin kommentteihin. Arkijärki

By Kari Jaaskelainen
Pelkkä pidempi muisti ei riitä tekoälylle, kun tieto on hajallaan

Pelkkä pidempi muisti ei riitä tekoälylle, kun tieto on hajallaan

Uusi, poikkeuksellisen laaja testi vihjaa, että nykyiset kielimallit eivät vielä hallitse kokonaisia arkistoja – ja että toisenlainen tapa järjestää niiden työ voisi toimia paremmin. Moni tunnistaa tunteen: etsit yhtä lukua kymmenistä raporteista tai yhtä nimeä vuosien sähköposteista. Vastaus ei ole yhdessä kohdassa, vaan pilkottuna sinne tänne. Ihmiselle tämä on työlästä – tekoälylle

By Kari Jaaskelainen
Tekoälylle voi antaa asiointioikeuden ilman pääavainta

Tekoälylle voi antaa asiointioikeuden ilman pääavainta

Oletko koskaan jättänyt naapurille valtuutuksen hakea paketin puolestasi? Arkinen paperilappu riittää tiskillä, kunhan nimi täsmää. Verkossa sama tilanne on pulmallisempi: miten antaa toiselle – tai tekoälylle – lupa toimia puolestasi paljastamatta koko elämääsi, salasanojasi tai luottokorttiasi? Digitaalisessa maailmassa on pitkään eletty kahden huonon vaihtoehdon välissä. Joko jaetaan pääsyyn tarvittava avain – salasana, token

By Kari Jaaskelainen