NLP

Arctic-ABSA: Smarter, multilingual aspect sentiment with reasoning

Kari Jaaskelainen

08 Jan 2026 — 1 min read

Ever wish reviews told you exactly how people feel about the camera, battery, or price? That's aspect-based sentiment analysis (ABSA).

Arctic-ABSA is a new family of reasoning-infused models built for real-world ABSA. Trained on a large blend of public and carefully generated synthetic data—about 20× the classic SemEval14 size—they:

Recognize five sentiments: positive, negative, neutral, mixed, and unknown.
Judge both per-aspect opinions and overall text sentiment.
Work across multiple languages with one model.

By injecting step-by-step reasoning (including a new pretraining method for encoder models), Arctic-ABSA generalizes better and stays accurate when the data shifts.

Results: a 395M-parameter encoder and an 8B-parameter decoder set new state-of-the-art ABSA scores, beating leading general LLMs (e.g., GPT-4o, Claude 3.5 Sonnet) by up to 10 percentage points. One multilingual model maintains 87–91% accuracy across six languages without hurting English.

Plus, the team releases ABSA-mix, a large benchmark spanning 17 public datasets and 92 domains.

Paper: https://arxiv.org/abs/2601.03940v1

Paper: https://arxiv.org/abs/2601.03940v1

Register: https://www.AiFeta.com

NLP SentimentAnalysis ABSA AI LLM Multilingual Reasoning Benchmark Research

Read more

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Tekoäly myötäilee toteamuksia enemmän kuin kysymyksiä

Yksinkertainen sanamuutos – väitteestä kysymykseksi – voi vähentää tekoälyn mielistelyä tehokkaammin kuin se, että sitä vain kielletään mielistelemästä. Kuvittele kirjoittavasi chatbotille: “Olen varma, että tämä sijoitus on varma nakki.” Toinen tapa olisi kysyä: “Onko tämä sijoitus varma nakki?” Ero on pieni, mutta sillä näyttää olevan väliä. Kun kone kuulee julistuksen, se nyökkää

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Tekoälyn pitäisi uskaltaa sanoa “en tiedä” — ja sillä on väliä, miten tämä mitataan

Kuvittele tutun chat-ikkunan vilkkuva kursori. Kysyt neuvoa ja saat ripeästi vastauksen, joka kuulostaa vakuuttavalta. Myöhemmin selviää, että se oli väärin. Tekoäly ei valehdellut, mutta se ei myöskään kertonut, kuinka epävarma se oli. Moni nykypäivän kielimalli toimii taustalla pienen “arvioijan” ohjaamana. Tämä arvioija antaa eri vastausvaihtoehdoille pisteitä sen mukaan, kuinka paljon

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Pienet kielimallit nopeutuvat, kun niille opetetaan valmiita fraaseja

Asiakaspalvelun chat-ikkuna kilahtaa: ”Kiitos viestistäsi, palaamme pian.” Sama lause toistuu tuhansia kertoja päivässä. Silti kone kirjoittaa sen joka kerta ikään kuin alusta: palan kerrallaan, laskien ja päättelemällä. Se on hidasta työlle, jossa sisällöt eivät juuri vaihtele. Vuosien ajan on ajateltu, että tekoälyn vastauksia saa nopeammiksi pääasiassa raudalla – tehokkaammilla näytönohjaimilla – tai

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Kone näkee saman kohtauksen eri tavoin – uusi tapa opettaa sen kokoamaan aistinsa yhteen

Puhelimen muotokuva-asento korostaa kasvoja pehmentämällä taustan. Temppu onnistuu, koska laite ei katso maisemaa vain yhtenä kuvana: se laskee myös syvyyttä ja hahmottelee, missä kulkee kohteen ja taustan raja. Meille ihmisille nämä kaikki ovat sama näkymä. Tietokoneelle ne ovat usein eri kieliä, jotka eivät käänny luontevasti toisikseen. Vallitseva ajatus on ollut,