Tiny AIs vs. Server Logs: Who's Ready for Real Time?

Tiny AIs vs. Server Logs: Who's Ready for Real Time?

System logs are messy and massive. This study tests whether small language models (SLMs) can reliably read them fast. Instead of treating "severity" labels as the end goal, the authors use severity classification as a probe of real runtime log understanding.

  • Best performer: Qwen3-4B hit 95.64% accuracy with retrieval (RAG).
  • Tiny but mighty: Qwen3-0.6B reached 88.12% with RAG despite weak performance without retrieval.
  • RAG is not magic: Gemma3-1B jumped from 20.25% to 85.28%, while some reasoning models got worse (Qwen3-1.7B, DeepSeek-R1-Distill-Qwen-1.5B).
  • Speed matters: Most Gemma/Llama variants ran under 1.2 s per log; Phi-4-Mini-Reasoning took over 228 s with under 10% accuracy.

Bottom line: architecture, training, and the ability to use retrieved context under tight output rules decide who wins. For AIOps, RCA, and digital twins, small deployable models look promising for real-time use. Read the paper: https://arxiv.org/abs/2601.07790v1

Paper: https://arxiv.org/abs/2601.07790v1

Register: https://www.AiFeta.com

AI AIOps MLOps Observability DevOps LLM RAG EdgeAI Benchmarking DigitalTwin Logs

Read more

Tekoälyavustaja on taitavimmillaan, kun se ponnistelee vain silloin kun päätös on aidosti vaikea

Tekoälyavustaja on taitavimmillaan, kun se ponnistelee vain silloin kun päätös on aidosti vaikea

Kuka tahansa on klikkaillut verkkopalvelussa väärää nappia ja huomannut olevansa takaisin lähtöruudussa. Ihminen oppii nopeasti: selvässä tilanteessa ei jäädä märehtimään, epävarmassa pysähdytään ja tarkistetaan. Sama periaate alkaa hiipiä myös verkkosivuilla toimiviin tekoälyavustajiin. Vielä hiljattain ajateltiin, että tekoälyn suoritusta voi parantaa yksinkertaisesti antamalla sille enemmän ”miettimisaikaa” joka vaiheessa. Kun malli kirjoittaa,

By Kari Jaaskelainen
Kielimallin huomio toimii yllättävän hyvin pitkien tekstien hakijana

Kielimallin huomio toimii yllättävän hyvin pitkien tekstien hakijana

Moni tuntee tilanteen: edessä on 180-sivuinen raportti, ja pitäisi löytää vastaus yhteen täsmäkysymykseen. Hakutoiminto löytää kymmeniä osumia, mutta oikea kohta on aina sen taulukon alaviitteessä tai liitteessä, johon teksti viittaa. Sama ongelma vaivaa myös älykkäitä keskustelubotteja. Ne lupaavat lukea pitkät tiedostot, mutta harhailevat helposti väärään kappaleeseen tai vastaavat luottavaisesti hutiin.

By Kari Jaaskelainen
Koneesta tulee tarkempi, kun sille antaa hetken miettiä

Koneesta tulee tarkempi, kun sille antaa hetken miettiä

Moni kuvankäsittelysovellus lupaa taikoja yhdellä napilla: poista kahvikuppi pöydältä, kirkasta kasvot, vaihda tausta. Usein tulos on kelvollinen – kunnes pieni yksityiskohta lipsahtaa. Nenäkatse jää epätarkaksi, varjo unohtuu tai reunaan jää outo haamu. Taustalla on tyypillinen tapa, jolla tekoälyä on käytetty: se antaa vastauksen kerralla, ilman että pysähtyy tarkistamaan itseään. Ajatus, että

By Kari Jaaskelainen