Which LLM wins at RAG Q&A?

Share
Which LLM wins at RAG Q&A?

Which LLM wins at RAG Q&A?

RAG (Retrieval-Augmented Generation) helps reduce hallucinations by grounding answers in source documents. This study tested five 7B-class models on computer science literature Q&A to compare accuracy and speed.

  • GPT‑3.5 + RAG answered both yes/no and long-form questions effectively.
  • Mistral‑7B‑Instruct + RAG led the open-source pack on both question types.
  • Orca‑mini‑v3‑7B was fastest (lowest average latency); LLaMa2‑7B‑Chat was slowest.

How they measured it: accuracy and precision for binary questions; human expert and Gemini rankings; and cosine similarity for long answers.

Big picture: With the right RAG setup and infrastructure, open-source LLMs can stand shoulder to shoulder with proprietary models like GPT‑3.5.

Paper by Ranul Dayarathne, Uvini Ranaweera, and Upeksha Ganegoda. Read more: http://arxiv.org/abs/2511.03261v1

Paper: http://arxiv.org/abs/2511.03261v1

Register: https://www.AiFeta.com

RAG LLMs QA GenerativeAI Mistral GPT35 OpenSourceAI AIResearch NLP ComputerScience

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen