Qwen3‑VL: An AI that understands text, images, and video—at book length

Share
Qwen3‑VL: An AI that understands text, images, and video—at book length

Meet Qwen3-VL, our most capable vision-language model yet. It understands text, images, and video together—and keeps track of up to 256K tokens, so it can follow book-length docs and long videos without losing the thread.

What’s new

  • Stronger brains: Even better at pure text tasks, beating many text-only models.
  • Long attention: Natively handles very long, interleaved content and retrieves details accurately.
  • Smarter vision: Leads on tough multimodal tests (e.g., MMMU, MathVista/MathVision) across single images, albums, and video.
  • Right size for you: From 2B to 235B parameters, including MoE options for speed–quality trade‑offs.

How it works

  • Upgraded spatial–temporal modeling for images and video.
  • DeepStack uses multi-level vision features for tighter text–image alignment.
  • Text-based timestamp alignment for crisper video grounding.

Why it matters: stronger agents that can cite across slides, pages, scenes, and frames—for research, support, education, and code with visuals.

Paper: https://arxiv.org/abs/2511.21631v1

Paper: https://arxiv.org/abs/2511.21631v1

Register: https://www.AiFeta.com

#AI #Multimodal #LLM #ComputerVision #VideoUnderstanding #GenAI #Qwen #Research

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen