Thinking-while-Generating: Interleaving Textual Reasoning throughout Visual Generation

Kari Jaaskelainen

21 Nov 2025 — 1 min read

AI that thinks while it draws

Meet TwiG (“Thinking‑while‑Generating”), a framework that lets an image model think in words as it generates pixels. Instead of only planning before or fixing after, TwiG interleaves short textual reasoning during generation—guiding upcoming regions and reflecting on what’s already made. The goal is more context‑aware, semantically rich visuals.

What they tried

Zero‑shot prompting: simple instructions make the model narrate and adjust on the fly.
Supervised fine‑tuning (TwiG‑50K): training on curated examples of images paired with interleaved “thoughts.”
Reinforcement learning (TwiG‑GRPO): rewards encourage helpful, timely reasoning.

Why it matters: letting models “talk through” their brushstrokes can reduce inconsistencies (e.g., mismatched objects or lighting) and improve local detail without losing the big picture.

Preliminary study. Paper: https://arxiv.org/abs/2511.16671v1 — Code (coming): https://github.com/ZiyuGuo99/Thinking-while-Generating

Paper: https://arxiv.org/abs/2511.16671v1

Register: https://www.AiFeta.com

#AI #GenAI #ComputerVision #ImageGeneration #Multimodal #MachineLearning #Research #OpenSource

Read more

Koneiden käyttäytymistä ei tarvitse enää kirjoittaa kaavoiksi käsin

Koneiden käyttäytymistä ei tarvitse enää kirjoittaa kaavoiksi käsin

Kun hissi lähtee liikkeelle, ilmastointi säätää puhallusta tai robotti asettaa ruuvin paikalleen, taustalla on malli siitä, miten kone käyttäytyy. Niitä on perinteisesti rakennettu niin kuin hyviä reseptejä: asiantuntija kerää kokemusta, mittaa, kirjoittaa yhtälöitä ja virittää pitkään. Se vie aikaa – ja jokainen muutos laitteessa tai ympäristössä tarkoittaa uutta työtä. Viime vuosina

Oppimalla ohjattu vedenalainen robotti löysi telakan – myös oikeassa vedessä

Oppimalla ohjattu vedenalainen robotti löysi telakan – myös oikeassa vedessä

Kun robotti-imuri hivuttautuu kotona lataustelakkaansa, kukaan ei pidä hetkeä ihmeenä. Veden alla sama temppu on kaikkea muuta kuin arkipäivää – näkyvyys on huono, virtaukset nykivät, eikä satelliittipaikannus auta. Silti juuri tähän suuntaan on otettu askel, joka voi venyttää vedenalaisten robottien toimintamatkaa ja -aikaa. Vuosia on ajateltu, että vedenalaisen telakoitumisen kaltaiset tehtävät

Oppivat liikennevalot voivat lyhentää jonotusaikaa kymmenesosan

Oppivat liikennevalot voivat lyhentää jonotusaikaa kymmenesosan

Kaikki tietävät hetken, kun seisot punaisissa valoissa keskellä yötä, eikä mihinkään suuntaan näy autoja. Tai aamun, jolloin tavallinen risteys puuroutuu yllättäen, koska osa kuljettajista päättääkin kääntyä eri suuntaan kuin yleensä. Liikennevalot ovat sääntöjen koneita, mutta liikenne elää kuin säätila. Pitkään ratkaisuksi on ehdotettu ”älykkäitä” valoja, jotka oppivat liikenteestä ja säätävät

Kun tekoäly lakkaa kyselemästä, se lakkaa myös oppimasta

Kun tekoäly lakkaa kyselemästä, se lakkaa myös oppimasta

Tutkimus viittaa siihen, että monessa kielimalliin perustuvassa agentissa ongelma ei ole älykkyyden puute vaan väärin jaettu palaute – ja että pieni, suunnan näyttävä vihje voi avata solmun. Oletko huomannut, että jokin älykäs chatbotti antaa itsevarman vastauksen, vaikka olisi pitänyt ensin kysyä tarkentava kysymys? Hetken se kyselee, sitten hiljenee – ja arvaa. Arjessa