Meet d3LLM: Ultra-Fast Diffusion LLMs Without the Accuracy Trade-Off

Meet d3LLM: Ultra-Fast Diffusion LLMs Without the Accuracy Trade-Off

What if AI could write many words at once, not just one after another? Diffusion LLMs can—yet they often trade speed for accuracy. Meet d3LLM, a new approach that keeps both.

  • Smarter training: Pseudo-trajectory distillation teaches the model which tokens are safe to finalize early, enabling confident parallel decoding.
  • Faster inference: Entropy-based multi-block decoding groups “easy” tokens together and uses a KV-cache refresh to keep context sharp while scaling parallelism.
  • Fairer evaluation: AUP (Accuracy Under Parallelism) measures quality and speed in one metric.

The authors report up to 10x speedup over prior diffusion LLMs (LLaDA/Dream) and 5x over standard autoregressive models, with minimal accuracy loss. Code: https://github.com/hao-ai-lab/d3LLM Paper: https://arxiv.org/abs/2601.07568v1

Paper: https://arxiv.org/abs/2601.07568v1

Register: https://www.AiFeta.com

AI LLM DiffusionModels NLP MachineLearning Inference ParallelComputing OpenSource Research

Read more

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Pienet, huomaamattomat muutokset opetusdataan voivat ohjata tekoälyn käyttäytymistä

Keittiössä pieni muutos reseptiin – ripaus suolaa vähemmän tai tilkka sitruunaa enemmän – voi muuttaa ruoan luonteen. Tekoälyä opetettaessa resepti on data: kuvat, tekstit ja äänitteet, joista malli oppii. Uusi esijulkaistu tutkimus väittää, että aivan pienet, lähes huomaamattomat muokkaukset tähän aineistoon voivat riittää kääntämään mallin käytöstä haluttuun suuntaan. Moni on tottunut ajatukseen,

By Kari Jaaskelainen
Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Äly ei synny yhdellä äänellä: tekoäly paranee, kun se vaihtaa ajattelutapaansa kesken tehtävän

Ihminen harvoin ratkaisee ongelman yhdellä tavalla alusta loppuun. Ensin hahmotellaan, sitten ideoidaan, sen jälkeen karsitaan ja lopuksi tehdään täsmällisesti. Tuore tekoälytutkimus väittää, että myös koneet hyötyvät tästä rytmistä. Kokoonpanopaketin avaava huomaa pian, ettei sama ote riitä joka vaiheessa. Ensin täytyy katsoa, mikä osa sopii mihin (tilan hahmottaminen). Kun jokin ei

By Kari Jaaskelainen