From Pixels to Posts: Retrieval-Augmented Fashion Captioning and Hashtag Generation

Share
From Pixels to Posts: Retrieval-Augmented Fashion Captioning and Hashtag Generation

Meet a new way to write captions and hashtags for fashion photos—grounded in what is actually in the picture.

  • Detects multiple garments in an image with a YOLO-based model.
  • Extracts dominant colors and infers fabric and gender by retrieving similar products with CLIP and FAISS.
  • Packages these facts as an evidence pack that steers a large language model to stay faithful while sounding stylish.

Why it matters: classic end-to-end captioners often miss attributes or hallucinate. Retrieval-augmented generation keeps the style and improves factual grounding.

Results: the detector reached 0.71 mAP across nine garment types. The RAG-LLM pipeline delivered more attribute-aligned captions and hashtags with higher coverage (including full coverage at the 50% threshold), while a fine-tuned BLIP baseline showed higher word overlap but weaker generalization.

Takeaway: blend vision, retrieval, and LLMs to scale accurate, on-brand fashion copy across products and shoots.

Paper: https://arxiv.org/abs/2511.19149v1

Register: https://www.AiFeta.com

AI FashionTech ComputerVision GenAI RAG LLM YOLO CLIP BLIP ecommerce arXiv

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen