Meet FITRep: Attention-Guided, Transparent Item Deduplication

Share
Meet FITRep: Attention-Guided, Transparent Item Deduplication

Ever scrolled past pages of near-identical listings? Those duplicates hurt user experience and waste ad spend.

FITRep is an attention-guided, white-box way to represent items across image + text, so platforms can tell what’s truly important (primary) versus extra (auxiliary) and cluster near-duplicates with confidence.

  • CHIE: uses Multimodal LLMs to extract hierarchical concepts from each item.
  • SPDR: an adaptive, structure-preserving UMAP-based compression that keeps key relationships.
  • FBC: FAISS-powered clustering that assigns every item a stable cluster ID.
In Meituan’s ad system, FITRep increased CTR by +3.60% and CPM by +4.25% in online A/B tests.

Result: cleaner catalogs, fewer duplicates, more relevant recommendations—and measurable revenue lift.

Paper: https://arxiv.org/abs/2511.21389v1

Authors: Guoxiao Zhang, Ao Li, Tan Qu, Qianlong Xie, Xingxing Wang

Paper: https://arxiv.org/abs/2511.21389v1

Register: https://www.AiFeta.com

MLLM RecommenderSystems InformationRetrieval AdsTech ComputerVision NLP UMAP FAISS Deduplication Ecommerce

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen