FITRep: Transparent AI to De-duplicate Lookalike Items

Share
FITRep: Transparent AI to De-duplicate Lookalike Items

Duplicate and lookalike items clutter online feeds and ads, hurting user experience.

FITRep is an attention-guided, white-box way to represent items for fine-grained deduplication. Inspired by Feature Integration Theory, it teaches Multimodal LLMs to separate what’s primary from what’s auxiliary—so structures don’t collapse into one vague embedding.

  • CHIE: extracts a hierarchy of semantic concepts from text + visuals.
  • SPDR: an adaptive, UMAP-based reduction that preserves structure while compressing.
  • FBC: FAISS-powered clustering that assigns each item a stable, unique cluster ID.

Deployed in Meituan’s ad system, FITRep lifted CTR by +3.60% and CPM by +4.25% in online A/B tests—cleaner feeds, better matching, real revenue impact.

Bottom line: fewer near-duplicates, clearer item meaning, and faster, scalable clustering—without the black-box guesswork.

Paper: https://arxiv.org/abs/2511.21389v1

Register: https://www.AiFeta.com

#MLLM #RecommenderSystems #InformationRetrieval #Deduplication #AdTech #UMAP #FAISS #CTR #CPM #AI #Meituan

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen