New Open‑Source Tool to Check If AI Trained on Your Work

Share
New Open‑Source Tool to Check If AI Trained on Your Work

If you’re a writer, artist, or publisher, you can now verify whether your content was used to train large language models—without a data center or a PhD.

In “Copyright Detection in Large Language Models,” David Szczecina, Senan Gaffori, and Edmond Li introduce an open-source platform that makes copyright checks practical and transparent.

  • One-click checks: Upload your content to see potential matches in LLM training sets.
  • Smarter similarity: Improved detection methods to catch near-duplicates and paraphrases.
  • Faster & cheaper: 10–30% lower compute via efficient API calls.
  • Scalable backend: Built to handle big datasets as usage grows.
  • User-friendly: Clear results for creators, publishers, and legal teams.

Why it matters: As legal scrutiny intensifies, creators need accessible proof of use. This platform helps raise the bar for ethical, transparent AI—supporting responsible development and easier copyright enforcement.

Read the research: https://arxiv.org/abs/2511.20623v1

Authors: David Szczecina, Senan Gaffori, Edmond Li (cs.AI)

Paper: https://arxiv.org/abs/2511.20623v1

Register: https://www.AiFeta.com

AI ethics copyright LLM transparency openSource creators research

Read more

Kielimallit tekevät vaatimuskysymyksiä eri tyyleillä – ja tyyli riippuu käyttötarkoituksesta

Kielimallit tekevät vaatimuskysymyksiä eri tyyleillä – ja tyyli riippuu käyttötarkoituksesta

Uusi vertailu näyttää, että tekoälyn tapa muotoilla järjestelmävaatimuksia luonnollisen kielen kysymyksiksi vaihtelee mallin ja aiheen mukaan. Siksi tärkeintä ei ole valita ”parasta” mallia, vaan tilanteeseen sopiva. Kuvitellaan tuttu kokous: pöydän ääressä yritetään päättää, mitä uuden tietojärjestelmän pitää pystyä tekemään. Syntyy lista kysymyksiä, joihin järjestelmän on osattava vastata. Esimerkiksi: ”Mitkä lääkkeet

By Kari Jaaskelainen
Julkaistu ajattelu voidaan jo purkaa tekoälyksi

Julkaistu ajattelu voidaan jo purkaa tekoälyksi

Kun tutkija jättää työpöytänsä, hänen äänensä ei välttämättä vaikene. Pelkistä julkaisuista voidaan jo rakentaa tekoäly, joka ohjaa väitöskirjaa, arvioi artikkeleita ja väittelee paneelissa – uskottavasti. Useimmat meistä ajattelevat tutkimusartikkeleita kirjastoiksi: hyllyriveiksi ajatuksia, joihin muut voivat palata. Uusi arXivissa julkaistu esityspaperi ehdottaa toisenlaista kuvaa. Julkaisut ovatkin rakennuspiirustuksia, joista voidaan koota tekijänsä ajattelutapa

By Kari Jaaskelainen
Konferenssien suunta ei ole pakko syntyä suljettujen ovien takana

Konferenssien suunta ei ole pakko syntyä suljettujen ovien takana

Moni tietää tunteen seminaarin päätteeksi: ohjelma oli kiinnostava, mutta kuka päätti, mistä puhuttiin ja mistä ei? Usein vastaus on pieni ohjelmakomitea, joka tekee valinnat ennakkoon. Yleisö kuuntelee, harva vaikuttaa. Eräässä tekoälyn yhteiskunnallisia vaikutuksia käsittelevässä kansainvälisessä konferenssissa kokeiltiin toisenlaista tapaa. Osallistujat eivät vain tulleet paikalle – he auttoivat muokkaamaan itse tilaisuuden suuntaa.

By Kari Jaaskelainen