Smarter Email Dataset to Tackle Phishing and Spam

Share
Smarter Email Dataset to Tackle Phishing and Spam

Smarter email defenses, grounded in real messages

Phishing and spam are evolving fast—often with help from AI. This study releases a large, carefully labeled email dataset spanning phishing, spam, and legitimate messages, with a key twist: it marks whether each message was written by a human or an LLM.

Every email also includes rich annotations: emotional tactics (like urgency, fear, or authority) and the attacker’s goal (link-clicks, credential theft, or financial fraud). The authors benchmark multiple LLMs to spot these cues, select the most reliable model to scale up labeling, and then stress-test robustness by rephrasing emails with several LLMs while preserving intent.

Results: today’s top models are strong at catching phishing, but still struggle to tell spam from genuine emails—an important gap for safer inboxes.

The dataset, code, and templates are openly available to accelerate research and deploy better defenses. Learn more: https://arxiv.org/abs/2511.21448v1

Paper: https://arxiv.org/abs/2511.21448v1

Register: https://www.AiFeta.com

cybersecurity AI LLM EmailSecurity Phishing SpamDetection Dataset OpenScience

Read more

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Aikaleimat voivat kertoa hoitojaksoista – jos kone ymmärtää säännöt

Lääkärin työpöydällä vilisee merkintöjä: diagnoosikoodeja, laboratoriotuloksia, lääkityksen aloituksia ja lopetuksia. Kaikella on päivämäärä ja kellonaika. Silti se, mitä lääkäri oikeasti tarvitsee, on tarina: milloin sairausjakso alkoi, mitä hoitoa annettiin ja milloin se päättyi. Tietokone osaa hakea yksittäisiä rivejä nopeasti. Mutta osaako se nähdä kokonaisuuden? Tähän asti moni järjestelmä on tyytynyt

By Kari Jaaskelainen
Yhteinen sävel voi olla alue, ei lause

Yhteinen sävel voi olla alue, ei lause

Useimmat verkkoalustat kysyvät meiltä samaa kysymystä yhä uudelleen: oletko samaa vai eri mieltä? Peukku ylös, peukku alas. Silti arjessa harva mielipide tiivistyy yhteen lauseeseen. Ihmiset myös välittävät joistakin aiheista paljon, toisista vähemmän. Jos etsimme yhteistä maaperää, pitäisikö meidän etsiä sitä yksittäisten väittämien sijasta jostakin niiden väliltä? Tähän asti verkon keskustelualustoilla

By Kari Jaaskelainen