Een bericht dat misschien ondergesneeuwd raakte onder alle nieuws over AI: Google heeft, naar eigen zeggen, een van de grootste beveiligingsupdates aan Gmail in jaren uitgebracht. Het gaat om een technologie die het RETVec noemt , kort voor Resielient & Efficient Text Vectorizer. Een technologie die blijkbaar door heeft welke trucs er allemaal gebruikt worden bij spam, om jouw spamfilters toch te omzeilen.
Het gaat met name om speciale lettertekens, maar ook om emoji's en typefouten. Google zou deze technologie al een jaar lang gebruiken, en het zou naar eigen zeggen het opsporen van spam met 38% verbeterd hebben, en het aantal valse positieven zou met 19% gedaald zijn.
Wat ons bijzonder intrigeert hierbij is de manier waarop de technologie speciale lettertekens "door heeft". Spamfilters zijn getraind op bepaalde woorden, en dus gaan spammers in die woorden lettertekens van het westers alfabet vervangen door tekens uit andere schriften, die bijna niet te onderscheiden zijn van het origineel. Maar ook een "l" (letter EL) gebruiken voor een "I" (letter i) , of een 0 (nul) voor een O (letter OOOO) komt veel voor. De spamfilters herkennen die vervormde letters niet, en dus herkennen zij dat woord niet als iets waarop zij getraind zijn.
Wat er bij RETVec gebeurt is dat de technologie nu getraind is op die valse combinaties, en weet dat bijvoorbeeld een C vertegenwoordigd kan worden door verschillende lettertekens uit verschillende alfabetten. Doordat het die combinaties kan maken, werkt de technologie veel slimmer en sneller, en herkent het spamwoorden, met welke lettertekens ze ook geschreven zijn.
Google zal RETVec als open source uitbrengen, zodat ook andere e-mailprogramma's het kunnen toepassen. Ook voor de commentaren op berichten zou dit een oplossing kunnen zijn.
https://arstechnica.com/gadgets/2023/12/gmails-ai-powered-sp ...
https://security.googleblog.com/2023/11/improving-text-class ...
|