Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Apple preekt moraal, maar zou stiekem naakt-apps promoten
Boeken lezen? Nee, met Character.AI kan je ook gewoon meespelen
Google maakt AI-stemmen écht levensecht – en dat in 70 talen
Google Chrome brengt je favoriete AI-trucs direct bij de hand
Google brengt eindelijk een échte zoekbalk naar je Windows-pc
EU lanceert app om je leeftijd te bewijzen: einde van anoniem surfen?
Google zegt: genoeg met die irritante terug-knop-valstrikken
Slimme brillen: Apple kiest voor stijl, Meta voor spionage?
Adobe Reader: maandenlang gehackt via PDF’s – update NU!
Roblox wordt eindelijk wat strenger: Kids en Select accounts komen eraan
Naar het Nieuws-archief...
Hardware
De robot-hond van Boston Dynamics kan nu meters aflezen en plassen spotten – maar is hij &eac
RAM-tekort slaat toe: je Surface wordt duurder en zelfs je USB-stick ook
Amazon trekt de stekker uit oude Kindles: bedankt voor de loyaliteit, nu weg ermee
Tesla mag in Nederland zelf rijden – maar jij moet nog opletten
Russische spionage-onderzeeërs gesnapt bij onze internetkabels – “We zien jullie&rd
Sony scant je gezicht en lijf voor in PlayStation-games: creepy of cool?
Microsoft dwingt je Windows 11-update af: “We doen het voor je eigen bestwil” (maar ja&h
Micro-QR-code kleiner dan een bacterie: data voor eeuwen bewaard?
Robotaxi's bevriezen in Wuhan: wanneer je slimme taxi opeens dom doet
Ray-Ban Meta-bril: nu nog slimmer, duurder én op sterkte
Naar het Hardware-archief...
Oor
Duizenden zeldzame concertopnames gratis online: een schat voor muziekliefhebbers
Cocaïnekoorts seizoen 2: Flor Bressers, de opkomst van een Vlaamse drugsbaron
Eindelijk! Spotify laat je álle video’s uitzetten
Spotify: typ een zin en krijg een podcast-lijst op maat
All-In Podcast van 2 april: ruimte en Iran
De 7 Extra | Kan Vlaanderen koploper worden in zelfrijdende auto’s?
Nieuwe podcast-aanbieder: Europod
Spotify beschermt artiesten tegen AI-klonen: eindelijk een schild tegen de nep-muziek-tsunami
Google laat AI nu echte liedjes maken – tot drie minuten lang
Raaf: een bizarre nacht op feest waar je niet wil zijn
Naar het Oor-archief...
Site
Perfect Lyrics: songteksten synchroniseren
Goaal: juichen bij doelpunten, samen met je vrienden!
Hier spreekt men Nederlands: CreaStories
Hier spreekt men Nederlands: De hobbyzolder van Mama
Hier spreekt men Nederlands: Mee op de wind
Hier spreekt men Nederlands: Kronkeling.com
Cultural Atlas: culturele gidsen
Genius Quiz: slimmer worden
The Middle Class Museum: hoe de middenklasse evolueerde
TrailGlow: een mooie 3D video van je trail
Naar het Site-archief...
Tip
Google App laten werken met andere cloud-opslagplaatsen
Opruimtip: Maak je rommelige ‘Verzenden naar’-menu in Windows 11 weer overzichtelijk
Tip: er is een creepy agenda-scam: nep Malwarebytes-factuur verschijnt plots in je Google Agenda
Tips & Tricks: AI-playlists maken met Apple’s Playlist Playground
Word-truc: Maak in 5 seconden een perfecte inhoudsopgave (en bespaar uren gezeur)
Google Keep: haal tekts uit afbeeldingen
Google Keep: neem eens een voice bericht op
Roep AI-acties in Verkenner een halt toe
Google Photos: ontkoppel de afdrukdiensten
Google Photos: herinneringen van bepaalde periodes uitsluiten
Naar het Tip-archief...
Software
Zorin OS: Linux-versie voor de beginner
Momentum: browser extensie
Visual Studio 2026 Community: ontwikkelingsomgeving
Don't Let YouTube Track You
Picolay: schrandere beeldbewerker
DxWnd: venstermodus
Sysgauge: systeemmonitor
Consentomatic: gedaan met de cookies pop-ups
gSyncit: synchroniseren tussen diensten
iMazing: voor wie niet tevreden is over iTunes
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL