Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Nieuwjaarsbrief van YouTube: heel wat veranderingen
Adobe: van document naar mooie presentatie
X maakt zijn algoritme open source: wat betekent dat?
Oekraïne deelt oorlogsdata met bondgenoten voor AI-training
Setapp Mobile stopt: alternatieve iOS-app store in EU sluit al na korte tijd
Adobe maakt Premiere slimmer met nieuwe AI-tools
Matt Damon haalt uit naar Netflix-films
Threads wint het van X op je smartphone
Dumbphone-gebruikers zijn hun verstand kwijt?
Wikipedia viert 25 jaar: de online encyclopedie die alles veranderde
Naar het Nieuws-archief...
Hardware
Sony LinkBuds Clip: open oortjes die je oorschelpen niet blokkeren
Roland GO:MIXER Studio: je telefoon wordt een mini-muziektudio
Thunderbird 147.0: Kleine maar fijne update
Microsoft belooft: geen hogere stroomrekening door onze AI-centra
Withings : glucosemeter en Body Scan 2
Atitan brengt Auracast naar je iPhone (CES 2026)
Bose houdt oude slimme speakers levend met open source
Eyebot brengt een kiosk uit voor een snelle oogtest
Stanford ontwikkelt AI die ziekten voorspelt via slaap
Test je voedsel op allergenen met een draagbaar mini)lab
Naar het Hardware-archief...
Oor
Spotify test 'Page Match': sync je audiobook met je papieren boek
Bandcamp verbiedt AI-muziek: puur menselijk werk eerst
Universal Music Group en Nvidia werken samen aan AI voor muziek
Spotify brengt 'Listening Activity' naar je telefoon
Hoorspel: Sprong in het heelal
Rechtpraten: over juice kanalen
Muzikanten zijn AI-klonen spuugzat
Podcast: de zaak ontleed: het Marengo-proces
Nieuwe Spotify-functie: Meer grip op je muziekadvies
Podcast Napleiten: Oorlogsveteraan
Naar het Oor-archief...
Site
DryOutside: heeft het zin om je was buiten te drogen hangen?
Speedread: sneller online lezen
Soup Of Life: levenssimulatie
Cubic Bezier: om in je CSS-animaties te gebruiken
Hier spreekt men Nederlands: Griekipedia
Hier spreekt men Nederlands: Libelle Lekker
Readeck: later lezen / bekijken
GrammarCheck: net ietsje meer
Fitdrop: kledingstijlen
Zoneless.tools: tijdzones
Naar het Site-archief...
Tip
Zo schrijf je een langer artikel op X
Microsoft Word maakt hyperlinks makkelijker en sneller
Tip: Gebruik de verborgen Reading Mode in Google Chrome voor rustiger lezen
Tips & Tricks: De supersnelle Excel-sneltoets Ctrl+1
Tips & Tricks: Controleer of je thuisnetwerk gehackt is
AppX Deployment Service (AppxSvc) uitschakelen of terugzetten
Weg met die irritante AI-knop in Windows 11 – Microsoft luistert naar jou!
Accessibility Reader inschakelen en openen op Apple-apparaten
Label-maker: adressenlabels online maken
Tip: Vind écht goeie films op Netflix met geheime codes
Naar het Tip-archief...
Software
Nieuwe versie Powertoys is uit
Video DownloadHelper: browser extensie
Streamlink: videostreams
WinDirStat: overzicht
Samsung Internet: nu ook voor Windows
Video Compare GUI: video vergelijken
IsMyMemoryOK: geheugen testen
Waterfox: alternatieve browser
Logyx Pack: martel je brein!
Oceanode: audio bewerken
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL