Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Meta laat je IG Reals naar Threads posten. Maar wat is het nut?
Meta: nieuws over Threads en Meta 3D Gen
Apple Vision Pro in nieuwe landen, en meer functies - en komen er Airpods met een camera?
Steeds meer processen tegen grote tech bedrijven
Ook antitrust klachten tegen hardware
Threads verhoogt interactiviteit met metaverse
POSSE: nieuwe manier om je blog te verspreiden
YouTube: nieuwigheden voor YouTube Premium gebruikers
Apple Diagnostics nu ook in 32 Europese landen
Google: nieuwigheden in Translate, Google Sheets en Chrome voor mobiele toestellen
Naar het Nieuws-archief...
Hardware
Waterkrachtcentrales die vis-vriendelijk zijn
Boox Palma: Android maar dan met e-ink
Grote brand in Koreaanse batterijfabriek
Robot verbreekt Rubik record
De eerste Copilot+ pc s zijn uit
De eerste Copilot Plus pc s zijn uit
Logitech: stylus voor Meta Quest headset
Bill Gates kiest voluit voor atoomenergie
Voortaan ook een Black Box in de operatiezaal
AI begrijpt wat je hond je wil zeggen
Naar het Hardware-archief...
Oor
TuneIn heropent langzaam deur voor nieuwe zenders
RIAA klaagt AI muziekdiensten Suno en Udio aan
All-In Podcast spreekt met Donald Trump
Podcast: de Diamantroof
TikTok Off the Record: artiesten vertellen
Spotify verhoogt prijs van zijn abonnement in Frankrijk
Het Geluidshuis: vijf Belgian Podcast Awards
Streaming video: verschuivingen
All-In Podcast sprak met Sam Altman
Spotify: exclusiviteit loont blijkbaar niet
Naar het Oor-archief...
Site
PlusDocs: AI PowerPoint Maker
De ruimte fotograferen met je smartphone
A Trailtale
Shipmap: transport via zee
Make The Docs
StoryLife: fotoalbums voor koppels
eHammurabi: digitale versie
Recall: online content slim bewaren
Notion Site
Smashing: nieuws verzamelaar
Naar het Site-archief...
Tip
En waarom niet ChatGPT gebruiken voor recepten?
Zo stap je over naar Mastodon
Spotify en albums
Tip Windows 11: je foto s van je Android naar Windows PC overzetten
Factchecking doe je met Search
Evernote: zo laat je die vervelende Slash-tip verdwijnen
Verborgen Emoji Game in Instagram
Apple watch Faces: wat is het en hoe installeer je het
Google Photos update: leuke AI nieuwigheden
Netflix: ontdek meer titels
Naar het Tip-archief...
Software
Geekbench AI: test de AI mogelijkheden van je computer en je smartphone
Winamp Community Update project
Revio Uninstaller
ToDo Screenshots
MSEdge tweaker
WinSCP: FTP tool
CPU Display Code
DevToys: voor ontwikkelaars
Document To Speech
Chemical Structure Viewer
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL