Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Internet Archive treft schikking met muzieklabels over auteursrechten
Nieuwe tools van YouTube maken makers blij (en rijker!)
Ook voor podcasters heeft YouTube goed nieuwsµ
AI in het dagelijks leven: enkele handige inzichten
Spotify geeft gratis gebruikers een leuk cadeautje: kies en speel meteen je eigen songs
OpenAI en Microsoft sluiten akkoord over nieuwe structuur
Microsoft ontsnapt aan EU-onderzoek door Teams los te koppelen
Enkele nieuwigheden op AI-gebied: Open modellen en privacy
Verhalende podcasts zijn een uitstervend genre
YouTube's meertalige audio: wat is het?
Naar het Nieuws-archief...
Hardware
De AR-bril van Snap krijgt slimmere software met een browser en video's
Kodak Charmera: Een piepkleine camera voor aan je sleutelhanger
GitHub-gebruikers en Linus Torvalds zien het even niet meer zitten
Pokémon Poke-nade: Tamagotchi 2.0?
OpenAI start een chipavontuur: steekt het Nvidia voorbij in 2026?
Garmin Fenix 8 Pro: een prijzige overwinning op Apple?
Dolby Vision 2: De TV-revolutie met een snufje AI
Even aan een bloemetje ruiken en je bent slimmer? Klinkt mooi - maar is het waar?
Meta’s Hypernova: Slimme brillen met een bescheiden start!
Plaud Note Pro lanceert nieuwe versie - maar wat is het?
Naar het Hardware-archief...
Oor
Napleiten: Kruidvat bedrijfsuitje eindigt in een nachtmerrie
Spotify's Lossless: meer zuivere klank in je oren, nul extra euro's!
De Afspraak als podcast
Podcast: SoundTrek
De zaak ontleed: Officier van Justitie over vrouwenmoord
Apple breekt muren af van zijn walled garden om Spotify te tackelen
Muziekdiensten serveren steeds meer door AI gemaakte namaak
Podcast De Zaak Ontleed: over reclassering
All-In podcast: opnieuw voer voor nadenken
Podcast De Zaak ontleed: Verdeeldheid na dodelijk verkeersongeluk
Naar het Oor-archief...
Site
HeyHelp: AI assistent voor Gmail
Etherpad: gedeelde editor
Blocks: maak online je eigen efficiency app
MyFinancé: je financiën beheren
Tapedeck: cassettes
Signwriting: gebarentaal
eBookAny: later lezen
Podsnacks: samenvattingen van je podcasts
You Don't Know Africa: quiz
Historical Tech Tree: geschiedenis van technologie
Naar het Site-archief...
Tip
Sneltoetsen voor YouTube
De snelkoppelingen - het hele alfabet
Handig: vertaal tekst in Word
Tip: afstanden meten in Google Maps
Hoe gebruik je Google Maps offline?
Microsoft To Do: Maak taken van je e-mails in een paar kliks
Tip: kan je door binge-watching je verliezen in een fantasiewereld?
Zo blur je je huis op Google Maps (en waarom je dat zou willen)
Tip voor een rustige zomer: maak je smartphone dom!
Tip: Ruim je Gmail-inbox op met de nieuwe abonnementsbeheer-tool
Naar het Tip-archief...
Software
Abode: social app
Adobe CC Cleaner Tool: verwijderen
DoesNotBelong: dat hoort hier niet
Outside.so : je omgeving verkennen
Gigapixel: afbeeldingen upscalen
Microsoft Launcher voor Android
Photolab: foto's bewerken
Rules: automatische regels
Eindelijk: iPad App voor Instagram
AbleMouse: toegankelijkheid
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL