Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
X beperkt Grok na ophef over sexy deepfakes
ChatGPT Translate: OpenAI daagt Google Translate uit
Maar ook Google brengt een nieuwe vertaler uit: TranslateGemma
Voorbij de Mainstream: Een duik in het Fediverse met Misskey
Apple lanceert Creator Studio: krachtige apps in één abonnement
Britse politie geeft AI de schuld van blunder bij fansverbod
Acteur Matthew McConaughey beschermt zichzelf tegen AI-kopieën
Apple en Google slaan de handen ineen voor een slimmere Siri
AI: zoals een buitenaards wezen ontleden
Moxie Marlinspike maakt AI net zo privé als Signal
Naar het Nieuws-archief...
Hardware
Thunderbird 147.0: Kleine maar fijne update
Microsoft belooft: geen hogere stroomrekening door onze AI-centra
Withings : glucosemeter en Body Scan 2
Atitan brengt Auracast naar je iPhone (CES 2026)
Bose houdt oude slimme speakers levend met open source
Eyebot brengt een kiosk uit voor een snelle oogtest
Stanford ontwikkelt AI die ziekten voorspelt via slaap
Test je voedsel op allergenen met een draagbaar mini)lab
Plaud brengt nieuwe versie uit van zijn NotePin S?
Xreal 1S: betaalbare bril voor je eigen bioscoop en 3D-beleving
Naar het Hardware-archief...
Oor
Bandcamp verbiedt AI-muziek: puur menselijk werk eerst
Universal Music Group en Nvidia werken samen aan AI voor muziek
Spotify brengt 'Listening Activity' naar je telefoon
Hoorspel: Sprong in het heelal
Rechtpraten: over juice kanalen
Muzikanten zijn AI-klonen spuugzat
Podcast: de zaak ontleed: het Marengo-proces
Nieuwe Spotify-functie: Meer grip op je muziekadvies
Podcast Napleiten: Oorlogsveteraan
Podcast: The House at Number 48
Naar het Oor-archief...
Site
Fitdrop: kledingstijlen
Zoneless.tools: tijdzones
Quote Investigator: waar of niet waar?
PetrAiAiAi: grappig spelletje en speldeprik naar een bepaalde politica
Status Ninja: synchroniseren
Wikiflix: films
Atlas New: interactieve kaarten
MTV Rewind: terug naar de gouden jaren van MTV
Numla.app: rekenen
Milkyboard.com: zelf muziek maken
Naar het Site-archief...
Tip
Microsoft Word maakt hyperlinks makkelijker en sneller
Tip: Gebruik de verborgen Reading Mode in Google Chrome voor rustiger lezen
Tips & Tricks: De supersnelle Excel-sneltoets Ctrl+1
Tips & Tricks: Controleer of je thuisnetwerk gehackt is
AppX Deployment Service (AppxSvc) uitschakelen of terugzetten
Weg met die irritante AI-knop in Windows 11 – Microsoft luistert naar jou!
Accessibility Reader inschakelen en openen op Apple-apparaten
Label-maker: adressenlabels online maken
Tip: Vind écht goeie films op Netflix met geheime codes
Grok: altijd bereid je te vertellen waarover een posting gaat
Naar het Tip-archief...
Software
Samsung Internet: nu ook voor Windows
Video Compare GUI: video vergelijken
IsMyMemoryOK: geheugen testen
Waterfox: alternatieve browser
Logyx Pack: martel je brein!
Oceanode: audio bewerken
CPU-Z: info over je hardware
Duplicate Searcher : dubbele bestanden
Q Own Notes
Is My LCD OK? gratis check-up
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL