Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Apple opent iPhone voor andere accessoires in EU
Amerikaans leger kiest voor Grok van Elon Musk
AI-chatbots maken bikini-deepfakes van foto's
Anna's Archive kopieert bijna heel Spotify
LG keert kar over ongewilde Copilot-knop op tv
X blikt terug op 2025
Fliplish: codetaal uitwerken
De Chrome-extensie van Claude nu voor alle betalende gebruikers
Google laat betalen voor externe links en betalingen in Play Store
Firefox krijgt een 'AI kill switch' om alle AI-functies uit te zetten
Naar het Nieuws-archief...
Hardware
VS verbiedt nieuwe buitenlandse drones
Waymo's zelfrijdende auto's vast door stroompanne in San Francisco
Denemarken wijst Rusland aan voor cyberaanval op waterbedrijf
Windows 11-update maakt achtergronddienst zwaarder
Telenet maakt tv-kijken supersimpel met AI die écht begrijpt wat je zegt
Java-applets verdwijnen definitief
Nvidia's slimme chip-jacht: Volgen waar je AI-hardware belandt
Pebble Index Ring: dit geheugensteuntje zou ik wel willen!
Meta kiest voor slimme brillen met AI
AI helpt verborgen geothermische energie vinden
Naar het Hardware-archief...
Oor
Rechtpraten: over juice kanalen
Muzikanten zijn AI-klonen spuugzat
Podcast: de zaak ontleed: het Marengo-proces
Nieuwe Spotify-functie: Meer grip op je muziekadvies
Podcast Napleiten: Oorlogsveteraan
Podcast: The House at Number 48
YouTube Music lanceert slimme samenvatting van je muziekjaar
Spotify maakt overstappen makkelijker: playlists van concurrenten overzetten
HBVL podcast: gangster Y
Een audioboek hernemen in Spotify: AI vat samen wat er al gebeurd is
Naar het Oor-archief...
Site
Fun statistieken - ook van ongewone dingen
Daily Quiz: ook zelf te maken
QR Move: bewegende QR code
Makko GameDev for Everyone
VoiceNotes: orden je invallen
Travel Roulette: vind je volgende reisbestemming
Cinemaworld: landen en films
Nebular Rocket: game
Big Christmas Tree: virtuele kerstboom
Santa Tracker: waar is de Kerstman?
Naar het Site-archief...
Tip
Tips & Tricks: Controleer of je thuisnetwerk gehackt is
AppX Deployment Service (AppxSvc) uitschakelen of terugzetten
Weg met die irritante AI-knop in Windows 11 – Microsoft luistert naar jou!
Accessibility Reader inschakelen en openen op Apple-apparaten
Label-maker: adressenlabels online maken
Tip: Vind écht goeie films op Netflix met geheime codes
Grok: altijd bereid je te vertellen waarover een posting gaat
Zo kan je je YouTube feed opschonen
Wat is Cardio Load in de Fitbit-app en hoe optimaliseer je die?
Typing SVG Generator om leuke lettertypes te creëren
Naar het Tip-archief...
Software
Health Wrapped: een mooi overzicht, om te delen
Display Fusion: meerdere monitors
MyLens AI: Chrome extensie
Power Automate voor Microsoft
Pixar Render Man: 3D rendering
Move Mouse: bewegingen simuleren
WebSite-Watcher: blijf op de hoogte
Monica: browser extensie
WinAero Tweaker: systeeminstellingen aanpassen
Bricklink Studio: Lego
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL