Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Google Maps krijgt een flinke facelift: AI maakt je rit makkelijker (en mooier!)
Microsoft lanceert Copilot Health: je persoonlijke AI-dokter (maar niet écht)
Google gebruikt oude kranten en AI om plotselinge overstromingen te voorspellen: slimmer dan je denk
Meta slaat terug tegen oplichters: slimmere WhatsApp, Facebook en Messenger
Steeds meer landen sluiten kids onder de 16 buiten van social media. Maar is dat wel slim?
Wordle-maker Josh is terug… maar dit keer met een echte breinbreker!
Nieuwe Emojis in iOS 26.4
Google maakt je luie werkdag nóg luier met Gemini
Meta koopt Moltbook: het bizarre sociale netwerk voor AI-bots
Online pesten krijgt een upgrade: AI-agents doen het nu zelfstandig
Naar het Nieuws-archief...
Hardware
JBL PartyBox On-The-Go 2: feestje in je rugzak (met AI-karaokemic die vals zingen maskeert!)
Lightmatter halveert je datacenter-kabelchaos met slimme licht-truc
Arduino Ventuno Q: Arduino wordt ineens een AI-robotbeest
Een startup denkt bliksem te kunnen stoppen – en zo mega-branden te voorkomen
Japan geeft groen licht: wereldprimeur met stamcellen
Gorilla Glass Ceramic 3: je telefoon overleeft jarenlang vallen
Apple lanceert spotgoedkope MacBook Neo vanaf 599 dollar
Motorola gaat samenwerken met GrapheneOS: meer privacy op Android-telefoons
Leica Leitzphone van Xiaomi: groot, maar met echte camera
Weer een bedrijf dat voor leerling-tovenaar wil spelen: satellieten moeten 's nachts licht naar
Naar het Hardware-archief...
Oor
Proces X Special: femicide en mishandeling van vrouwen
TikTok + Apple Music: eindelijk volwaardige nummers luisteren zonder app-hoppen!
All-In Podcast: Anthropic vs Pentagon
Apple Music labelt AI-muziek... maar alleen als de platenmaatschappij het zegt
Audible lanceert goedkopere abonnement: nu vanaf €8-9 per maand
De gesloten podcast-wereld: RSS-feeds sterven uit
Spotify maakt je playlists nog vloeiender met Smart Reorder
Nieuw audioformaat: kan dit MP3 en Opus vervangen?
Audible lanceert 'Immersion Reading': lees én luister tegelijk
De zaak ontleed: de Groningse sextortion
Naar het Oor-archief...
Site
Web Rewind: nostalgie
IranStrike: real time
AquaStock: hou je aquarium veilig
Scrollspeedometer: hoe snel zijn jouw vingers?
En wat bij een kernoorlog?
Born In: hoe zag jouw geboortejaar eruit?
UltraTextGen: lettertypes
Gather Ease: afspreken - privé of professioneel
Satellite map: satellieten volgen
Plotiq: van csv naar grafiek
Naar het Site-archief...
Tip
Google Keep: haal tekts uit afbeeldingen
Google Keep: neem eens een voice bericht op
Roep AI-acties in Verkenner een halt toe
Google Photos: ontkoppel de afdrukdiensten
Google Photos: herinneringen van bepaalde periodes uitsluiten
Google Photos: Automatische herinneringen
Activeer meldingen voor te hoge bloeddruk op je Apple Watch
Google Photos: verberg afbeeldingen van andere apps
Slimmer werken met Google Photos: sneller delen
Zo schrijf je een langer artikel op X
Naar het Tip-archief...
Software
TreeSheets: de hiërarchische spreadsheet die alles vervangt (en supersnel is!)
Apple Configurator: dé tool om iPhones en iPads in bulk te beheren
Google Art and Culture
UniPay: rekeningen delen
Pulldog: handig voor ontwikkelaars
FreeShow: presentatie
Disconnect Me: browser extensie
Lightshot: schermafdrukken
CC Cleaner: grote opkuis
Mouse Jiggler: je scherm actief houden
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL