Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Grote techbedrijven stellen aanleg onderzeese kabels uit omwille van risico's
AI bij je restaurantreservaties verklapt je gewoontes
AI-artikelen: Meer dan de helft, maar kan jij het merken?
Android zal 'ervaren gebruikers' toch laten sideloaden
EU neemt Google opnieuw op de korrel voor de rankings
Threads laat creators hun podcast pushen
Wikipedia zegt: AI-bedrijven, stop met gratis graaien!
Google lanceert Cameyo app om Windows-apps op ChromeOS te laten draaien
Google Photos krijgt slimme edit-hulp voor je iPhone
Meta dumpt de like-knop buiten Facebook: het einde van een tijdperk?
Naar het Nieuws-archief...
Hardware
Withings BeamO: je thuisdokter in een doosje?
Apple Sock voor je iPhone: Slim of te duur?
Adobe Lightroom krijgt slimme AI-hulpjes: Eindelijk nuttig?
Een AI-ring die je stem naäapt? Echt?
Deense bussenpaniek: Chinese e-bussen op afstand uit te schakelen!
Google droomt van zonnepanelen en chips in de ruimte
SanDisk's piepkleine USB-stick: altijd aangesloten
Windows 11 laat je met twee oortjes tegelijkertijd via Bluetooth luisteren
Withings U-Scan: meten tijdens het plassen
En wat als jouw slimme koelkast plots advertenties gaat vertonen?
Naar het Hardware-archief...
Oor
HBVL podcast: gangster Y
Een audioboek hernemen in Spotify: AI vat samen wat er al gebeurd is
Muziek-apps: handig, maar ze halen het plezier weg van zelf muziek ontdekken
Apple Podcasts heeft nieuwe trucs: functies zoals automatische hoofdstukken en slimme links
De zaak Borsato en een tip voor live verslaggeving
Oor: de vuurwerkramp in Enschede
Spotify laat je nu ook zalen volgen: concerttips op maat
Oor: Napleiten: een deal sluiten met een kroongetuige
SoundCloud wordt nog socialer: ontdek wat je vrienden leuk vinden!
Podcast: De 7 levens van Betty
Naar het Oor-archief...
Site
Payboy: jongeren beschermen
DumbassIdeas: te gekke projecten
Bake-Du: gecombineerd bakken
NBA Moves: voor de basket-fan
Video Localization by Algebras
Offinal: AI helpt je om slimmere offertes te maken (in het Engels)
Mixy: mashups maken
Go Busly: reizen in Europa en de Balkan
20ly: 3D sterrenatlas
Payspll: hoeveel bedragen de lonen wereldwijd?
Naar het Site-archief...
Tip
Grok: altijd bereid je te vertellen waarover een posting gaat
Zo kan je je YouTube feed opschonen
Wat is Cardio Load in de Fitbit-app en hoe optimaliseer je die?
Typing SVG Generator om leuke lettertypes te creëren
Breng je chat in Google Messages tot leven met volledige-scherm-animaties
Tip: Deze twee slimme AI-hulpmiddelen maken je Android-telefoon nog handiger!
Zelf je eigen kijklijst samenstellen
Zo kan je een veilige back-up maken van je foto's, naast de online opslag van Google
Nieuwe schermafbeeldingen in iOS 26 uitschakelen
Sneltoetsen voor YouTube
Naar het Tip-archief...
Software
RetroArch: retro-games op je Android
SpeechCut: video's slim in tekst omzetten
Memorr.ai: extra geheugenlaag
JoyPixels: een Emoji klavier voor je Chrome
Niagara Launcher: zelf je startscherm bepalen
Sora2 voor Android: wat kanvdie
Nieuwe app voor de Apple Watch
Notefox: notities
Dispersed App: kamperen in de VS
AskAdmin: enkel voor Admins
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL