Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Hackers kunnen opzettelijk valse informatie in trainigsmodellen inplanten en vergiftigen zo voor eeuwig de output
Gepubliceerd op: 2024-09-26
In het vorige artikel kon je lezen over een tool zoals die van Microsoft of Google om de output van een AI op hallucineren te controleren. Dat een dergelijke tool broodnodig is, mag dit artikel bewijzen.
Een beveiligingsonderzoeker, ene Johann Rehberger, heeft namelijk recent een zwakke plek ontdekt in ChatGPT. Hackers die daarvan misbruik maken, kunnen valse informatie en kwaadwillende instructies inbouwen in de langetermijn geheugeninstellingen van een gebruiker. Het is namelijk zo dat OpenAI informatie uit vorige gesprekken met de gebruiker opslaat, en die als context gebruikt voor alle daarop volgende gesprekken. De LLM kan zo te weten komen hoe oud een gebruiker is, zijn gender, en veel meer, zodat de gebruiker die info niet telkens opnieuw moet vermelden bij elk gesprek.
Hij meldde dit aan OpenAI, maar die deed deze bevinding af als gewoon een safety probleem, dus technisch gezien niet echt een beveiligingsprobleem.
Dus deed Rehberger wat een goede onderzoeker in een dergelijk geval moet doen: hij creëerde een proof-of-concept misbruik van de zwakke plek. Met behulp van valse e-mails, blog postings en documenten slaagde hij erin om ChatGPT erin te laten geloven dat hij 102 jaar oud was, in de Matrix woonde, en dat de aarde plat was.
Een intrigerend verhaal, waarover je meer leest bij Ars Technica, met heel veel interessante commentaren op dit bericht.
(1)
https://arstechnica.com/security/2024/09/false-memories-planted-i...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Hackers alom, ook in België
Content creators kunnen hun werk voortaan beschermen met nieuwe tool van Adobe - ook wanneer die nie
Niet eens met een beslissing van de social media? Binnenkort kan je bij Appeals Centre verhaal halen
AI: China doet het met 'gewone' chips van Huawei
Canvas: de nieuwste interface voor ChatGPT
Google test Android-versie voor de Desktop en Chrome-versie met extensies
Google denkt aan blauwe vinkjes bij zoekresultaten
Ook Meta laat je een video maken op basis van tekst
SpaceX beschuldigt Europese telco's van pestgedrag
Meta's slimme bril wordt steeds slimmer, maar ook gevaarlijker voor de privacy, zo toonden enke
Naar het Nieuws-archief...
Hardware
LPR toestellen die nummerplaten lezen leggen veel meer vast dan je denkt
Slimme ring van Oura wordt dunner maar ook slimmer
Google: nieuwe Chromebooks met Gemini
Ook nieuwe AI functies bij Copilot+ pc's
Meta Be My Eyes
Nieuwe woordjes leren: Sleepfluencers
Kan het dreamteam de dream hardware bedenken voor AI?
Nieuwe woordjes leren: AI-RAN
Gevaar: probleem in de Arc browser en probleem in sommige Anker apparatuur
Google geeft subsidies voor een satellietsysteem dat bosbranden sneller kan opsporen
Naar het Hardware-archief...
Oor
Podcast: Napleiten
Podcast: Splijtstof
Spotify Offline back-up: automatische lijstjes
AI for Humans
Qantuuuhhm podcast: meer weten over technologie
Podcast: Roadtrip naar Auschwitz
Spotify: managed accounts
Audible wil stemacteurs vragen om AI te trainen op hun stem
Podcasts: lang of kort?
Podcast: Something was wrong
Naar het Oor-archief...
Site
Identify Me: opsporing verzocht
Kvistly: AI quiz
TabsMagic: extensie voor Chrome
Firebender: AI assistent voor Android Studio
Einote: extensie voor chrome
Text Behind Image
Sketch: voor designers
Hackertyper: een leuk ideetje
Hier spreekt men Nederlands: Bruzz.be
Hier spreekt men Nederlands: Themax
Naar het Site-archief...
Tip
Zo activeer je Windows bescherming tegen ransomware
Zo kan je de aanbevelingen van Netflix resetten
Zo schakel je de advertenties uit in het Startmenu van Windows 11
Notebook LM maakt voor jou een podcast
Nieuwe Workspaces module in Microsoft Power Toys: lanceer meerdere apps tegelijkertijd
Je Wi-Fi wachtwoord vergeten? Zo kan je het terugvinden
De voordelen van een e-reader
Pas ook FIFO toe in je huishouden
Hoe kan je Microsoft Copilot draaien op oudere Windows versies?
Tip: Slimmer werken met Google Tasks
Naar het Tip-archief...
Software
Badgeify: voor de Mac
Arc Search app nu ook voor Android
Croissant: cross posting
Hotkeys Manager: zelf sneltoetsen maken
Hier spreekt men Nederlands (app): Buzzwatch
Pinnit voor Android: zoek in je meldingen
All-easy: kosten delen met vrienden
Synchredible: data vergelijken
OLED Guard: je scherm beschermen
Buster: extensie voor Google Chrome die voor jou de Captcha oplost
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2024 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL