Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Eigenaardig incident bij Grok duidt op zwakke punten in de beveiliging
Gepubliceerd op: 2025-05-19
Op 14 mei begon Grok, de AI chatbot van sociale netwerk X, plots herhaaldelijk berichten te plaatsen over witte genocide in Zuid-Afrika, een controversieel politiek onderwerp. Het begon ook ongevraagde reacties over dit onderwerp te genereren in verschillende contexten, wat op zijn beurt tot weer heel wat reacties van gebruikers leidde.
Onderzoek bracht aan het licht dat een medewerker een ongeautoriseerde wijziging aangebracht had in de systee-prompt van Grok. Het incident schond de beleidsregels van xAI, want standaard moeten prompt-updates eerst beoordeeld worden. Wie die ongeautoriseerde medewerker dan wel zou kunnen zijn, daarover werd druk gespeculeerd. Want het zou wel eens een hooggeplaatste persoon kunnen zijn, met banden met Zuid-Afrika en een leidende rol bij X. En wij laten het aan jouw fantasie over om te bedenken wie dat wel geweest zou kunnen zijn! De controverse trok de aandacht van industriefiguren zoals Sam Altman, die sarcastisch op X reageerde dat hij transparantie van xAI verwachtte.
Dit incident met Grok laat zien dat het relatief eenvoudig kan zijn om een AI te saboteren, vooral als er zwakke punten in de beveiliging en interne processen zitten. En dat moet beter. Denk aan bijvoorbeeld strenge voorwaarden voor toegang tot systeem-prompts, betere controles om ongeautoriseerde wijzigingen te voorkomen of te ontdekken vooraleer ze live gaan.
Een bijkomend probleem is dat de wijziging al op 14 mei aangebracht werd, en pas op 16 mei ontdekt werd doordat xAI publiekelijk reageerde. 2 dagen dus, wat betekent dat een AI aanzienlijke schade kan aanrichten voordat het probleem opgemerkt wordt.
Sentinel onderstreepte al in 2024 dat AI systemen vatbaar zijn voor verschillende bedreigingen, zoals prompt-injecties en ongeoorloofde toegang. xAI heeft nu zijn lesje geleerd en verschillende maatregelen aangekondigd. Zo publiceert het nu de systeem-prompts van Grok op GitHub, zodat het publiek wijzigingen kan controleren en feedback kan geven. Het zal strengere controles uitvoeren zodat prompt-wijzigingen altijd beoordeeld worden vooraleer ze live gaan. En er komt een speciaal team dat de antwoorden van Grok 24/7 zal monitoren om afwijkingen snel op te sporen.
(1)
https://techcrunch.com/2025/05/14/grok-is-unpromptedly-telling-x-...
(2)
https://www.teslarati.com/xai-update-grok-responses-white-genocid...
(3)
https://github.com/xai-org/grok-prompts...
(4)
https://edition.cnn.com/2025/05/16/business/a-rogue-employee-was-...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Google Chrome krijgt slimme AI-make-over met Gemini: Dit verandert alles!
Google Foto’s viert 10 jaar met slimme AI-upgrades
Maar wat is dat Google One abonnement, en hoeveel kost het?
Browser Company zet de Arc-browser op pauze en gaat voluit voor AI-gedreven Dia
Mistral’s Agents API: Slimme AI als Alternatief voor OpenAI
Apple’s Solarium brengt eenheid in iOS, macOS
EU wil 2 euro heffing op kleine pakketjes: België steunt, maar werkt het?
Firefox maakt adresbalk slimmer en eenvoudiger
Kan AI opdrachten weigeren? ChatGPT o3 verrast in test
Mozilla stopt met Pocket, maar Kevin Rose komt ter hulp
Naar het Nieuws-archief...
Hardware
Zelf je iPad repareren? Apple maakt het mogelijk!
Google’s slimme bril wordt stijlvol én toegankelijk
Hoe voederbakjes de snavels van vogels veranderen - of hoe de mens de natuur razendsnel beïnvlo
Kan Blindsight van Neuralink blinden echt laten zien?
Zonnepanelen met een kill-switch: een gevaar voor het hele grid?
Wearable Whoop meet ook je bloeddruk op je pols en kan zelfs een ECG maken
Philips Fixables: print zelf reserveonderdelen van je toestellen
DNS-blokkades: piraterijjacht zet internetvrijheid op spel
Matter 1.4.1: sneller koppelen, maar nog steeds een slome slimme start
Microsoft: nieuw startmenu en nieuwe Surfaces
Naar het Hardware-archief...
Oor
Podcast De Zaak X:: de wielrenner die 30 vrouwen aanrandde
Soundcloud komt tot inkeer na protest artiesten
Podcast De zaak ontleed en de levenslang-discussie
Podcast: Onder Ons Crimi over de zaak Horion
Spotify brengt een snooze knop uit
Spotify toont nu ook Plays
AI Playlist van Spotify voortaan ook in Europa
Podcast Napleiten: Verkeersongeval met twee jonge dodelijke slachtoffers
Cold Cases: Tegen het licht
All-In podcast: Amerikaanse politiek
Naar het Oor-archief...
Site
Nieuwe dating website: Lovejack
Tyce: slim documenten maken
Kawaak: content aanmaken voor LinkedIn
Zero: webmail met AI
Q-3: streaming radio met meer dan 12000 stations
AnnotateWeb: notities over een webpagina
Zo archiveert Internet Archive microfiches
Symbolab: wiskundeproblemen oplossen
Flow TV: showcase
Snapdeck voor Figma: slides automatisch aanmaken
Naar het Site-archief...
Tip
Tip: opmaak al dan niet kopiëren in Word
Slim: sneltoetsen voor je Chromebook
Raspberry Pi tip: enkele leuke projecten om te proberen
Zo kan je Edits van Instagram gebruiken
Grok gebruiken in X
Zo stel je niet storen in op je Android toestel
Toegankelijkheidstools in Firefox
Wat kan je eigenlijk doen met Windows Task Scheduler?
Zo kan je iemand toevoegen aan een groepsgesprek in Signal
Tip: laat Grok eens een document analyseren
Naar het Tip-archief...
Software
WhatsApp nu ook voor iPad
Paste-5: beheertool voor je klembord
Jinear: to-do en agenda
Luanti: game a la Minecraft
Fender Studio: audio werkomgeving
IJsjesradar: mis nooit je favoriete ijskar!
Aparte NotebookLM app voor Android
Pandoc: documenten omzetten
DockDoor: preview van je geopende vensters net als bij Windows
Unitor: prijsvergelijking vereenvoudigd
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL