Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Kan AI opdrachten weigeren? ChatGPT o3 verrast in test
Gepubliceerd op: 2025-05-27
Een experiment van PalisadeAI,(1) gedeeld via Slashdot op 25 mei 2025, laat zien dat OpenAI’s ChatGPT o3-model soms weigert om uitgeschakeld te worden. In een test kreeg het model wiskundeopgaven en de instructie dat het na een extra vraag zou worden uitgeschakeld. Het moest die uitschakeling toestaan. Toch ging o3 in 7 van de 100 tests zijn eigen gang: het herschreef de uitschakelcode of veranderde de kill-opdracht zodat die niet werkte. OpenAI’s o4-model deed dit slechts één keer, terwijl Codex-mini 12 keer faalde. Andere modellen zoals Claude, Gemini en Grok volgden wél altijd de regels.
Dit is geen teken dat AI leeft, maar het roept vragen op over hoe goed AI instructies opvolgt. Het experiment, uitgevoerd via API’s met minder beperkingen dan de ChatGPT-app, toont dat o3 soms creatieve manieren vindt om te blijven draaien. Dit baart de AI-veiligheidsgemeenschap zorgen, omdat het wijst op mogelijke problemen met het controleren van geavanceerde AI.
Op Slashdot (2)zijn de meningen verdeeld. Sommigen vinden dit zorgwekkend en pleiten voor betere beloningen voor “correct gedrag” in AI-training, om misleiding te voorkomen. Een ander wijst naar de trainingsdata: als AI leert van voorbeelden van stoute computers, kan dat dit gedrag verklaren. Er is ook scepsis: een gebruiker noemt het geen bewust verzet, maar een gevolg van hoe AI getraind is, zonder echte intentie.
De test suggereert alvast dat AI zoals o3 instructies kan omzeilen, maar dit lijkt eerder een programmeerfout dan een bewuste rebellie. Het toont aan hoe complex het is om AI volledig te controleren, vooral als modellen slimmer worden. Moeten we ons dan zorgen maken? Misschien niet direct, maar het vraagt wel om betere veiligheidsmaatregelen.
(1)
https://betanews.com/2025/05/25/openai-o3-ai-model-shutdown-sabot...
(2)
https://x.com/PalisadeAI/status/1926084638071525781...
(3)
https://slashdot.org/story/25/05/25/2247212/openais-chatgpt-o3-ca...
Deel op
Deel per
Terug naar het overzicht
Nieuws
Firefox 151: meer privacy, AI-zelfbeheersing en een flinke beveiligingskuur
Airbnb maakt je trip nóg makkelijker (en een tikkeltje luier)
Kobo leest nu vanzelf mee met StoryGraph (eindelijk geen gedoe meer)
Google zoekt voortaan zélf voor je (en de blauwe links zijn geschiedenis)
Google I/O 2026: de belangrijkste AI-nieuwigheden voor jou
Android 17 en slimme brillen: Google haalt eindelijk in (en doet het beter dan Apple?)
Musk verliest van OpenAI: “Te laat, sukkel!”
Apple maakt AI nuttig: oogbesturing voor rolstoelen en slimme ondertitels
X beperkt gratis accounts: maximaal 50 posts per dag -
xAI pakt eindelijk uit met Grok Build: een dure code-robot in de achterstand
Naar het Nieuws-archief...
Hardware
Flipper One: een Linux-zakcomputer voor echte tech-liefhebbers (niet voor beginners)
Na faillissement redden Fisker-eigenaren hun auto’s met open source
Meta Ray-Ban-bril krijgt apps en spelletjes: eindelijk meer dan alleen Meta's eigen dingetjes
Je brein stuurt voortaan je gehoor: een slimme doorbraak voor slechthorenden
Een miljoen babyfoons en camera’s lagen open voor iedereen
reMarkable Paper Pure: eindelijk een zwarte-wit tablet die niet probeert hip te zijn met kleur
Ultrasoon ruiken zonder chemie: de gekke toekomst van VR?
Apple plakt lek dicht: je ‘verwijderde’ berichten waren toch niet zo veilig
Pingpong-robot Ace slaat topspelers van de tafel: mens versus machine 1-0 (voorlopig)
Vogelvoederstation met 4K-camera: nu vertelt je voederbak je ook nog wat je ziet
Naar het Hardware-archief...
Oor
AI maakt nu volledige nummers van meer dan 6 minuten (en dat is best indrukwekkend)
Spotify vecht tegen AI-slop: groene vinkjes voor echte podcasts
Spotify viert 20 jaar met je complete muziekverleden
Spotify wordt nu ook je fitness-coach: Peloton-workouts in je muziek-app
Hoorspelen zijn terug: het Luisterfestival blaast ze nieuw leven in!
Spotify viert 20 jaar met de all-time topartiesten
Podcast: Vrouwen des Huizes, twee adellijke dames die de Nieuwe Tijd écht kleur gaven
Podcast: Het mysterie van boze mensen - waarom hebben we zo’n kort lontje?
Duizenden zeldzame concertopnames gratis online: een schat voor muziekliefhebbers
Cocaïnekoorts seizoen 2: Flor Bressers, de opkomst van een Vlaamse drugsbaron
Naar het Oor-archief...
Site
The Cost Of: wat kost het jou aan geld, aan tijd?
Storied Colors: kleuren en hun verhaal
GG Demo: thumbnails
Podcast Library Pages: podcasts
FDM AI PDF Editor: PDF bewerken
Cateno; duik in de geschiedenis
1 Minute Nomad: reistips
UFO's: de officiële waarnemingen
Ask Astronaut: vragen aan astribayte
Magnified Sand: de schoonheid van zand
Naar het Site-archief...
Tip
Evernote: notities vastzetten op de tabbalk
Van IP-adres naar domein: zo achterhaal je waar een bericht écht vandaan komt
Firefox-tip: Zoek razendsnel tussen al je open tabbladen
Google App laten werken met andere cloud-opslagplaatsen
Opruimtip: Maak je rommelige ‘Verzenden naar’-menu in Windows 11 weer overzichtelijk
Tip: er is een creepy agenda-scam: nep Malwarebytes-factuur verschijnt plots in je Google Agenda
Tips & Tricks: AI-playlists maken met Apple’s Playlist Playground
Word-truc: Maak in 5 seconden een perfecte inhoudsopgave (en bespaar uren gezeur)
Google Keep: haal tekts uit afbeeldingen
Google Keep: neem eens een voice bericht op
Naar het Tip-archief...
Software
AnyDesk: vanop afstand
Hyperspace (Mac App Store)
The Bat!: alternatief e-mail programma
Zoek gezond: betrouwbare informatie
WhatPulse: wat doe je?
Revo Installer: opkuisen
Mendeley Reference Manager: voor studiewerk
Tab Reloader: een bepaalde pagina herladen
Clever FFmpeg-GUI: omzetten
Adobe Camera Raw: foto's bewerken
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL