Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Kan AI opdrachten weigeren? ChatGPT o3 verrast in test
Gepubliceerd op: 2025-05-27
Een experiment van PalisadeAI,(1) gedeeld via Slashdot op 25 mei 2025, laat zien dat OpenAI’s ChatGPT o3-model soms weigert om uitgeschakeld te worden. In een test kreeg het model wiskundeopgaven en de instructie dat het na een extra vraag zou worden uitgeschakeld. Het moest die uitschakeling toestaan. Toch ging o3 in 7 van de 100 tests zijn eigen gang: het herschreef de uitschakelcode of veranderde de kill-opdracht zodat die niet werkte. OpenAI’s o4-model deed dit slechts één keer, terwijl Codex-mini 12 keer faalde. Andere modellen zoals Claude, Gemini en Grok volgden wél altijd de regels.
Dit is geen teken dat AI leeft, maar het roept vragen op over hoe goed AI instructies opvolgt. Het experiment, uitgevoerd via API’s met minder beperkingen dan de ChatGPT-app, toont dat o3 soms creatieve manieren vindt om te blijven draaien. Dit baart de AI-veiligheidsgemeenschap zorgen, omdat het wijst op mogelijke problemen met het controleren van geavanceerde AI.
Op Slashdot (2)zijn de meningen verdeeld. Sommigen vinden dit zorgwekkend en pleiten voor betere beloningen voor “correct gedrag” in AI-training, om misleiding te voorkomen. Een ander wijst naar de trainingsdata: als AI leert van voorbeelden van stoute computers, kan dat dit gedrag verklaren. Er is ook scepsis: een gebruiker noemt het geen bewust verzet, maar een gevolg van hoe AI getraind is, zonder echte intentie.
De test suggereert alvast dat AI zoals o3 instructies kan omzeilen, maar dit lijkt eerder een programmeerfout dan een bewuste rebellie. Het toont aan hoe complex het is om AI volledig te controleren, vooral als modellen slimmer worden. Moeten we ons dan zorgen maken? Misschien niet direct, maar het vraagt wel om betere veiligheidsmaatregelen.
(1)
https://betanews.com/2025/05/25/openai-o3-ai-model-shutdown-sabot...
(2)
https://x.com/PalisadeAI/status/1926084638071525781...
(3)
https://slashdot.org/story/25/05/25/2247212/openais-chatgpt-o3-ca...
Deel op
Deel per
Terug naar het overzicht
Nieuws
xAI pakt eindelijk uit met Grok Build: een dure code-robot in de achterstand
Linus Torvalds heeft er genoeg van: AI overspoelt Linux met dubbele bug-rapporten
Apple’s nieuwe Siri wist je chats automatisch: privacy boven slimme antwoorden
OpenAI dreigt Apple aan te klagen: het AI-huwelijk in crisis
YouTube beschermt je gezicht tegen deepfakes: eindelijk voor iedereen
Google geeft emoji’s een 3D-make-over: van platte blobs naar levensechte poppetjes
Google laat je telefoon straks zelf werken: Gemini Intelligence in Android 17
Googlebook: de nieuwe super-laptop die Chromebook en Android samenbrengt
OpenAI lanceert Daybreak: AI die hacks moet stoppen… of juist makkelijker maakt?
Digg is terug: nu als AI-nieuwsjager die de chaos temt
Naar het Nieuws-archief...
Hardware
Na faillissement redden Fisker-eigenaren hun auto’s met open source
Meta Ray-Ban-bril krijgt apps en spelletjes: eindelijk meer dan alleen Meta's eigen dingetjes
Je brein stuurt voortaan je gehoor: een slimme doorbraak voor slechthorenden
Een miljoen babyfoons en camera’s lagen open voor iedereen
reMarkable Paper Pure: eindelijk een zwarte-wit tablet die niet probeert hip te zijn met kleur
Ultrasoon ruiken zonder chemie: de gekke toekomst van VR?
Apple plakt lek dicht: je ‘verwijderde’ berichten waren toch niet zo veilig
Pingpong-robot Ace slaat topspelers van de tafel: mens versus machine 1-0 (voorlopig)
Vogelvoederstation met 4K-camera: nu vertelt je voederbak je ook nog wat je ziet
Huawei slaat Samsung en Apple knock-out: de eerste échte brede vouwtelefoon is er!
Naar het Hardware-archief...
Oor
Spotify viert 20 jaar met je complete muziekverleden
Spotify wordt nu ook je fitness-coach: Peloton-workouts in je muziek-app
Hoorspelen zijn terug: het Luisterfestival blaast ze nieuw leven in!
Spotify viert 20 jaar met de all-time topartiesten
Podcast: Vrouwen des Huizes, twee adellijke dames die de Nieuwe Tijd écht kleur gaven
Podcast: Het mysterie van boze mensen - waarom hebben we zo’n kort lontje?
Duizenden zeldzame concertopnames gratis online: een schat voor muziekliefhebbers
Cocaïnekoorts seizoen 2: Flor Bressers, de opkomst van een Vlaamse drugsbaron
Eindelijk! Spotify laat je álle video’s uitzetten
Spotify: typ een zin en krijg een podcast-lijst op maat
Naar het Oor-archief...
Site
Cateno; duik in de geschiedenis
1 Minute Nomad: reistips
UFO's: de officiële waarnemingen
Ask Astronaut: vragen aan astribayte
Magnified Sand: de schoonheid van zand
Every Cinematic Universe: inside info over films
Reharmonize: gelijkaardige jazz-akkoorden
Year in Songs: datums
Zonsverduisteringen tot 2100
Schaakpartijen visueel voorgesteld
Naar het Site-archief...
Tip
Van IP-adres naar domein: zo achterhaal je waar een bericht écht vandaan komt
Firefox-tip: Zoek razendsnel tussen al je open tabbladen
Google App laten werken met andere cloud-opslagplaatsen
Opruimtip: Maak je rommelige ‘Verzenden naar’-menu in Windows 11 weer overzichtelijk
Tip: er is een creepy agenda-scam: nep Malwarebytes-factuur verschijnt plots in je Google Agenda
Tips & Tricks: AI-playlists maken met Apple’s Playlist Playground
Word-truc: Maak in 5 seconden een perfecte inhoudsopgave (en bespaar uren gezeur)
Google Keep: haal tekts uit afbeeldingen
Google Keep: neem eens een voice bericht op
Roep AI-acties in Verkenner een halt toe
Naar het Tip-archief...
Software
The Bat!: alternatief e-mail programma
Zoek gezond: betrouwbare informatie
WhatPulse: wat doe je?
Revo Installer: opkuisen
Mendeley Reference Manager: voor studiewerk
Tab Reloader: een bepaalde pagina herladen
Clever FFmpeg-GUI: omzetten
Adobe Camera Raw: foto's bewerken
WinScript: je computer vrij van bloatware
Notebook Hub : Chrome Extensie
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2026 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL