Op het gebied van artificiële intelligentie gaat het razendsnel. Zo heeft OpenAI verleden week een toch wel interessante ontwikkeling aangekondigd: een nieuwe Minecraft AI, de eerste bot die in staat is om zogenaamde diamond tools te fabriceren. Dat is een taak waarvoor ervaren menselijke spelers ongeveer 24.000 acties nodig hebben.
Er zijn al AI systemen die gebruikt worden om het spel GO te spelen, en andere games waarbij je een doel moet bereiken, iets wat 'versterkt leren' heet. Hierbij wordt een AI systeem in een game gedropt, zonder enige instructie, en moet het zijn plan trekken om een doel te bereiken.
Maar Minecraft heeft geen eenvoudig doel dat je moet bereiken. OpenAI heeft daarom het Minecraft gestart, op basis van imitation learning. Daarbij wordt een neural netwerk getraind om taken uit te voeren, door mensen te observeren die dat doen.
Concreet heeft het Minecraft AI 70.000 uren lang mensen geobserveerd die Minecraft speelden. Met behulp van een ander neural netwerk werden deze video's automatisch gelabeld. Dit laatste netwerk was dan weer getraind op 2.000 uren observatie van Minecraft spelers die ervoor betaald werden om hun toetsaanslagen en muisklikken vast te leggen.
OpenAI heeft vervolgens de bot verder verfijnd met reinforcement learning, zodat de bot uiteindelijk die zeer complexe taken kan uitvoeren. Allemaal knap - maar voor de gewone Minecraft speler uiteraard niet van belang. Het belang is het aspect van "imitation learning" op basis van video's. En daarvan zullen ongetwijfeld nog toepassingen volgen.
https://www.technologyreview.com/2022/11/25/1063707/ai-minec ...
|