Twee AI-berichten vandaag van Google. Om te beginnen: Google DeepMind heeft een nieuw AI-model gecreëerd, dat TacticAI heet, en dat zich specifiek op voetballers toespitst.
Concreet maakt TacticAI voorspellingen over waar de cornerbal heen zal gaan, en geeft suggesties om de kansen op een goal te verbeteren.
En het gekke is: dit is geen projecct dat nu plots ontstaan is, maar waar al jaren aan gewerkt werd. De AI afdeling van Google heeft namelijk al jarenlang samengewerkt met de Liverpool Football Club om AI toe te passen in voetbal. Al in 2021 hadden wetenschappers een model ontwikkeld dat kon voorspellen waar een speler een penalty zou krijgen, gebaseerd op zijn positie op het veld. In 2022 ontwikkelden zij een AI die videobeelden van de wedstrijden analyseerde om dan te voorspellen waar spelers vervolgens heen zouden lopen, zelfs als dat buiten beeld was.
Maar geen van die systemen waren krachtig genoeg om een echt prototype te maken dat dat coaches in het echt suggesties kon geven. Met de doorbraak die AI recent kende, is dat wel het geval. Bij Wired een interessant achtergrondartikel (1)(2)
Een tweede bericht van bij Google gaat over het VLOGGER project. Hier gaat het over een project dat nog niet concreet is, maar waarover wetenschappers de technologie beschreven hebben. VLOGGER zou namelijk video's kunnen maken van mensen die spreken en bewegen, en dat enkel uitgaande van een stilstaand beeld en een audiofragment.
Het team gebruikte daarvoor een diffusion model, dat goed is in het aanmaken van beelden op basis van een tekst. Maar het model is niet gebaseerd op training die een specifieke persoon moet doen, of op gezichtsherkenning. Maar wel op een dataset die MENTOR genoemd wordt, en die veel groter en diverser is dan vorige datasets.
Het resultaat is een video waarbij het audiofragment perfect past bij de gelaatsuitdrukking van de persoon (waarvan enkel een stilstaand beeld genomen werd!), dus ook de lipbewegingen. Voorlopig enkel een korte video, en met een vaste achtergrond. En nog niet realistisch genoeg om fake video's te maken. Maar het zou wel kunnen helpen om lip-synching te maken in video's, die in andere talen dan gebrahct worden. Of om een virtuele assistent te maken. (3)
https://www.wired.com/story/deepmind-is-helping-soccer-teams ...
https://deepmind.google/discover/blog/tacticai-ai-assistant- ...
https://venturebeat.com/ai/google-researchers-unveil-vlogger ...
|