Het belangrijkste nieuws van Google Next betreft, hoe kan het anders, artificiële intelligentie, en dan met name de vorderingen bij Gemini. De nieuwste versie, 1.5 Pro, is voortaan in publieke preview beschikbaar op Vertex AI, het platfor om apps te bouwen dat door AI aangedeven wordt.
Deze versie kan 1 miljoen tokens aan, wat gelijk staat aan ongeveer 70.000 woorden, 30.000 lijnen code, een uur video of 11 uur audio. Daarmee is het 4 keer zo groot als Claude 3 en 8 keer dan GTP-4 Turbo max.
Deze AI kan content in tv-shows, conferentiegesprekken, opnames en meer vergelijke en analyseren, en dat in verschillende talen. HIj kan ook transcrips maken van audio en audio van een video. Hij zal meteen gebruikt worden om nieuwe functies in de Code Assist van Google uit te werken, waardoor je grote brokken code tegelijkertijd kan vergelijken. (1)
Ook Imagen 2, het tekst-naar-arbeelding AI van Google, kreeg enkele updates. Voortaan kan je elementen van afbeeldingen toevoegen en verwijderen, met een techniek die inpainting en outpainting heet (de kunst om een ontbrekend deel van een afbeelding aan te vullen of een overbodig deel te wissen). Het SynthID watermerk kan je nu toevoegen aan alle afbeeldingen die je met Imagen gemaakt hebt.
Google heeft ook een text-to-live video waarmee je 4 seconden video kan maken op basis van een tekstprompt.
Op Twitter vonden wij bij Paul Couvert een handige uitleg over wat je kan doen met die AI (3)
https://techcrunch.com/2024/04/09/googles-gemini-pro-1-5-ent ...
https://techcrunch.com/2024/04/09/google-releases-imagen-2-a ...
https://twitter.com/itsPaulAi/status/1778066168655532469
|