OpenAI heeft een nieuwe versie uitgebracht van ChatGPT waarbij je gesproken instructies kan geven. Omgekeerd komt er ook een tekst-naar-spraak model voor de iOS en Android apps van ChatGPT, dat een bijna menselijke audio kan creëren op basis van enkel tekst en slechts enkele seconden van een spraakvoorbeeld (1)
Nog een nieuwe mogelijkheid is dat je een afbeelding uploadt, en aan ChatGPT vragen stelt die daarmee verband houden. Als voorbeeld noemt The Verge een foto van een gebroken kraantje uploaden, en dan de vraag stellen "how do I fixi this". Of foto's van voedingsingrediënten en dan vragen "wat kan ik hiermee maken. Knap! (2)
Hierbij maakt OpenAI gebruik van het Whisper model, dat gesproken woord kan omzetten naar tekst en naar het Engels kan vertalen. Maar OpenAI voegt hier wel aan toe dat die stemsimulatie beperkt wordt tot specifieke gevallen, om misbruikt te voorkomen. Ook bij het herkennen van afbeeldingen zijn er beperkingen ingebouwd aan de mogelijkheid tot analyse van een beeld en het maken van directe uitspraken over mensen.
Deze nieuwe mogelijkheden komen voorlopig eerst uit voor betalende ChatGPT gebruikers, in de volgende twee weken, en "snel daarna" naar iedereen.
https://www.wsj.com/tech/personal-tech/chatgpt-can-now-chat- ...
https://www.theverge.com/2023/9/25/23886699/chatgpt-pictures ...
|