Microsoft Allemagne a récemment annoncé la sortie imminente de la quatrième génération de l’agent conversationnel GPT, GPT-4. Cette annonce a été faite par Andreas Braun, directeur de la technologie de Microsoft Allemagne lors d’un événement sur l’Intelligence Artificielle.
Selon Andreas Braun, la prochaine version de GPT sera multimodale, ce qui signifie qu’elle sera capable de comprendre et de générer différents types d’informations, y compris des vidéos, des images et de l’audio. Cette nouvelle version de GPT sera plus puissante que son prédécesseur, GPT-3.5, qui est limité au traitement de texte.
“Nous présenterons GPT-4 la semaine prochaine, nous aurons là des modèles multimodaux qui offriront des possibilités complètement différentes – par exemple des vidéos”
A déclaré Andreas Braun
Bien que les détails exacts de GPT-4 n’aient pas été révélés, certains spéculent que la nouveauté sera l’association de la génération de vidéos avec les capacités de langage naturel du modèle. Cela pourrait être possible grâce à l’intégration de Dall-E, un outil d’OpenAI qui génère des images à partir de descriptions textuelles.
Il est probable que la présentation de GPT-4 se fasse lors de la conférence Future of Work with AI de Microsoft, qui se tiendra le 16 mars. Microsoft a depuis plusieurs années un partenariat avec OpenAI, la startup à l’origine du modèle GPT, dont la version publique (GPT 3.5) est appelée ChatGPT.
Bien que la date exacte de la sortie de GPT-4 ne soit pas encore connue, il est certain que cette nouvelle version suscitera l’intérêt des entreprises et du grand public. GPT-4 est annoncé comme étant un modèle encore plus puissant et polyvalent que ses prédécesseurs, avec des applications potentielles dans des domaines tels que la génération de contenu multimodal, la reconnaissance vocale ou encore la traduction automatique.