Nous utilisons des cookies pour vous garantir une expérience optimale sur notre site web.
En cliquant sur J'accepte, vous acceptez l'utilisation de cookies
Regarder notre politique en matière de cookies
Commencez votre voyage dans le monde digital aujourd'hui avec NGL. Nous sommes spécialisés dans la création de solutions web uniques et puissantes, conçues pour renforcer la présence de votre marque en ligne. Contactez-nous pour collaborer et donner vie à votre vision.
GPT-4o, le nouveau modèle d'OpenAI, offre des capacités multimodales, une API améliorée, des réponses audio rapides, des recherches en ligne, et une mémoire contextuelle.
En mai 2024, OpenAI a dévoilé GPT-4o, une version améliorée et plus puissante de ses modèles de traitement du langage naturel. GPT-4o se distingue par une série d'innovations techniques et de nouvelles capacités qui le rendent plus performant et plus adaptable que ses prédécesseurs. Voici les principales nouveautés :
GPT-4o prend désormais en compte la voix, le texte et l'image, contrairement aux versions précédentes où la voix était simplement retranscrite en texte. Cette nouveauté permet de préserver des informations cruciales telles que les émotions dans la voix, offrant ainsi une interaction plus riche et nuancée.
OpenAI a également amélioré son API, permettant une communication plus efficace avec son chatbot depuis d'autres applications. L’API est maintenant deux fois plus rapide et 50 % moins chère, avec des limitations cinq fois plus élevées que celles de GPT-4 Turbo. Selon Mira Murati, le déploiement de GPT-4o se fera dans les prochaines semaines, et les abonnés à ChatGPT Plus peuvent en profiter dès aujourd’hui.
Le temps de réponse des entrées audio passe désormais à 320 millisecondes en moyenne, selon OpenAI, ce qui est "similaire au temps de réponse humain". Cette réduction significative du temps de latence améliore l'interactivité et la fluidité des échanges vocaux.
GPT-4o peut désormais effectuer des recherches en ligne pour maintenir des informations toujours plus pertinentes et à jour, une fonctionnalité attendue par beaucoup est déjà disponible sur Copilot de Microsoft. Cette capacité permet à GPT-4o de fournir des réponses basées sur les informations les plus récentes.
Il peut également garder en mémoire vos précédentes conversations, évitant ainsi de devoir lui rappeler constamment le contexte. Cette fonctionnalité permet des interactions plus fluides et contextuellement riches.
OpenAI a mis l'accent sur la fonctionnalité de conversation, dans laquelle GPT-4o arbore une voix plus chaleureuse, capable de moduler son intensité et de transmettre davantage d'émotions. Combinée au temps de réponse plus court cité plus haut, cette amélioration offre une expérience troublante qui n'est pas sans rappeler le film "Her", où le héros tombe amoureux d'une IA uniquement via la voix.
Poster du film Her (2014).
Image issue de la chaine Youtube de OpenAI.
OpenAI a également montré sa nouvelle application de bureau permettant le partage d'écran. Cette fonctionnalité peut, par exemple, analyser un tableau Excel affiché sur votre écran et en sortir un graphique en temps réel. Elle permet également le tutorat en temps réel, comme le montre l’image ci-dessus qui illustre GPT-4o indiquant au jeune homme où se trouve l’hypoténuse du triangle affiché sur son écran.
OpenAI a noué un partenariat avec l'application BeMyEyes, permettant aux personnes non ou malvoyantes de se repérer dans leur environnement grâce à la caméra de leur téléphone. Ce partenariat permet aux utilisateurs malvoyants d'interagir avec leur téléphone pour poser des questions telles que "Où se trouve le taxi dans mon environnement ?" et "Quand lever la main pour qu'il s'arrête à proximité ?". Cette collaboration améliore considérablement l'accessibilité et l'autonomie des personnes en situation de handicap.
Image issue de la chaine Youtube de OpenAI.
Contrairement aux versions précédentes, OpenAI a annoncé que GPT-4o serait disponible gratuitement pour les utilisateurs individuels et les petites entreprises. Cette décision vise à démocratiser l'accès aux technologies avancées de traitement du langage naturel, permettant à un plus grand nombre de personnes de bénéficier des capacités de GPT-4o.
Bien que la version de base de GPT-4o soit gratuite, OpenAI propose également des options « premium » pour les entreprises et les utilisateurs ayant des besoins spécifiques en termes de volume, de requêtes, et de fonctionnalités avancées. Ces options payantes incluent des capacités de personnalisation accrues, un support technique dédié et un accès prioritaire aux mises à jour et améliorations du modèle.
OpenAI met également à disposition des API gratuites pour les développeurs, leur permettant d'intégrer facilement GPT-4o dans leurs applications et services, encourageant ainsi l'innovation et l'élargissement de l'écosystème des applications basées sur le traitement du langage naturel. Jusqu’à maintenant, GPT-4 était utilisable dans ChatGPT, mais uniquement pour les abonnés à ChatGPT Plus ou à l’abonnement destiné aux entreprises. Désormais, GPT-4o est gratuit pour tous les utilisateurs, y compris ceux qui ne disposent pas d’un compte OpenAI.
Etudiant en BUT informatique à Paris, je suis actuellement en stage chez NGL. Toujours curieux d'en apprendre plus sur les nouvelles technologies.
Tags: