Choses à Savoir TECH - o3, le nouveau modèle surpuissant d’OpenAI ?
Manage episode 458434520 series 3602453
OpenAI frappe fort pour clore l’année 2024. À l’occasion de son opération "Ship-mas", l’entreprise a levé le voile sur o3, son dernier modèle d’intelligence artificielle, une véritable révolution. Contrairement à ses prédécesseurs, o3 ne se limite pas à prédire les mots suivants dans une phrase. Il décompose les problèmes en microtâches, expose son raisonnement et affiche des performances sans précédent.
En mathématiques, le modèle pulvérise les records, résolvant 25,2 % des énigmes les plus complexes, là où ses prédécesseurs plafonnent à 2 %. Lors de la compétition AIME 2024, il n’a raté qu’une seule question, et il excelle aussi en programmation : o3 améliore de 22,8 % les scores de codage SWE-Bench Verified. Avec un taux de réussite de 87,7 % au GPQA Diamond, il surclasse même les experts d’OpenAI. Pourtant, malgré l’enthousiasme, OpenAI joue la prudence. Le modèle n’est pas encore accessible au grand public. L’entreprise a opté pour une phase de tests rigoureux, baptisée "Public Safety Testing". Des chercheurs et participants inscrits pourront interagir avec o3 afin d’identifier et corriger d’éventuelles failles de sécurité avant un déploiement à grande échelle prévu en 2025.
Ces tests mettent particulièrement l’accent sur l’alignement délibératif : o3 doit analyser chaque requête pour vérifier sa conformité avec les politiques de sécurité d’OpenAI. Ce raisonnement actif, bien plus sophistiqué que les règles fixes des versions précédentes, marque une avancée majeure dans la maîtrise des risques liés à l’IA. Avec o3, OpenAI ouvre une nouvelle ère de l’intelligence artificielle, à la croisée de la performance et de la sécurité. Une innovation ambitieuse, déployée pas à pas, pour garantir qu’elle soit à la hauteur des enjeux.
Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
150 에피소드