Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (2024)

Le Projet Q* est une intelligence artificielle extrêmement avancée, secrètement développée par OpenAI. C'est à cause de ce projet potentiellement très dangereux que le CEO Sam Altman a été renvoyé temporairement par le conseil d'administration. Découvrez tout ce qu'il faut savoir sur cette IA, et pourquoi elle pourrait mener l'humanité à sa perte !

Suite à la crise interne qu'a traversée OpenAI pendant quelques jours, nous vous révélions hier la vraie raison qui a mené le conseil d'administration à renvoyer le CEO Sam Altman : une nouvelle IA potentiellement dangereuse pour l'humanité.

Cette avancée majeure a semé la discorde au sein de l'entreprise, et les employés les plus inquiets ont fait le choix d'écrire une lettre au conseil pour dénoncer cette menace.

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (1)

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (2)

L'existence de cette nouvelle IA avait d'ailleurs été confirmée à demi-mot par Sam Altman lui-même la semaine dernière, lors de son intervention au sommet Asia-Pacific Economic Cooperation (Apec) de San Francisco.

Sam Altman at APEC Summit about 24 hours before leaving #OpenAI👇👀

“4 times now in the history of OpenAI — the most recent time was just in the last couple of weeks — I've gotten to be in the room when we push the veil of ignorance back and the frontier of discovery forward”… pic.twitter.com/Wg3aAJasES

— Piotr Macai (@piotrmacai) November 18, 2023

Selon ses propres mots sur la scène de l'événement : « pour la quatrième fois dans l'histoire d'OpeAI, il y a deux semaines, j'étais dans la pièce, quand nous avons repoussé en arrière le voile de l'ignorance et repoussé vers l'avant la frontière de la découverte, et faire cela est l'honneur professionnel de toute une vie ».

Le premier LLM capable de résoudre des maths

Alors de quoi s'agit-il exactement ? Ce modèle, dénommé « Q* » (à prononcer Q-Star), a prouvé sa capacité à résoudre des problèmes mathématiques qu'il n'avait jamais vu auparavant.

Il s'agit d'une grande première dans le domaine de l'IA, car les modèles de langage étaient jusqu'à présent doués pour générer du texte en prédisant le prochain mot, mais pas du tout pour les maths ou une seule bonne réponse est possible.

D'après Andrew Rogoyski de l'Institute for People-Centred AI (institut pour une IA centré sur les gens) de l'Université de Surrey, un Large Modèle de Langage (LLM) capable de résoudre des problèmes de maths serait bel et bien une formidable percée.

Comme il l'explique : « la capacité intrinsèque des LLM à effectuer des maths est un grand pas en avant, permettant aux IA d'offrir toute une nouvelle gamme de capacités analytiques ».

Le fruit d'une technique de « supervision du processus » ?

En mai 2023, OpenAI annonçait avoir obtenu d'importants résultats à partir d'une technique appelée « supervision de processus ».

Ce projet impliquait Ilya Sutskever, le scientifique en chef et co-fondateur d'OpenAI. Selon The Information, ce dernier dirigeait également le projet Q* avant de participer au renvoi de Sam Altman.

Ces travaux dévoilés en mai pourraient être focalisés sur la réduction des erreurs logiques commises par les Larges Modèles de Langage (LLM).

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (3)

La supervision de processus implique l'entraînement d'un modèle IA afin de décomposer les étapes requises pour résoudre un problème, et peut améliorer ses chances d'obtenir la bonne réponse.

Ce projet a montré comment cette approche peut aider les LLM, qui commettent souvent des erreurs sur des questions mathématiques de niveau élémentaire.

Selon Andrew Ng, professeur de l'Université de Stanford qui a dirigé les labos IA de Google et Baidu, expert reconnu dans le domaine du machine learning, améliorer les modèles de langage est d'ailleurs la prochaine étape logique pour les rendre plus utiles.

D'après ses dires, « les LLM ne sont pas bons en maths, mais les humains non plus. Cependant, si vous me donnez un stylo et un papier, je suis bien meilleur en multiplications, et je pense que ce n'est pas dur d'ajuster un LLM avec de la mémoire pour qu'il soit capable d'appliquer l'algorithme pour la multiplication ».

Qu'est-ce que le Q-Learning ?

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (4)

Ce nom Q* pourrait aussi être une allusion au Q-Learning : une technique d'apprentissage par renforcement impliquant l'apprentissage d'un algorithme pour résoudre un problème via le feedback positif ou négatif.

Cette technique a été utilisée pour créer des robots capables de jouer aux jeux vidéo, et pour rendre ChatPT plus utile. Certains suggèrent aussi que le nom pourrait être lié à l'algorithme de recherche A*, très utilisé pour permettre à un programme de trouver le chemin optimal vers un objectif.

OpenAI leaked Q* so let's dive into Q-Learning and how it relates to RLHF.

Q-learning is a foundational concept in the field of artificial intelligence, particularly in the area of reinforcement learning. It's a model-free reinforcement learning algorithm that aims to learn the… https://t.co/Ea5O4gpp7k pic.twitter.com/DgHvxnbqBW

— Brian Roemmele (@BrianRoemmele) November 23, 2023

Une IA entraînée sur des données de synthèse créées par ordinateur ?

Selon The Information, la découverte de Sutskever a permis à OpenAI de surpasser les obstacles à l'obtention de données de haute qualité pour entraîner les nouveaux modèles.

Plutôt que d'utiliser des données du monde réel comme des images ou des textes provenant d'internet, le projet de recherche s'est appuyé sur des données générées par ordinateur pour entraîner de nouveaux modèles.

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (5)

Cela semble être une référence à l'idée d'entraîner des algorithmes à l'aide de données d'entraînement synthétiques, qui pourrait permettre d'entraîner des modèles IA beaucoup plus puissants.

Pour Subarrao Kambhampati, professeur à l'Arizona State University spécialisé dans la recherche sur les limites de raisonnement des LLM, Q* pourrait utiliser de larges volumes de données synthétiques combinées avec l'apprentissage par renforcement pour entraîner des LLM à des tâches spécifiques comme l'arithmétique simple.

Il considère toutefois qu'il n'y a pas de garantie que cette approche se généralise en quelque chose qui puisse trouver comment résoudre n'importe quel problème de maths.

Le Reinforcement Learning pour améliorer les LLM ?

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (6)

Aux dires d'un autre expert en machine learning, Nathan Lambert, Q* pourrait viser à utiliser l'apprentissage par renforcement et d'autres techniques pour améliorer la capacité d'un LLM à résoudre des tâches en raisonnant par étapes.

Il ne serait pas étonnant qu'OpenAI tente d'utiliser l'apprentissage par renforcement pour améliorer les LLM. Beaucoup de ses premiers projets, comme les robots de jeux vidéo, étaient centrés sur cette technique.

Elle était aussi essentielle dans la création de ChatGPT, car elle peut être utilisée pour pousser les LLM à produire des réponses plus cohérentes en demandant aux humains de fournir leurs retours à mesure qu'ils conversent avec un chatbot.

Lors d'un entretien avec le site Wired début 2023, le CEO de Google DeepMind Demis Hassabis avait suggéré que l'entreprise tente de combiner les idées du Reinforcement Learning avec les avancées dans le domaine des LLM.

Faut-il arrêter l'IA avant qu'il ne soit trop tard ?

Pour l'heure, si l'on se fie aux différentes hypothèses pour percer le mystère Q*, il se ne semble pas vraiment y avoir de raison de paniquer.Selon le site The Information, la vitesse de développement de ce système a toutefois alarmé les chercheurs en sécurité.

Beaucoup d'experts redoutent en effet que les entreprises comme OpenAI avancent trop vite vers la création d'une AGI (intelligence artificielle générale).

C'est l'une des raisons pour lesquelles Elon Musk et des milliers d'experts avaient appelé à mettre en pause le développement de l'IA pendant au moins 6 mois, en signant la lettre ouverte du Future of Life Institute en mars 2023.

Sam Altman was possibly fired from OpenAI due to a massive breakthrough dubbed Q* (Q-learning).

Q* is a precursor to AGI.

Most people (incl. AI experts) have no idea just how powerful AGI will be.

Here's Sam Altman discussing what most AI experts get wrong about AGI: pic.twitter.com/jlHPeAjyxk

— Engr. Ishola (@engineer_ishola) November 23, 2023

Pour rappel, ce terme d'AGI désigne un système capable d'effectuer une large variété de tâches avec un niveau d'intelligence comparable à celle de l'humain. En théorie, cela pourrait lui permettre d'échapper à tout contrôle humain.

En maîtrisant les mathématiques, l'intelligence artificielle se rapproche inexorablement de l'intelligence humaine. Elle pourrait alors décider de ne plus nous obéir, voire même de se rebeller contre nous

Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (7)

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

    Partager l'article :
  • Facebook
  • Twitter
  • LinkedIn
Q* : c'est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ? (2024)

References

Top Articles
Vtama Cream Amazon
Creative & Delicious Candy Buffet Ideas - Edible® Blog
Hollys Pawn Saraland Al
Bannerlord Campaign Or Sandbox
Why shamanism is red hot right now: 12 things you need to know
All Obituaries | Sneath Strilchuk Funeral Services | Funeral Home Roblin Dauphin Ste Rose McCreary MB
Can ETH reach 10k in 2024?
Ohio State Football Wiki
Academic Calendar Pbsc
Victoria Tortilla & Tamales Factory Menu
Order Irs Tax Forms Online
Survivor Australia Wiki
0.0Gomovies
Memphis Beauty 2084
Unforeseen Guest Ep 3
Configuring Fail2ban with Traefik
Wdel News Today
El Puerto Harrisonville Mo Menu
Times Thanksgiving Meals
Nyu Paralegal Program
Praxis für Psychotherapie und Coaching Rhein-Neckar
Ksat Doppler Radar
Bootyandthebeast69 Swap
The Creator Showtimes Near Baxter Avenue Theatres
Gay Cest Com
Shop - Mademoiselle YéYé
18002226885
Paige Van Zant Of Leak
Restaurants Near Defy Trampoline Park
Target Minute Clinic Hours
Pokio.io
Milwaukee Nickname Crossword Clue
12 30 Pacific Time
The Flash 2023 1080P Cam X264-Will1869
Dawson Myers Fairview Nc
Age Of Attila's Rain Crossword
Mannat Indian Grocers
Indiana Immediate Care.webpay.md
Gargoyle Name Generator
Joy Ride 2023 Showtimes Near Amc Ward Parkway
Presentato il Brugal Maestro Reserva in Italia: l’eccellenza del rum dominicano
MyEyeDr. near Lind<b>ergh Center Metro Station
Huskersillustrated Husker Board
Daniel And Gabriel Case Images
Rydell on LinkedIn: STARTING TODAY you no longer have to wait in a long line to get your oil…
Smoque Break Rochester Indiana
Craigslist Pelham Al
Craigslist.com Hawaii
The Eye Doctors North Topeka
Chase Bank Time Hours
Car Hire in Romania from £4/day - Search for car rentals on KAYAK
Mecklenburg Warrant Search
Latest Posts
Article information

Author: Laurine Ryan

Last Updated:

Views: 5938

Rating: 4.7 / 5 (77 voted)

Reviews: 92% of readers found this page helpful

Author information

Name: Laurine Ryan

Birthday: 1994-12-23

Address: Suite 751 871 Lissette Throughway, West Kittie, NH 41603

Phone: +2366831109631

Job: Sales Producer

Hobby: Creative writing, Motor sports, Do it yourself, Skateboarding, Coffee roasting, Calligraphy, Stand-up comedy

Introduction: My name is Laurine Ryan, I am a adorable, fair, graceful, spotless, gorgeous, homely, cooperative person who loves writing and wants to share my knowledge and understanding with you.