Le LLM d’OpenAI regorge déjà incroyablement de connaissances, mais l’entreprise n’arrête pas la recherche de connaissances. Il est toujours à la recherche de nouvelles façons d’entraîner son IA pour la rapprocher de la sensibilité humaine. Selon un nouveau rapport, OpenAI travaille avec différentes organisations pour aider à créer de nouveaux ensembles de données afin de former son IA.

C’est quelque chose que toutes les entreprises d’IA essaient de faire ; intégrer autant de connaissances dans leurs LLM pour suivre la concurrence et protéger leurs revenus (oh oui, et peut-être faire avancer l’IA). Il existe une quantité massive de données humaines flottant dans ces LLM provenant de Meta, Google, OpenAI, Anthropic, X Corp et d’autres. Cependant, il n’y en a pas assez pour qu’ils soient satisfaits.

Le rêve de la plupart de ces entreprises est de développer l’AGI (intelligence artificielle générale). Lorsque cet objectif sera atteint, une IA sera fondamentalement aussi intelligente qu’un être humain. Il faudra cependant encore attendre plusieurs années.

OpenAI cherche à créer de nouveaux ensembles de données pour former son LLM

OpenAI est à la recherche de plus d’informations pour former ChatGPT et d’autres produits. Il a récemment commencé à contacter des organisations privées et publiques pour qu’elles soumettent des ensembles de données. Ces ensembles de données pourraient vraiment concerner n’importe quoi, selon l’entreprise. Ils ont juste besoin de représenter la connaissance humaine. C’est assez large et cela montre que l’entreprise n’est pas pointilleuse sur les données.

Cependant, il recherche principalement des données en langue islandaise. Il semble donc que l’entreprise comble une lacune dans ses connaissances. Les représentants d’organisations publiques et privées peuvent soumettre leurs ensembles de données à OpenAI dès aujourd’hui.

Tout cela constitue un pas en avant pour aider l’entreprise à améliorer ChatGPT et d’autres chatbots. C’est aussi un moyen pour l’entreprise d’obtenir des données avec le consentement d’autrui. À l’heure actuelle, les entreprises acquièrent leurs données en récupérant leurs données sur des sites Web. C’est quelque chose pour lequel ces entreprises ont eu des ennuis.

A lire également