Apple propose un aperçu de son modèle de langage IA à l'approche d'iOS 18

Apple, la star de la tech connue pour ses produits élégants et conviviaux, a enfin donné un aperçu de son travail dans le domaine de l'intelligence artificielle (IA) avec le langage. Après être resté étonnamment discret dans la course à l'IA générative, Apple a présenté OpenELM, un "modèle de langage de pointe open source" qui pourrait potentiellement laisser entrevoir les capacités de l'IA de son futur logiciel iOS 18 pour iPhones.

Les modèles de langage sont des ensembles massifs d'informations que des outils tels que ChatGPT, Gemini, Perplexity et Dall-E utilisent pour répondre aux invites et générer des sorties telles que des e-mails, du code informatique ou des images. OpenELM comprend tout ce qui est nécessaire pour former et évaluer le modèle de langage sur des jeux de données accessibles au public, y compris les journaux de formation, les points de contrôle et les configurations de pré-formation. La partie "ELM" du nom signifie "modèle de langage efficace".

La sortie d'OpenELM par Apple intervient quelques semaines seulement avant son événement Worldwide Developers Conference (WWDC) en juin, où l'entreprise a l'habitude de parler de ses prochaines offres logicielles. Lors d'un appel sur les résultats trimestriels en février, le PDG Tim Cook a laissé entendre qu'Apple révélerait ses plans pour l'IA générative à un moment donné en 2024.

Alors qu'Apple fait preuve de retenue, la plupart des géants de la tech et une nuée de start-ups se sont précipités pour sortir une génération ou plus de produits d'IA générative. Adobe, Anthropic, Google et OpenAI se disputent la place pour sortir des modèles de plus en plus capables qui ne comprennent pas seulement une plus grande variété de requêtes, mais produisent également des images et des vidéos plus réalistes.

Les modèles préformés et ajustés par instructions d'Apple comptent 270 millions, 450 millions, 1,1 milliard et 3 milliards de paramètres. En comparaison, ChatGPT 3.5 compte 175 milliards de paramètres. La dernière version du modèle Llama 3 de Meta compte 70 milliards de paramètres.

Il n'est pas encore clair comment OpenELM s'intègre dans les plans d'Apple pour l'IA générative, mais la sortie d'OpenELM est une étape importante pour Apple alors qu'elle cherche à s'établir dans la course aux modèles de langage. La reproductibilité et la transparence des grands modèles de langage sont essentielles pour faire avancer la recherche ouverte, garantir la fiabilité des résultats et permettre des enquêtes sur les biais des données et des modèles, ainsi que les risques potentiels.

Avec la réputation d'Apple en matière de conception conviviale et d'intégration transparente, l'entrée de l'entreprise dans la course aux modèles de langage pourrait être un changement de jeu. La sortie d'OpenELM est un signe prometteur que Apple se prépare à se joindre à la mêlée, et le monde de la tech attend avec impatience ce qu'Apple réserve pour ses offres d'IA.

Comments

Popular posts from this blog

Apprendre les langues étrangères : Outils modernes et potentiel du ChatGPT

ChatGPT-4 reproduit l'animation GapMinder en une seule tentative

GPT-4 vs GPT-3.5 - Dévoiler l'avenir des modèles de langage de l'IA