La société chinoise DeepSeek, spécialisée dans l'IA, a fait une percée dans le domaine des plateformes de développement performantes (frameworks) pour l’Intelligence Artificielle (IA) en logiciel libre (Open Source). Ces nouveautés procurent de nouveaux moyens aux développeurs d’IA Européens.

Selon les propos de notre collègue d’eeNews Europe, Nick Flaherty, DeepSeek — dont le siège est à Hangzhou (Chine) — a développé deux frameworks capable de supporter d’importants modèles de langage (LLM), qui se comparent avec ceux d’OpenAI, Perplexity, et Google — mais qui nécessitent des ressources de calcul moins importantes. La société utilise un apprentissage non supervisé renforcé (unsupervised reinforcement learning), pour améliorer les capacités de raisonnement de ses modèles d’IA, et a mis à disposition sa technologie sous licence open source MIT.
 
AI news - DeepSeek

Les modèles étendus de langage DeepSeek (LLMs Large Language Models)

Les modèles LLM de DeepSeek, pouvant traiter jusqu’à 70 milliards de paramètres, sont optimisés pour s’exécuter sur les puces de traitement graphique (GPU) Nvidia H100. Ces GPU, bien que performants, sont considérés moins efficients que les chips qui ne peuvent être exportés en Chine, en raison des restrictions imposées par le Gouvernement Américain. Le document considère que DeepSeek peut avoir accès à environ 50 000 processeurs H100

Si vous êtes intéressé par la technologie mise en œuvre, le document relatant les avancées de DeepSeek est disponible en ligne.

"Deepseek n’est pas la première à démontrer qu’une équipe riche en talents peut, petit à petit, se mesurer aux sociétés d’IA les plus performantes" déclare Walter Goodwin, Président et fondateur de la startup anglaise d’intelligence artificielle Fractile, qui a récemment reçu le soutien de Pat Gelsinger, Président d’Intel. " En Europe, durant l’année 2024, Mistral AI a pu fournir des modèles open source capables de rivaliser avec les modèles libres Llama de Meta, bien qu’élaborés avec une fraction de leur budget ».

Je m'abonne
Abonnez-vous à la balise thématique Embedded & AI pour être averti dès qu'une information relative à ce sujet sera publiée par Elektor !


"L’Europe est riche d’une forte densité de talents et elle est moins contrainte que la Chine en ce qui concerne la disponibilité des moyens de calcul, ainsi DeepSeek devrait éveiller l’attention de l’Europe, en prouvant qu’elle peut également rivaliser au niveau le plus avancé de l’IA. "

La nature open source des plateformes de DeepSeek a déjà eu un impact sur ses concurrents basés aux USA qui vendent leurs services chatbot d’IA. En Chine, WiMi Hologram Cloud développe des outils intelligents de programmation basés sur la technologie DeepSeek, souligne Nick Flaherty. Ces outils sont conçus pour aider les programmeurs à finaliser leur code, analyser sa qualité, et suggérer des optimisations, simplifiant le processus de développement et améliorant les produits résultants.

Popularité et potentiel

La popularité de DeepSeek a grimpé en flèche au cours des derniers jours, son application de chat ayant recueilli 2,6 millions de téléchargements. Nick Flaherty souligne toutefois que les souscriptions se sont arrêtées suite à l’annonce d’une cyberattaque.

Niger Toon, Président du fabricant anglais de composants d’IA GraphCore met également en exergue le potentiel de DeepSeek.

"Les avancées de DeepSeek, favorisant la progression de l’apprentissage et la combinaison de divers modèles experts, dépasse ce qui a été atteint avec des modèles larges uniques, étant tous beaucoup plus efficients," indique Niger Toon. "Alors que les restrictions d’exportation des chips GPU sont une contrainte, elles ont favorisé l’innovation, prouvant ainsi que le besoin est la mère de l’innovation."
Référez-vous à l´article eeNews Europe's pour de plus amples informations. eeNews Europe est une publication d'Elektor International Media.
Je m'abonne
Abonnez-vous à la balise thématique intelligence artificielle pour être averti dès qu'une information relative à ce sujet sera publiée par Elektor !