Dernièrement, le lancement d’une IA sur le marché a provoqué un véritable choc dans le monde financier. Nvidia a perdu 17 % de sa valeur, entraînant dans sa chute d'autres géants comme Broadcom, Oracle et Super Micro-Computer. Le Nasdaq a chuté de 3,1 %, le S&P 500 de 1,5 %, et plus de 1 000 milliards de dollars perdus en une seule journée. Mais qu’est-ce que DeepSeek, cette technologie qui a lancé un débat sur l’accessibilité et le coût des IAs génératives, jusqu’ici dominées par des acteurs comme OpenAI, Google ou Meta. Pourquoi fait-il autant parler d’elle ? Et surtout, comment une petite entreprise a-t-elle réussi à développer une IA aussi puissante à moindre coût ?
Qu’est-ce que DeepSeek ?
DeepSeek est un modèle de langage (LLM) open source, développé par une start-up chinoise, capable de traiter jusqu’à 128 000 tokens dans un même contexte. Il peut lire et comprendre de très longs textes ce qui le rend particulièrement adapté à l’analyse de documents volumineux comme des rapports, articles scientifiques ou contrats complexes.
À l’instar de ChatGPT, il excelle dans le traitement du langage naturel et le raisonnement automatique, tout en se démarquant par une mémoire contextuelle étendue et des fonctionnalités polyvalentes. DeepSeek permet la génération et la compréhension de textes multilingues, l’analyse de fichiers bureautiques (PDF, Word, Excel), l’assistance à la programmation (génération de code, explication d’erreurs) ou encore la création de scripts vidéo à partir d’idées ou de résumés. Son coût de développement très bas en fait une alternative crédible et compétitive face aux solutions des géants de l’IA.
Depuis la fin décembre, deux modèles ont été proposés : V3 et R1.
- V3 alimente le chatbot DeepSeek, accessible depuis un ordinateur ou une application mobile, offrant une expérience similaire à celle de ChatGPT.
- R1, lancé le 20 janvier, est un modèle spécialisé dans la résolution de problèmes complexes. Doté de capacités de raisonnement avancées, il est capable de "réfléchir" pour fournir des réponses pertinentes à des questions difficiles. Ses performances sont comparables à celles de O1, le modèle d’OpenAI lancé en septembre dernier, lui aussi axé sur le raisonnement.
Pourquoi cette IA fait-elle autant parler d’elle ?
L’émergence rapide de DeepSeek comme référence technologique s’explique par plusieurs facteurs clés. Tout d’abord, ce modèle a été développé par une jeune startup chinoise, remettant en cause le modèle dominant selon lequel seules les grandes entreprises technologiques, disposant de ressources colossales, peuvent créer des IAs avancées.
Le paradoxe de DeepSeek, est qu’avec des moyens limités, il parvient à atteindre des performances comparables à celles des meilleurs modèles du marché. Cela remet en question l’économie actuelle du secteur, où le développement d’IA de pointe nécessite généralement des centaines de millions de dollars d’investissement.
Le secret de cette haute performance résiderait dans une optimisation technique extrêmement poussée. Selon certaines sources, les développeurs auraient utilisé des techniques de programmation proches du matériel, comme l’assembleur, et adapté de manière innovante la couche CUDA, habituellement réservée aux calculs sur GPU. Après tout, une IA avancée repose avant tout sur sa capacité de traitement.
Grâce à cette approche, DeepSeek a réussi à atteindre une efficacité remarquable, sans avoir recours à une infrastructure lourde et coûteuse.
En quoi est-elle différente des modèles les plus connus, comme ChatGPT ?
L’un des grands objectifs dans le développement des modèles d’IA est de réussir à les faire fonctionner, un jour, sur un simple téléphone, avec un processeur peu puissant. DeepSeek, contrairement à ChatGPT, représente un grand pas dans cette direction, car elle nécessite peu de ressources matérielles pour fonctionner.
Autre différence importante : contrairement à ChatGPT, DeepSeek est open source. Cela signifie que son modèle peut être tourné, étudié, amélioré et réutilisé par d’autres équipes. Le cœur de la solution est publiquement disponible en ligne, ce qui en fait un outil précieux pour la communauté scientifique et pour tous ceux qui veulent contribuer à l’évolution de L’IA.
Son coût de développement est beaucoup plus bas, ce qui la rend accessible à des petites structures ou des projets avec peu de moyens. Pourtant, elle affiche des performances similaires à celles de grands modèles sur certaines tâches, ce qui est d’autant plus impressionnant quand on compare les ressources mobilisées.
