À la lumière des événements du dernier mois, Jeremy Richardson Premier gestionnaire de portefeuille, Actions mondiales, RBC Global Asset Management (UK) Limited se penche sur l’effet perturbateur de DeepSeek sur le marché de l’IA :
La façon dont la plateforme a livré l’IA en une fraction du temps et du coût des plateformes d’IA existantes.
L’effet et les occasions pour le secteur de la technologie, les sociétés de logiciels, les consommateurs et les investisseurs.
(en anglais seulement)
Durée : 7 minutes, 30 secondes
Transcription
Bonjour, je m’appelle Jeremy Richardson et je fais partie de l’équipe Actions mondiales RBC. Je vous présente aujourd’hui une nouvelle mise à jour. Ces brèves vidéos portent normalement sur ce qui s’est passé le mois précédent, mais j’ai l’impression qu’il n’y a qu’un seul sujet sur lequel nous devrions particulièrement nous concentrer en ce moment. En effet, DeepSeek, une entreprise d’IA chinoise en démarrage, a trouvé une façon de livrer des modèles de raisonnement en une fraction du coût et du temps de certains des modèles de raisonnement originaux qui ont tant soulevé notre enthousiasme lors de leur lancement il y a quelques mois à peine sous la forme de ChatGPT notamment.
Les innovations de DeepSeek sont de deux ordres. Tout d’abord, en utilisant une nouvelle méthodologie dans le cadre de laquelle un grand modèle bien établi enseigne essentiellement à un petit modèle ce qu’il doit savoir en mettant en place les bonnes incitations. Cela s’avère très efficace, pour une fraction du coût. Il s’agit en fait de tirer parti de certains des travaux déjà réalisés dans le secteur.
La deuxième innovation est la réduction considérable du coût d’utilisation de ces modèles, ce que les technologues appellent la production d’inférences. Ils y parviennent en « combinant des experts ». Si vous connaissez l’émission « Who Wants to Be a Millionaire? », c’est un peu comme si l’on vous posait une question très difficile sur le sport par exemple, et que vous exerciez votre droit d’appeler l’une de vos connaissances, spécialiste des Olympiques ; disons qu’elle a plus de chance de connaître la réponse que votre ami versé dans les sciences.
Savoir à qui poser la question peut donc vous permettre d’obtenir rapidement la bonne réponse. C’est ce que permet la « combinaison d’experts ». Ainsi, au lieu de poser la question à l’ensemble de votre carnet d’adresses bien rempli (l’approche traditionnelle de production d’inférences), vous déterminez qui sont les personnes les mieux à même de pouvoir y répondre. Il s’avère que cela ne diminue pas la qualité de la réponse et qu’en plus, vous gagnez beaucoup de temps puisque vous ne vous adressez qu’aux personnes susceptibles de connaître la réponse. Vous obtenez une qualité de réponse équivalente pour une fraction du coût. Au fait, ils y sont aussi parvenus en employant ce que les technologues considéraient comme une technologie assez vieillotte, ce qui est en soi une réussite considérable.
Qu’est-ce que cela signifie pour le secteur ? Qu’en est-il des perspectives pour les sociétés technologiques et, surtout, pour les investisseurs ?
Prenons en considération le secteur entier de la technologie. Tout commence avec un certain nombre de grandes entreprises technologiques qui développent de grands modèles de langage. Elles le font dans de très grands centres de données à coup de milliards de dollars, et les utilisateurs auront besoin de petites centrales nucléaires simplement pour les faire fonctionner. Si vous dépensez des milliards de dollars, mais que d’autres y parviennent à moindre coût, vous aurez de la difficulté à demander votre prix compte tenu de tout le travail accompli.
Certaines de ces sociétés devront se doter de nouveaux modèles d’affaires pour justifier les dépenses en immobilisations affectées aux centres de données, etc. Il faut ensuite penser aux fabricants de puces, comme Nvidia et AMD. Certains d’entre eux continuent de faire des choses exceptionnelles, mais leurs clients utilisent leurs puces en partie pour l’entraînement ; là encore, les enjeux économiques et la production d’inférences, dont les coûts baissent de façon spectaculaire, sont peut-être un peu plus remis en question.
Peut-être que cela a des répercussions sur la génération du chiffre d’affaires, qui représente le volume multiplié par le prix. Peut-être le volume augmente-t-il de façon spectaculaire, mais le prix chute considérablement. Quelles sont les répercussions sur les finances de certains de ces fabricants de puces ? C’est une grande question que les investisseurs doivent se poser en ce moment.
Viennent ensuite les sociétés de l’infonuagique, qui font appel à des sociétés comme Microsoft, Alphabet et Amazon, qui exploitent ces centres de données et produisent toutes ces inférences. Si la production d’inférences devient vraiment bon marché et qu’elle augmente de façon marquée, ces centres de données fonctionneront à plein régime. C’est probablement une bonne nouvelle, parce qu’ils pourront ainsi augmenter leurs prix. En outre, s’il est possible d’utiliser des technologies plus anciennes, le coût devrait aussi être moins élevé que ce qui était initialement prévu. Ultimement, le résultat sera probablement avantageux.
En ce qui a trait aux sociétés de logiciels, certaines peuvent très bien tirer leur épingle du jeu. Si vous êtes en intelligence artificielle, les coûts pourraient avoir chuté de façon spectaculaire grâce à cette percée technologique. Cela signifie, espérons-le, que vos profits augmenteront. Mais en fait, si l’IA devient très bon marché à déployer et à utiliser, elle le sera pour tout le monde et deviendra une technologie de plateforme.
L’analogie ici peut être l’électricité ou le transport aérien, grâce auquel il est possible de traverser l’Atlantique en seulement quelques heures, secteur qui a en fait été bâti sur l’efficacité et la réduction du coût moyen par siège par kilomètre parcouru. C’est peut-être le modèle qu’il faut envisager ici. Un modèle pour les sociétés de logiciels qui présente un avantage concurrentiel qui leur permet de profiter des gains d’efficacité générés par l’intelligence artificielle et d’en faire profiter leurs parties prenantes, y compris les investisseurs.
Puis la communauté finale, les consommateurs. Ce sont eux les véritables bénéficiaires, parce que je pense que nous utilisons tous l’IA, que ce soit au travail ou par l’intermédiaire d’un abonnement. Cependant, nous ne l’utilisons probablement pas tout le temps, en partie à cause du coût qui y est associé. La technologie est limitée en fonction du nombre de jetons textuels à utiliser ou peut-être nécessite-t-elle un abonnement mensuel, par exemple, mais si l’IA devient omniprésente, les consommateurs pourraient en fait y avoir accès en tout temps sur leur téléphone intelligent.
Nous pourrions même être capables de l’utiliser sur nos ordinateurs ou même sur d’anciens téléphones, sans devoir être tout le temps connectés à Internet. Imaginez la vague d’innovations que cela pourrait provoquer, du moins pour ce type de situation. C’est un peu comme passer des modems à composition automatique dans la version Internet 1.0, au monde des téléphones intelligents. Qui aurait pensé à l’époque, quand nous connections nos ordinateurs à la fin de la journée pour lire nos courriels, que cela conduirait à des modèles d’affaires comme Airbnb et Uber.
L’avenir est donc prometteur ! Cette grande percée technologique créée beaucoup d’occasions. Les investisseurs doivent maintenant déterminer ce qui sera le plus avantageux dans cette poche de valeur. En réfléchissant à la répartition de l’actif dans le secteur et dans notre portefeuille, nous avons commencé au cours des derniers mois à transférer du capital vers le haut de cette poche de valeur, vers certains des modèles d’affaires qui à notre avis seront des bénéficiaires nets de cette percée.
J’espère que cette présentation vous a intéressé. Au plaisir de vous reparler bientôt.