Être un data scientist était censé être « le job le plus sexy du 21e siècle ». La question de savoir si le célèbre aphorisme de la Harvard Business Review de 2012 tient la route. Cependant, les données concernant les data scientists, ainsi que les rôles connexes d’ingénierie des données et d’analyste des données, commencent à tirer la sonnette d’alarme.
La partie subjective de l’aphorisme de la Harvard Business Review est de savoir si vous aimez réellement trouver et nettoyer les données, construire et déboguer les pipelines de données et le code d’intégration, ainsi que construire et améliorer les modèles de machine learning. C’est à cette liste de tâches, dans cet ordre, que les data scientists consacrent la majeure partie de leur temps.
Certaines personnes sont véritablement attirées par les carrières axées sur les données par la description du poste, tandis que la croissance de la demande et des salaires en attire d’autres. Si les côtés sombres de la description de poste eux-mêmes ne sont pas inconnus, la partie croissance et salaires n’a pas été beaucoup contestée. Toutefois, la situation pourrait changer : les postes de data scientists sont toujours très demandés, mais ne sont pas à l’abri des turbulences du marché.
Des signaux mitigés
Au début de l’année 2022, le premier signe que quelque chose est peut-être en train de changer est apparu. Comme l’a montré une analyse de l’IEEE Spectrum des données publiées par l’entreprise de recrutement en ligne Dice en 2021, les salaires dans le domaine de l’IA et du machine learning ont chuté, même si, en moyenne, les salaires dans le secteur technologique américain ont augmenté de près de 7 %. Cependant, comme le note l’IEEE Spectrum, la concurrence pour les experts en machine learning, en traitement du langage naturel et en IA s’est adoucie, avec des salaires moyens en baisse de 2,1 %, 7,8 % et 8,9 %, respectivement.
C’est la première fois que cela se produit ces dernières années, car les salaires moyens aux États-Unis pour les ingénieurs logiciels ayant une expertise en machine learning, par exemple, ont bondi de 22 % en 2019 par rapport à 2018, puis ont encore augmenté de 3,1 % en 2020. Dans le même temps, la demande de rôles de data scientists ne montre aucun signe d’apaisement, au contraire.
Les plateformes de recrutement de développeurs déclarent constater une forte hausse de la demande de compétences informatiques liées à la data science. Le dernier rapport de la plateforme de sélection et d’entretien de développeurs DevSkiller a enregistré une augmentation de 295 % du nombre de tâches liées à la data science que les recruteurs fixaient aux candidats lors du processus d’entretien en 2021.
L’enquête 2022 Tech Hiring de CodinGame et CoderPad a également identifié la data science comme une profession pour laquelle la demande dépasse largement l’offre, avec les spécialistes de DevOps et du machine learning. Par conséquent, les employeurs devront réévaluer les salaires et les avantages sociaux qu’ils offrent à leurs employés s’ils veulent rester compétitifs.
Vague de licenciements
En outre, l’année 2021 a été marquée par ce que l’on a appelé le phénomène de la « Grande Démission », une période où tout le monde repense tout, y compris sa carrière. En théorie, le fait qu’une partie de la main-d’œuvre redéfinisse sa trajectoire et ses objectifs et/ou démissionne devrait augmenter la demande et les salaires – des analyses sur les raisons pour lesquelles les data scientists démissionnent et ce que les employeurs peuvent faire pour les retenir ont commencé à circuler.
Puis sont arrivés les licenciements, notamment ceux des rôles de data scientist, data engineer et data analyst. Comme le note l’analyse de LinkedIn sur la dernière série de licenciements, l’année tumultueuse du secteur technologique a été marquée par des annonces quotidiennes de licenciements, de gels d’embauche et d’annulations d’offres d’emploi.
Environ 17 000 travailleurs de plus de 70 start-ups technologiques dans le monde ont été licenciés en mai, soit un bond de 350 % par rapport à avril. Il s’agit du nombre le plus important d’emplois perdus dans le secteur depuis mai 2020, au plus fort de la pandémie. En outre, des géants de la technologie tels que Netflix et PayPal suppriment également des emplois, tandis que Uber, Lyft, Snap et Meta ont ralenti les embauches. Selon les données partagées par le site de suivi des licenciements dans le secteur des technologies Layoffs.fyi, les licenciements concernent entre 7 % et 33 % des effectifs des entreprises suivies. En examinant les données spécifiques à chaque entreprise, on constate qu’il s’agit également de postes axés sur les données.
L’examen des données relatives aux licenciements de la fintech Klarna et de la startup d’assurance PolicyGenius, par exemple, montre que les rôles de data scientists, d’ingénieur et d’analyste de données sont touchés aux niveaux junior et senior. Dans les deux entreprises, ces rôles représentent environ 4 % des licenciements.
Mesurer les conséquences de l’automatisation
Que devons-nous penser de ces signaux contradictoires ? La demande de tâches liées à la data science semble rester forte, mais les salaires baissent et ces rôles ne sont pas non plus à l’abri des licenciements. Chacun de ces signaux s’accompagne de son propre contexte et de ses propres implications.
Comme l’a indiqué Michelle Marian, directrice du marketing de Dice, à IEEE Spectrum, divers facteurs contribuent probablement à la baisse des salaires dans le domaine du machine learning et de l’IA, l’un d’entre eux étant que davantage de technologues apprennent et maîtrisent ces compétences. « L’augmentation du nombre de talents au fil du temps peut amener les employeurs à devoir payer au moins légèrement moins, étant donné que les compétences sont plus faciles à trouver. Nous avons vu cela se produire avec une série de certifications et d’autres compétences technologiques hautement spécialisées », a-t-elle déclaré.
Cela semble être une conclusion raisonnable. Cependant, pour la data science et le machine learning, quelque chose d’autre est peut-être en jeu. Les data scientists et les experts en ML ne sont pas seulement en concurrence les uns avec les autres, mais aussi de plus en plus avec l’automatisation. Comme le fait remarquer Peter Yuen, gestionnaire de portefeuille quantitatif basé à Hong Kong, les analystes quantitatifs ont déjà vu tout cela.
Après avoir appris que des chercheurs de haut niveau en IA ont obtenu des salaires de l’ordre d’un million de dollars, Peter Yuen écrit que cela « devrait être interprété avec plus de précision comme la poursuite d’une longue tendance des « coolies » de la haute technologie à se coder eux-mêmes pour perdre leur emploi sur fond de surabondance mondiale de main-d’œuvre qualifiée ».
« Si l’on se fie à l’expérience de trois générations de quants dans l’automatisation des marchés financiers », écrit Peter Yuen, « l’automatisation des praticiens de base de l’IA dans de nombreux secteurs n’est peut-être que pour une dizaine d’années ». Après cela, ajoute-t-il, « un petit groupe d’élite de praticiens de l’IA aura atteint le statut de cadre ou de propriétaire, tandis que les autres seront coincés dans des emplois moyennement rémunérés, chargés de surveiller et d’entretenir leurs créations. »
Nous en sommes peut-être déjà aux premières étapes de ce cycle, comme en témoignent des développements tels que AutoML et les bibliothèques de modèles de ML prêts à l’emploi. Si l’on se fie à l’histoire, ce que décrit Peter Yuen se réalisera probablement aussi, ce qui conduira inévitablement à des questions sur la façon dont les travailleurs déplacés peuvent « monter dans la pile ».
L’éclatement de la bulle de l’IA
Cependant, on peut probablement supposer que les experts en data science n’auront pas trop à s’inquiéter de cela dans un avenir immédiat. Après tout, un autre fait souvent cité à propos des projets de data science est que près de 80% d’entre eux échouent toujours pour un certain nombre de raisons.
Le cas de Zillow illustre notamment l’échec de la data science. L’activité de Zillow s’est fortement appuyée sur l’équipe de data science pour construire des modèles prédictifs précis pour son service d’achat de maisons. Il s’est avéré que les modèles n’étaient pas si précis que cela. En conséquence, l’action de la société a chuté de plus de 30 % en 5 jours, le PDG a rejeté la faute sur l’équipe de data science et 25 % du personnel a été licencié.
Que l’équipe de data science soit en faute ou non chez Zillow est sujet à débat. Quant aux récents licenciements, ils devraient probablement être considérés comme faisant partie d’un tournant plus important dans l’économie plutôt que comme un échec des équipes de data science en soi. Comme l’écrit Kurt Cagle, rédacteur de la communauté de Data Science Central, on parle d’un hiver imminent de l’IA, qui rappelle la période des années 1970 où le financement des projets d’IA s’est complètement tari.
Kurt Cagle estime que si un hiver de l’IA est improbable, on peut s’attendre à un automne de l’IA avec un refroidissement de la surenchère du capital-risque dans cet espace. L’hiver de l’IA des années 1970 était en grande partie dû au fait que la technologie n’était pas à la hauteur de la tâche et qu’il n’y avait pas assez de données numérisées à exploiter.
Aujourd’hui, la puissance de calcul disponible est beaucoup plus importante et la quantité de données monte en flèche. Selon Kurt Cagle, le problème pourrait être que nous approchons des limites des architectures de réseaux neuronaux actuellement utilisées.
Comme beaucoup d’autres, Kurt Cagle souligne les lacunes du système de pensée qui consiste à dire que « le deep learning sera capable de tout faire ». Cette critique semble valable, et l’intégration d’approches aujourd’hui négligées pourrait faire progresser le domaine. Cependant, n’oublions pas que l’aspect technologique n’est pas le seul qui compte ici.
L’histoire récente peut peut-être nous éclairer : que peut nous apprendre l’histoire du développement des logiciels et d’Internet ? À certains égards, le point où nous en sommes aujourd’hui rappelle l’époque de la bulle Internet : disponibilité accrue des capitaux, spéculation excessive, attentes irréalistes et valorisations hors normes. Aujourd’hui, nous nous dirigeons peut-être vers l’éclatement de la bulle de l’IA. Cela ne signifie pas que les rôles de la data science perdront leur attrait du jour au lendemain ou que ce qu’ils font est sans valeur. Après tout, les ingénieurs logiciels sont toujours demandés pour tous les progrès et l’automatisation que le génie logiciel a connu au cours des dernières décennies. Mais cela signifie probablement qu’un recalibrage est nécessaire et que les attentes doivent être gérées en conséquence.
Source : ZDNet.com
(function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) return; js = d.createElement(s); js.id = id; js.src = "//connect.facebook.net/fr_FR/all.js#appId=243265768935&xfbml=1"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk'));