Portrait : Suhaib, Data Scientist
Data Scientist, Data Analyst, Data Officer... pas simple de comprendre le rôle de ces métiers du Big Data, métiers issus de cette nouvelle génération d’emplois créés grâce au digital, à la donnée, à la technologie…
Des métiers déconcertants à leurs débuts et qui, pourtant, ont su s’imposer jusqu’à connaître une ascension fulgurante et devenir l’un des secteurs les plus prisés des jeunes diplômés des plus grandes écoles d’ingénieurs, et ce, partout dans le monde.
Les métiers du Big Data, sont sans aucun doute aujourd’hui un pilier de la croissance mondiale. Devenus incontournables, leur maîtrise est indispensable pour n’importe quelle entreprise actuelle.
Chez Rakuten, les nombreux moyens dont nous disposons pour développer le trafic sur la plateforme (affiliation, acquisition, notre catalogue de plusieurs millions de produits neuf et de seconde main...), génèrent inévitablement une quantité très importante de données issue de différents outils, qui elles-mêmes constituent des informations primordiales pour définir les tendances de consommation de notre communauté de 10 millions de membres d'acheteurs et de vendeurs inscrits au Club R.
Nous avons donc demandé à Suhaib de nous présenter son rôle tant convoité de Data Scientist pour mieux comprendre son quotidien.
Mais pour commencer, revenons un peu sur l’histoire de la Data Science...
Tout a commencé.... dans les années 60’s !
C'est à John W. Tukey, que l’on doit le terme « Data Analysis ». Déjà à l’époque, le traitement d’un grand nombre de données pour en extraire des tendances relevait plus d’une science empirique que des mathématiques pures.
Plus de 10 ans plus tard, les entreprises se rendent comptent des quantités faramineuses d’informations dont elles disposent et commencent alors à réfléchir à la meilleure manière de les exploiter afin de créer des parcours clients adaptés.
Puis dans les années 2000, la Data Science émerge véritablement. Les premiers magazines dédiés sont publiés.
Mais c’est à partir de 2009, que l’explosion du terme « Data Science » est amorcée, grâce à une interview de Hal Varian, l’économiste en chef de Google, pendant laquelle il a déclaré que les statisticiens auraient le job le plus « sexy » des 10 prochaines années. Il a même ajouté que la capacité à extraire des informations pertinentes à partir de données brutes serait l’un des métiers les plus importants des années à venir. Il ambitionnait déjà l’importance de maîtriser la data, qu'elle soit accessible à tous, bref, que l’avènement de la Data Science approchait.
A peine quelques années plus tard, l’engouement pour la Data Science est tel que sur l’année 2012 les offres d’emploi pour le poste de Data Scientist ont bondi de +15 000 %*
Bonjour Suhaib, peux-tu te présenter ?
Je suis Data Scientist SEO et j’ai rejoint Rakuten en 2020, plus précisément, le 9 mars, quelques jours à peine avant le début du tout premier confinement. Une arrivée donc un peu spéciale !
Quel est concrètement ton rôle chez Rakuten ?
Vous savez, chez Rakuten, en tant que plateforme e-commerce, nous avons des millions de pages à étudier, donc nous ne pourrions pas traiter les données manuellement, c’est impossible. Mon rôle est donc d’accélérer les process, de plonger au cœur de ces données pour extraire des analyses, prédire et anticiper nos actions.
Avec l’aide de l’équipe dédiée qui compte un peu moins d’une dizaine de personnes, mon objectif est de transformer le pôle SEO qui innove sans cesse grâce à des modèles de Machine Learning et d’Intelligence Artificielle qui vont traiter la Data, omniprésente, pour améliorer notre positionnement, notre ranking lors des recherches Google, notamment. Mais c'est surtout de faire des prévisions les plus justes afin d'ajuster la stratégie de Rakuten.
Quelle est la différence entre un Data Analyst et un Data Scientist ?
Pas simple de connaitre la différence. Il faut d’abord comprendre qu’il y a plusieurs étapes dans le traitement des données : il faut évidemment les chercher avec un Data Engineering, puis, une fois récupérées en format brut, il faut les traiter, les nettoyer, les mettre en forme, ... bref, les rendre exploitable !
Selon moi, le Data Analyst va intervenir dans l’analyse des données qui sont déjà « nettoyées », il n’y a pas ou peu de Machine Learning, d’IA, pas de programmation.
Un Data Scientist, c’est plus complexe. Nous allons nous concentrer sur les formats des données. Une fois ces dernières nettoyées, on peut ensuite créer des modèles d’analyse qui permettront alors de réaliser des prévisions. Et pour cela, nous devons savoir programmer, développer. Parce que oui, en SEO, nous sommes capables de prédire les visites de nos pages jusqu’à 2 ans et ainsi être susceptible d’affirmer qu’il est nécessaire de se concentrer sur telle ou telle page pour augmenter le trafic, lancer davantage de projets, etc.
Qu'est-ce qui te plait le plus en tant que Data Scientist ?
TOUT ! C'est passionnant. Nous sommes constamment dans une logique et une approche de Test & Learn.
Ça ne marche pas ? Ok, on recommence, on essaye avec un autre algorithme ! Et puisqu’il s’agit d’un métier récent, il y a pleins de choses que l’on peut expérimenter. On en apprend tous les jours.
Pourquoi as-tu décidé de t’orienter dans cette voie ?
Plus jeune, je rêvais d’être médecin. Mais fan de nouvelles technologies, j’étais surtout curieux de comprendre le fonctionnement de sites comme Facebook. Alors en première année de licence, je me suis posé la question : et si je faisais une licence de traitement informatiques des langues ?
J'ai ensuite poursuivi avec un master Data Science pour travailler sur le texte mais de manière automatique, comme par exemple avec Siri sur Apple. C’est fascinant d’être à l’intersection entre le langage naturel et l’IA.
J'adore, et pour rien au monde, je ferai autre chose !
Quelles sont les compétences indispensables pour un Data Scientist ?
Savoir programmer évidemment mais la partie technique ça s’apprend ! Il faut surtout avoir une certaine vision de la donnée . Il faut être capable d’identifier une problématique. Par exemple, un Développeur et un Data Scientist ne vont pas avoir la même construction d’un projet. Il est donc primordial de savoir comment traiter la donnée brute. La construction d’un projet est une étape très importante parce que c’est à partir de là, qu’ensuite, on s’oriente vers la programmation.
Et être Data Scientist chez Rakuten France ?
Chez Rakuten, non seulement, il y a un trésor de données à exploiter mais aussi une réelle synergie entre les équipes qu’on ne trouve pas partout.
On partage par exemple nos projets avec nos homologues situés au siège, au Japon. C'est intéressant de voir la différence entre nos 2 pays, c’est une réelle valeur ajoutée en termes d'apprentissage. Contrairement à ce que l’on pourrait penser, nous sommes finalement assez complémentaires.
Nous échangeons aussi beaucoup avec Rakuten Institute of Technology, l'entité du groupe dédiée à la recherche et au développement.
*Source: la revue ValueWalk