Comment devenir un(e) Data Scientist ?

Le métier de Data Scientist

Le métier de Data Scientist fait partie des « nouveaux métiers » liés à l’avènement du digital.
« Big Data », avant toute chose, il est important de comprendre ce que veut dire ce terme barbare. C’est un immense ensemble de données brutes et complexes, stockées dans un data center. Le Data Scientist doit donc être un expert du traitement et de l’interprétation de ces données et peut faire appel à ces petits collègues : le Data Miner et l’Analyst Data.

 

Data Scientist : descriptif du poste

Saviez-vous que le terme de « Data Scientist » a été créé pour deux ingénieurs de Facebook et Linkedin en 2007 ? Et depuis, ce nouveau métier a parcouru du chemin et est devenu en quelques années le « métier le plus sexy du XXIe siècle » selon la Harvard Business Review.

Recruter un Data Scientist n’est pas aussi simple qu’il n’y paraît, il faut trouver la perle rare : quelqu’un qui traite, analyse et manie parfaitement les données pour ensuite en tirer des applications pour le service commercial, marketing, service après-vente, clientèle, etc.

Entre algorithmes complexes, formules mathématiques et indicateurs, l’objectif principal du Data Scientist est de faire parler la donnée qui est recueillie de part et d’autre par l’entreprise via différents canaux et de la restituer sous forme de conseils, de service, d’amélioration produit… En général, il débute d’une problématique définie par l’entreprise et commence à analyser la donnée pour résoudre le problème.

Du côté des offres d’emploi en CDI pour le poste de Data Scientist, la demande des entreprises est de plus en plus forte, mais vu l’importance du niveau technique requis pour accéder à ce type de poste, les candidats se font rares. En France, il existe quelques événements dédiés au Big Data, qui permettent de trouver pour l’entreprise le Data Scientist qui leur conviendrait parfaitement comme le Big Data Paris ou le Data Job.

Quelles sont les aptitudes nécessaires pour être un Data Scientist ?

 

Les missions du Data Scientist

De façon grossière, on peut décomposer les missions du Data Scientist en quatre grands points :

  1. Le Data Scientist doit comprendre et analyser la problématique de l’entreprise.
  2. Il doit ensuite pouvoir modéliser statistiquement sa réflexion.
  3. Il faut qu’il détermine quelles sont les données les plus pertinentes à récolter en fonction de ses besoins. Si elles ne sont pas encore existantes, il doit trouver quels seront les canaux d’acquisition les plus propices.
  4. Pour finir, il doit restituer les résultats pour qu’ils répondent parfaitement à une stratégie. Des Big Data nous entrons dans le monde des « Smart Data ».

 

 

L'environnement technique des Data Scientist

Analyste, statisticien, mathématicien, développeur… Le métier de Data Scientist nécessite des connaissances accrues dans tous ces domaines et plus particulièrement la maîtrise des calculs statistiques et d’au moins un outil analytique. Les postes de Data Scientist exigent le plus souvent la connaissance d’un ou plusieurs langages de programmation, le plus utilisé est Python, mais il peut être amené à utiliser Java, Perl ou C/C++.

Un bon Data Scientist doit aussi être capable de comprendre l’algèbre linéaire et les fonctions de plusieurs variables.

En tant qu’entreprise, si vous souhaitez recruter un Data Scientist en CDI, vous pouvez exiger la maîtrise de la plateforme Hadoop, un Framework logiciel open source qui permet de conserver des données dans un espace de stockage massif.
En tant que candidat, un argument de poids pourrait vous être utile pour votre futur recrutement : une expérience avec les outils de traitement Hive et Pig par exemple, ainsi que l’utilisation des outils de cloud. Même si la maîtrise du Framework Hadoop est très largement imposée dans le domaine du Big Data, un Data Scientist doit aussi savoir programmer en SQL pour pouvoir formuler et exécuter des requêtes complexes.

Le profil du Data Scientist

En plus de toutes ses compétences techniques vues précédemment, le Data Scientist doit disposer de diverses affinités comme :

  • Des compétences en ingénierie logicielle : si l’entreprise voulant recruter un Data Scientist n’est pas accoutumée au « Big Data », ce dernier pourra prendre le rôle d’un ingénieur logiciel qui lui permettra de prendre en charge le développement d’un produit, dirigé par les données qu’il reçoit.
  • Des compétences en Machine Learning : c’est une technologie d’intelligence artificielle qui permet aux ordinateurs d’apprendre sans avoir été programmés à cet effet. Le Machine Learning et le Big Data sont étroitement liés, car la data est l’essence même du Machine Learning.
  • Des compétences en communication et marketing : une fois intégré dans l’entreprise, le Data Scientist doit être capable des communiquer au reste des collaborateurs ses découvertes techniques ou de comprendre les problèmes des différents pôles, surtout marketing et commercial, et de les aider à relever les différents défis. Au final, le Data Scientist est un scientifique communiquant !
  • Des compétences créatives et de curiosité intellectuelle : deux notions indispensables pour savoir quelles seront les données les plus intéressantes à exploiter.
  • Des compétences entrepreneuriales : le Data Scientist doit avoir cette fibre d’entrepreneur pour comprendre le monde de l’entreprise et plus particulièrement le secteur d’activité dans lequel il va être recruté.
Entre business et sciences, quelles sont les différentes fonctions d'un Data Scientist ?

 

Les formations pour devenir Data Scientist

À l’heure actuelle, 88% des Data Scientists sont diplômés au minimum d’un master, et 46% d’entre eux sont titulaires d’un doctorat. Cette formation semble nécessaire pour développer un niveau de connaissance suffisant à l’exercice de ce métier.

La majeure partie des professionnels (32%) sont issus d’une formation dans le domaine des mathématiques et des statistiques. 19% ont étudié les sciences informatiques et 16% proviennent d’écoles d’ingénieurs.

Il existe de plus en plus de formations pour devenir Data Scientist :

  • Les cursus en écoles d’ingénieurs : Ensai, Ensae, Polytechnique, Epita, Télécom ParisTech… Toutes ces écoles proposent aux étudiants un programme de Data Science.
  • Les cursus en universités : Louis-Lumière Lyon II propose un M2 "Data Mining et Business Intelligence", Daupine offre un "Executive Master Statistique et Big Data", un Master "Informatique et Données" à Nantes, un Master "Data Science" à Nice, un Master "Big Data et fouille de données" à Paris VIII… Rien qu’à elle seule, l’Université Paris-Saclay ne présente pas moins de 45 formations dans les Data Sciences : 12 Masters, 5 certifications, 8 spécialités, 4 MBA, etc.
  • Les formations conjointes ingénieurs-management : Essec, Centrale, EPSI… Voici une petite sélection d’écoles proposant des formations pour devenir Data Scientist.

 

Le salaire d'un Data Scientist

La rémunération d’un Data Scientist va varier selon l’expérience du collaborateur et surtout selon son secteur d’activité. Finance, informatique, assurance, e-commerce, grande distribution… Autant de domaines dans lesquels le Data Scientist pourra exercer.

Le salaire moyen d’un Data Scientist est de 43 500€ brut/an selon l’étude des salaires de Glassdor.

  • Junior (-2ans d’expérience) : 40-50K€
  • Confirmé (2 à 5ans d’expérience) : 50-60K€
  • Senior (+6 ans d’expérience) : 60-90K€

 

Comment est-il possible de travailler autrement en tant que Data Scientist ?

Il n’est pas facile de ranger le Data Scientist dans une case. Service de la direction des systèmes d’information, service marketing, service commercial ou même la direction financière… Tout dépend du secteur dans lequel la société évolue et son projet Big Data.

Le Data Scientist travaille le plus souvent en toute transversalité avec les différents pôles de direction et va être amené à collaborer avec des informaticiens, des statisticiens, des développeurs ou même des personnes du service marketing et digital.