Grâce à une vision globale des données de son entreprise, le data scientist est capable d'aider sa direction ou les différents services (marketing, qualité, process...) à prendre des décisions grâce au traitement et à l'analyse de données fiables.
Code ROME : M1403
Le data scientist exploite les données (ou data) d'une entreprise ou du domaine public. Il les collecte, les trie, les organise, les croise et les analyse afin de résoudre des problèmes, par exemple, de qualité ou de maintenance, pour améliorer la production ou les chiffres de vente. Sa vision globale et ses interactions avec de nombreux interlocuteurs internes à l'entreprise lui permettent de proposer des solutions. Il est recherché dans tous les secteurs d'activité.
Aide à la décision
Le data scientist est missionné par un service ou la direction de son entreprise pour collecter, organiser et exploiter des données (aussi appelées big data à cause de leur nombre). Les entreprises ont désormais de grands volumes de données à disposition. Le data scientist les " fait parler " afin d'apporter des éléments d'aide à la décision.
Maîtrise des données
Son travail commence par l'analyse de la demande : exploiter des données industrielles pour une meilleure productivité, améliorer la qualité ou faire de la maintenance préventive en analysant les pannes... Souvent, le data scientist travaille sur les données des clients ou des données publiques à des fins marketing. Il récupère les plus pertinentes sur des serveurs, des fichiers, des bases de données, etc. et les " nettoie ", pour les mettre au bon format ou éliminer celles qui sont inexploitables.
Restitution accessible
Vient ensuite la modélisation et la création d'algorithmes pour croiser et analyser les données. Des essais et ajustements sont nécessaires durant cette phase. La restitution des résultats se fait sous forme de rapports, de graphes, de tableaux ou d'applications. Le data scientist est chargé de l'ensemble de ces tâches dans lesquelles il est aidé par d'autres professionnels des datas, de graphistes, etc.
Maîtrise des outils
Apache Hadoop et Spark, Map Reduce, bases de données NoSQL, langage de programmation SAS, R, Python... Le data scientist doit maîtriser de nombreux programmes informatiques pour mener à bien la collecte, l'analyse et la restitution des données. La programmation, les mathématiques appliquées et en particulier les statistiques n'ont pas de secret pour lui.
Gestion de projets et d'équipes
On demande souvent au data scientist de gérer et de conduire des projets. Il doit donc être à l'aise avec la communication orale et écrite, le suivi d'équipes et l'animation de réunion. Pédagogue, il sait se mettre à la portée de ses interlocuteurs et sait convaincre. On pourra aussi lui demander de gérer un budget et/ou d'évaluer le coût de ses interventions.
Force de proposition
Méthodique et organisé, il travaille généralement en mode projets, pouvant durer de quelques semaines à quelques mois. Il doit aussi être force de proposition et apporter des solutions pour une meilleure collecte des données par exemple, l'achat de nouveaux outils, etc. L'anglais technique est indispensable, notamment pour suivre les évolutions techniques dans son secteur qui lui permettront de proposer de nouveaux modèles d'analyse, des présentations lisibles par tous, etc.
De 2660 à 3160 euros brut par mois
Dans tous les secteurs
Au départ surtout recherchés dans le domaine du e-commerce, de la finance-assurance ou de la grande distribution, les data scientists sont désormais recrutés dans tous les secteurs d'activités, dans les start-up comme dans les grands groupes, et notamment dans l'industrie. Le secteur des big data est très porteur et les data scientists avec une première expérience sont particulièrement demandés pour leur vision transversale sur les données. Paris, Lille, Lyon, Toulouse et Grenoble emploient le plus grand nombre de data scientists.
Des projets de plus en plus importants
Le data scientist démarre souvent au poste de data analyst, sur un périmètre réduit, avant de se voir confier des projets de plus en plus importants et, finalement, la gestion de l'ensemble des données de l'entreprise en tant que data scientist.
Vers le management d'équipe
Dans une grosse structure, le data scientist peut évoluer après quelques années vers le poste de chief data scientist ou chief data officer qui manage une équipe de data scientists. Responsable des projets d'analyse et des outils à mettre en place, le chief data scientist prend part au processus de décision de l'entreprise. Le data scientist peut également prendre la direction des systèmes d'information de l'entreprise.
Le data scientist est recruté au niveau bac + 5 au minimum. Une première expérience, par exemple de data analyst, est souvent demandée. La connaissance d'un secteur d'application (industrie, médical, assurance, finance, etc.) est un plus qui peut s'acquérir au cours d'un stage long.
Niveau bac + 5
Master : datamining, statistiques, informatique, MIAGE, big data et fouille de données, data science, big data, données et systèmes connectés, machine learnng et data mining, mathématiques et applications, mathématiques appliquées statistiques, sciences des données, mathématiques et informatiques appliquées...
Master of science spécialisé data, statistiques et marketing, informatique statistique, etc.
Diplôme d'ingénieur avec double compétence en mathématiques et informatique ou spécialisation big data.