Stage

Où ?

Paris 75

Campus à proximité :

Paris
 
Big Data
Blockchain
DevOps
Docker
Git
Machine Learning
Python
Partager l'offre
Data

Stage - Trimane - Data Science H/F

Big DataBlockchainDevOpsDockerGitMachine LearningPython
Stage

Éligible sur :

Paris
 

Paris 75

Qui

The Blockchain Group

Trimane est une entreprise de services numériques (ESN) spécialisée dans les missions d’audit, de conception et de réalisation de projets Business Intelligence et Big Data. Forte de son expérience et de son image d’experte dans le secteur, elle souhaite désormais étendre ses activités à des missions plus spécifiques d’analyse de données.

Trimane est basée à Paris et Toulouse.

Quoi

L’objectif de ce stage est de s’appuyer sur les techniques d’apprentissage automatique afin d’améliorer cette étape d’identification et de la rendre plus exhaustive. Plus formellement, le but est de parvenir à définir une liste de prédicats permettant de déterminer les points de données jugés anormaux à partir d’un jeu de données arbitraire. Une étape préliminaire cruciale consistera à expliciter formellement ce que constitue le caractère anormal selon le type de donnée géré (relationnelle, tabulaire, temporelle, image, …).
Le stagiaire pourra notamment s’inspirer du frameworkSnorkel1qui permet approximativement la fonction inverse (définir manuellement une liste de prédicats et laisser le framework générer des données respectant la forme du jeu de donnée initial).
Des techniques de détection d’anomalies basées sur la variation de densité locale peuvent également être envisagées. Le stagiaire pourra s’appuyer sur un ensemble de jeux de données réels et des règles de nettoyage associées venant de l’historique des réalisations de Trimane.
Ces jeux d’entraînement pourront éventuellement être complétés avec des exemples de nettoyage de données fournis librement ici et là sur Internet, dans le respect des licences de réutilisation. Pendant la durée de stage, ce sujet peut faire l’objet d’évolutions pour s’adapter aux contraintes de la société Trimane. En cas de modification importante, il sera soumis à l’approbation des parties signataires de la convention.
Attendu:
Le stage étant principalement une mission de recherche et d’analyse, l’attendu demandé est un prototype jouant le rôle de preuve de concept et permettant de tester la technologie développée. Une visualisation graphique des résultats par un outil de restitution sera également valorisée et soutenue. Une mise en production au sein d’outils internes et déployés pourra être envisagée selon le niveau de maturité du prototype.
Environnement technique:
L’environnement technique de développement est laissé assez libre. Une préférence est toutefois émise quant à l’utilisation de composants libres et gratuits pour le développement de la solution.

 

Pour qui

De solides connaissances en analyse de données et conception de modèles issus du Machine Learning sont requises pour ce stage. Une preuve de concept étant à développer à l’issue de ce stage, la maîtrise d’un langage de programmation, –idéalement Python –est également demandée. Une connaissance des techniques de développement au sein d’un milieu DevOps (versioning avec Git, gestion de conteneurs, création d’image Docker, intégration continue, …) sera en outre valorisée.


Le profil idéal est rigoureux, organisé, créatif techniquement, et capable d’autonomie.


Combien de temps

6 mois

Quand

Asap