Alternance

Où ?

Paris 75

Campus à proximité :

Paris
 
Big Data
Git
Machine Learning
NLP
Python
Web
Partager l'offre
Data

Alternance - IFP Energies Nouvelles - Data Analyst H/F

Big DataGitMachine LearningNLPPythonWeb
Alternance

Éligible sur :

Paris
 

Paris 75

Qui

IFP Energies Nouvelles

IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. De la recherche à l’industrie, l’innovation technologique est au cœur de son action, articulée autour de quatre priorités stratégiques : Mobilité Durable, Energies Nouvelles, Climat / Environnement / Economie circulaire et Hydrocarbures Responsables.

Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur :

• l’apport de solutions aux défis sociétaux de l’énergie et du climat, en favorisant la transition vers une mobilité durable et l’émergence d’un mix énergétique plus diversifié ;
• la création de richesse et d’emplois, en soutenant l’activité économique française et européenne et la compétitivité des filières industrielles associées.

Partie intégrante d’IFPEN, l’école d’ingénieurs IFP School prépare les générations futures à relever ces défis.

Quoi

Au sein de la direction du Digital Office et en interaction avec des projets, l’alternant sera amené à travailler sur des sujets allant de l’algorithme à la construction de web-application visant à démontrer ces algorithmes.
Des cas d’utilisation sont déjà définis comme l’analyse par NLP de tweets afin de localiser des zones où la qualité de l’air suscite des plaintes. Une web-application en lien sera construite de manière à proposer une restitution efficace des informations. En fonction de l’avancement d’autres cas pourront être traité.

A l’instar de la plateforme suricate du BRGM (http://www.suricatenat.fr) qui cherche dans les tweets des informations concernant une catastrophe naturelle (séismes, inondations…) ou encore de l’organisation mondiale de la santé qui prévoit, grâce à l’aide des tweets, l’épidémie de gastroentérite quatre semaines avant le pic de contamination, IFPEN cherche à identifier les zones où la qualité de l’air est mise à mal.

Plusieurs étapes seront nécessaires pour réaliser cet objectif, les différentes étapes non exhaustives suivantes seront à adresser :

• Se familiariser avec l’API de twitter dans l’objectif de récupérer les tweets intéressants. Par exemple sur les tweets en streaming en appliquant des filtres par mot clé de type : « pollution de l’air » ou « fumées »,
• Analyser les tweets : à partir du tweet il faudra essayer d’identifier sa pertinence, ainsi que les différentes localisations associées. Pour cette étape nous utiliserons des modèles NLP de reconnaissance d’entités nommées. Un état de l’art et un benchmark des modèles disponibles sera à faire, puis si besoin le fine-tuning, de modèles existants pour les améliorer.
• Construire une web-application permettant de restituer les résultats de manière efficace.

Pour qui

Contrat de professionnalisation ou d’alternance, en dernière année d’école d’ingénieur ou en master 2, formé aux algorithmes « IA » : Machine Learning, Deep Learning, incluant le Natural Language Processing (NLP) et intéressé par la programmation (web-services, web-applications).


• Une bonne maîtrise des outils de programmation (Python ou R) et de versioning (Git).

• Une bonne maîtrise des outils de Machine Learning et Deep Learning notamment pyTorch.

• La connaissance des packages python plotly et dash serait un plus.

• Autonomie, organisation et rigueur de travail.


Combien de temps

12/24 mois

Quand

Septembre 22