Data science & Intelligence artificielle
Nous intervenons sur l’ensemble du cycle de vie d’un projet, depuis la phase d’identification et de définition du business case avec l’analyse du problème posé, l’identification des sources de données et la collecte de données complémentaires.
Nos équipes abordent ensuite la phase de préparation et d’analyse de données (description, sélection, nettoyage, formatage des données pour l’analyse) ainsi que la réalisation de l’étude statistique exploratoire (EDA) et des opérations de normalisation des données.
La phase suivante consiste à modéliser les données avec l’identification des algorithmes et modèles pertinents, l’entrainement des algorithmes, l’évaluation de l’efficacité, l’optimisation en "Trial & Error", AutoML et Dataviz.
Vient enfin la phase d’industrialisation avec la mise en place de chaine d’initialisation pour maitriser le cycle de vie de la donnée (Airflow, MLOps …) et l’intégration au Système d’information à travers des API.
Lors de nos projets, nous choisissons la meilleure combinaison de langages (Python, R, Java), de librairies de machine/deep learning (Spark ML, scikit-learn, TensorFlow, keras), de notebooks (Jupyter) et de plateformes (Knime, H2O.ai & RStudio).