Introduction au Big Data et Machine Learning

Inter-company training

Who is the training for?

Consultants, Consultants IT, Web Designer, Data Scientist

Duration

2,00 day(s)

Language(s) of service

EN FR

Next session

06.12.2024
Location
Windhof (Koerich)

Price

1270,00€

Goals

Présenter les enjeux de l’analyse des données numériques à grande échelle.
Comprendre le concept de valorisation de la donnée.
Maîtriser le vocabulaire lié au big data et à la data science
Comprendre la problématique de traitement de données massives à des fins d’analyse.
Identifier les risques et opportunités du Big Data pour les individus (vie privée, protection des données personnelles…).
Conduire un projet Big Data en entreprise (étapes projets, bonnes pratiques, schémas organisationnels et gouvernance des données).
Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs.

Contents

Comprendre les concepts et les enjeux du Big Data
  • Découvrir les concepts du Big Data
  • Définition d’un projet Big Data
  • Big data en entreprise
    • Principes de fonctionnement
    • Les secteurs impactés
    • Comment se reconvertir dans le big data?
    • La gouvernance des données
  • Les spécificités d’un projet big data
  • Les enjeux du Big Data: organisation, confidentialité des données, GPDR
Les technologies du Big Data
  • Business Intelligence vs Big Data
  • Architecture et composants de la plateforme Hadoop
  • Les modes de stockage
    • Le stockage fichiers: Hadoop Distributed File System (HDFS)
    • Stockage colonne, graph, clé/valeur et document:
  • Paradigme MapReduce
  • Spark: framework de calcul distribué in memory
  • Les architectures big data
  • Les technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview...)
Atelier
  • Installation d'une plateforme Big Data Hadoop
  • Implémentation de flux de données massives
Data Science: Méthodes d'analyse et traitements des données pour le Big Data
  • Les bases de l'apprentissage Machine (Machine Learning)
  • Prétraitement des données
  • La réduction de dimensions
  • Les types des modèles du machine learning: Clustering, Classification, Regression
  • L'évaluation des modèles
  • Les méthodes d’ensemble
  • Le langage Python pour le Big Data et le Machine Learning: Pandas, Scipy, Scikit-learn, TensorFlow
  • Communiquer ses résultats à l’aide de représentations graphiques lisibles et pertinentes
Ateliers Données
  • Visualisation des données
  • Exploration et sélection/ingénierie des variables
  • Application des méthodes d’apprentissage automatique
  • Sélection de modèles et méthodes d’ensemble

Certificate, diploma

Une attestation de participation sera transmise aux participants

Next session

Datum
City
Language and price
06.12.2024

07.12.2024
Windhof (Koerich)
FR 1270,00€

Organization contact details

Nathalie Thielemans / Nassera Aici

These courses might interest you