Introduction au Big Data et Machine Learning (Live Virtual Class)

Blended learning

À qui s'adresse la formation?

Consultants, Consultants IT, Web Designer, Data Scientist

Durée

2,00 jour(s)

Langues(s) de prestation

EN FR

Prochaine session

06.12.2024
Lieu
Live Virtual Class

Prix

1270,00€

Objectifs

Présenter les enjeux de l’analyse des données numériques à grande échelle.
Comprendre le concept de valorisation de la donnée.
Maîtriser le vocabulaire lié au big data et à la data science
Comprendre la problématique de traitement de données massives à des fins d’analyse.
Identifier les risques et opportunités du Big Data pour les individus (vie privée, protection des données personnelles…).
Conduire un projet Big Data en entreprise (étapes projets, bonnes pratiques, schémas organisationnels et gouvernance des données).
Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs.

Contenu

Comprendre les concepts et les enjeux du Big Data
  • Découvrir les concepts du Big Data
  • Définition d’un projet Big Data
  • Big data en entreprise
    • Principes de fonctionnement
    • Les secteurs impactés
    • Comment se reconvertir dans le big data?
    • La gouvernance des données
  • Les spécificités d’un projet big data
  • Les enjeux du Big Data: organisation, confidentialité des données, GPDR
Les technologies du Big Data
  • Business Intelligence vs Big Data
  • Architecture et composants de la plateforme Hadoop
  • Les modes de stockage
    • Le stockage fichiers: Hadoop Distributed File System (HDFS)
    • Stockage colonne, graph, clé/valeur et document:
  • Paradigme MapReduce
  • Spark: framework de calcul distribué in memory
  • Les architectures big data
  • Les technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview...)
Atelier
  • Installation d'une plateforme Big Data Hadoop
  • Implémentation de flux de données massives
Data Science: Méthodes d'analyse et traitements des données pour le Big Data
  • Les bases de l'apprentissage Machine (Machine Learning)
  • Prétraitement des données
  • La réduction de dimensions
  • Les types des modèles du machine learning: Clustering, Classification, Regression
  • L'évaluation des modèles
  • Les méthodes d’ensemble
  • Le langage Python pour le Big Data et le Machine Learning: Pandas, Scipy, Scikit-learn, TensorFlow
  • Communiquer ses résultats à l’aide de représentations graphiques lisibles et pertinentes
Ateliers Données
  • Visualisation des données
  • Exploration et sélection/ingénierie des variables
  • Application des méthodes d’apprentissage automatique
  • Sélection de modèles et méthodes d’ensemble

Certificat, diplôme

Une attestation de participation sera transmise aux participants

Prochaine session

Date
Ville
Language & prix
06.12.2024

07.12.2024
Live Virtual Class
FR 1270,00€

Contact pour cette formation

Nathalie Thielemans / Nassera Aici

Ces formations pourraient vous intéresser