Introduction au Big Data et Machine Learning (Live Virtual Class)

Blended learning

U wie riicht sech d'Formatioun?

Consultants, Consultants IT, Web Designer, Data Scientist

Dauer

2,00 Dag(Deeg)

Sprooch(e) vun der Déngschtleeschtung

EN FR

Nächst Sessioun

06.12.2024
Plaz
Live Virtual Class

Präis

1270,00€

Ziler

Présenter les enjeux de l’analyse des données numériques à grande échelle.
Comprendre le concept de valorisation de la donnée.
Maîtriser le vocabulaire lié au big data et à la data science
Comprendre la problématique de traitement de données massives à des fins d’analyse.
Identifier les risques et opportunités du Big Data pour les individus (vie privée, protection des données personnelles…).
Conduire un projet Big Data en entreprise (étapes projets, bonnes pratiques, schémas organisationnels et gouvernance des données).
Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs.

Inhalt

Comprendre les concepts et les enjeux du Big Data
  • Découvrir les concepts du Big Data
  • Définition d’un projet Big Data
  • Big data en entreprise
    • Principes de fonctionnement
    • Les secteurs impactés
    • Comment se reconvertir dans le big data?
    • La gouvernance des données
  • Les spécificités d’un projet big data
  • Les enjeux du Big Data: organisation, confidentialité des données, GPDR
Les technologies du Big Data
  • Business Intelligence vs Big Data
  • Architecture et composants de la plateforme Hadoop
  • Les modes de stockage
    • Le stockage fichiers: Hadoop Distributed File System (HDFS)
    • Stockage colonne, graph, clé/valeur et document:
  • Paradigme MapReduce
  • Spark: framework de calcul distribué in memory
  • Les architectures big data
  • Les technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview...)
Atelier
  • Installation d'une plateforme Big Data Hadoop
  • Implémentation de flux de données massives
Data Science: Méthodes d'analyse et traitements des données pour le Big Data
  • Les bases de l'apprentissage Machine (Machine Learning)
  • Prétraitement des données
  • La réduction de dimensions
  • Les types des modèles du machine learning: Clustering, Classification, Regression
  • L'évaluation des modèles
  • Les méthodes d’ensemble
  • Le langage Python pour le Big Data et le Machine Learning: Pandas, Scipy, Scikit-learn, TensorFlow
  • Communiquer ses résultats à l’aide de représentations graphiques lisibles et pertinentes
Ateliers Données
  • Visualisation des données
  • Exploration et sélection/ingénierie des variables
  • Application des méthodes d’apprentissage automatique
  • Sélection de modèles et méthodes d’ensemble

Certificat, Diplom

Une attestation de participation sera transmise aux participants

Nächst Sessioun

Datum
Stad
Sprooch & Präis
06.12.2024

07.12.2024
Live Virtual Class
FR 1270,00€

Kontakt fir dës Formatioun

Nathalie Thielemans / Nassera Aici

Dës Formatioune kéinten Iech interesséieren

FR
Dag
Windhof (Koerich)
Informatik - Gestiounssystem fir Bases de données - Relationale Logiciel SGBD - Logiciel PostgreSQL
13.02.2025