Artificial Intelligence - Big Data - Storm, développer pour le Big Data

Formation inter et intra-entreprise

À qui s'adresse la formation?

Développeurs, architectes.

Durée

3,00 jour(s)

Langues(s) de prestation

FR

Prochaine session

Prérequis

Il est important d'avoir une expérience dans le développement, si possible en Java. Une compréhension des problèmes liés au Big Data est un plus.

Objectifs

  • Traiter en temps réel des données placées dans le Cloud.
  • Coordonner des échanges
  • Développer des services pour le Cloud.
  • Synchroniser des données entre un Cloud privé et un réseau social.

Contenu

Vous apprendrez dans cette formation à développer des applications vous permettant de traiter en temps réel des données et services placés dans le Cloud. Vous découvrirez également les atouts de Storm par rapport au Big Data traditionnel et comprendrez son système de calcul distribué temps réel.

Points abordés

Le Big Data
  • Définition du périmètre du Big Data. Le projet Hadoop, positionnement du projet Storm.
  • Les concepts de base des projets Big Data.
  • Différence entre Cloud Computing privé et public.
  • Les architectures Big Data à base du projet Storm.
  • Démonstration: Exemples d'utilisation de Storm.
Introduction au projet Apache Storm
  • Définition de l'environnement de développement.
  • Création de projets basés sur Storm.
  • Définition des composants Storm (spout et bolt).
  • Définition des flux Storm.
  • Modèle de données (clé, valeur).

Travaux pratiques: Utiliser l'API Storm pour gérer les enregistrements d'utilisateurs.

Scalabilité horizontale
  • Définition de la haute disponibilité.
  • Les topologies possibles.
  • Parallélisation des calculs et traitement de données.
  • Scalabilité des serveurs Web.
  • Utilisation de Storm cluster.
  • Scalabilité des bases de données.

Travaux pratiques: Gérer la montée en charge via l'augmentation des serveurs Web.

Traitement des messages garantis
  • Définition d'un message "entièrement traité".
  • Cycle de vie d'un message.
  • L'API Storm pour la définition de la fiabilité.
  • Stratégie de mise en place de la fiabilité pour une application utilisant le Big Data.

Travaux pratiques: Réguler les messages client et assurer leur suivi.

Tolérance aux pannes
  • Gestion des bolts.
  • Le projet Apache Kafka.
  • Définition des transactions.
  • Topologie transactionnelle et Storm cluster.
  • Rôles des Nimbus et ZooKeeper.

Travaux pratiques: Utiliser ZooKeeper pour la négociation distribuée.

Développement de services pour le Cloud
  • Programmation de services avec les différents langages Clojure, Java, Ruby, Python.
  • Introduction à de nouveaux langages.

Travaux pratiques: Appliquer l'interopérabilité dans le Big Data temps réel.

L'architecture Kafka
  • L'aperçu de Kafka Producers, Brokers, Consumers.
  • Les fichiers journaux de Kafka.
  • Les schémas Avro.
  • Utilisation de ZooKeeper.

Travaux pratiques: Étude de la configuration de Kafka dans l'architecture KAPPA.

Interconnexion avec les réseaux sociaux
  • L'utilisation de Twitter4J.
  • Configuration de la sécurité d'accès.
  • Gestion d'événements avec Storm.
  • Définition de callback.

Travaux pratiques: Synchroniser des données entre un Cloud privé et un réseau social.

Méthodes pédagogiques

Notre méthode, adaptée à votre contexte, associe implication des participants et supports concrets.

Certificat, diplôme

Attestation de présence

Mode d'organisation

En présentiel ou en classe virtuelle

Ces formations pourraient vous intéresser

EN
Journée
Informatique et systèmes d'information - Système information - Architecture système information - Cloud Computing