En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies et de technologies similaires permettant l’utilisation de données relatives à un même utilisateur par notre société ainsi que par des tiers comme les régies publicitaires partenaires, afin de réaliser des statistiques d'audiences et de vous proposer des services en lien avec votre recherche de formation, une offre publicitaire adaptée à vos centres d'intérêts et la possibilité de partager des contenus sur des réseaux sociaux. En savoir plus/paramétrer

Capgemini Institut

Big Data : L’état de l’art

Certification / expertise

2 jour(s)

1965 € HT

Organisme privé de formation continue

Consultez le site de l'organisme

Objectifs

  • Guider le responsable SI vers la création de valeur à partir des données et répondre à ses préoccupations pratiques de mise en œuvre.
  • Appréhender les opportunités, les projets réels ; les rôles pour la DSI.
  • Data Science, Machine Learning, données des objets connectés.
  • Panorama des solutions et des architectures, modélisation des données, intégration au Système d’Information.
  • Stockage des Big Data_et Data Lake: stockage distribué, sécurité, infrastructure.
  • Traitements des Big Data et Data Lab : MapReduce, machine learning en environnement parallèle, traitements des données non structurées.
  • Accès aux données en temps réel : NoSQL, InMemory, NewSQL et streaming Big Data.
  • Méthodologie pour un projet Big Data : Cadrage, étapes du projet, organisation et gouvernance.

Public visé

Directions informatiques et directions métiers.

Programme

Big Data, quelles opportunités pour la DSI ?

Big Data et la performance de l’entreprise :

  • Clients, produits, processus, infrastructures: les nouveaux enjeux de performance des entreprises.
  • L’analyse des données au service de la performance: comment identifier les nouveaux leviers de performance ?
  • En quoi Big Data est un enjeu de performance pour les entreprises et les organisations ?
  • Étude de cas réel.

Rôle de la DSI dans le Big Data :

  • La DSI comme fournisseur de services IT ou fournisseur de données à valeur ajoutée ?
  • Quelles sont les notions de Data Lake, Data Hub et de Data Lab.
  • Comment, concrètement, le DSI peut-il saisir l’opportunité Big Data ?
  • Quels sont les nouveaux challenges pour la DSI ?

Création de valeur à partir des données :

  • Comment identifier les données à valeur ajoutée ?
  • Comment tirer profit des données clients, produits ou de suivi ?
  • Grille d’analyse de la valeur des données et des objectifs d’analyse.
  • Étude de cas.


L’analyse des données :

Ce chapitre synthétise, de façon accessible, les techniques d’analyse des données indispensables au Big Data.

Evolutions du datamining vers le Machine Learning :

  • Les principales évolutions du datamining vers le machine learning et le deep learning.
  • Le Machine Learning : Arbre de décision, règle d’association, Support Vector Machines.
  • Les spécificités du Machine Learning pour le Big Data : Haute dimension, occurrences élevées.
  • Les meilleures pratiques pour le Machine Learning : Cross-validation, grid search, semisupervision.
  • Domaines d’application privilégiés : Marketing, finance, e-commerce, transport.

Sources de données publiques et privées :

  • Quelles sont les sources de données internes, externes, gratuites, payantes à exploiter ?
  • Comment exploiter les données des réseaux sociaux? Qu’est-ce que le Data Sourcing ?
  • Comment exploiter les données des objets connectés ?
  • Comment croiser données publiques et privées ?

Le cadre juridique des données :

  • Les données identifiantes et à caractère personnel.
  • Les obligations légales des entreprises. Pseudonymisation et anonymisation de facteur k.
  • La propriété intellectuelle des données dans le cadre du Big Data.
  • L’évolution du cadre légal européen, GDPR.

Visualisation des données à valeur ajoutée :

  • Les limites des outils traditionnels d’analyse de données : Excel, BO, etc.
  • Comment représenter efficacement des données analytiques ?
  • Les outils et composants de visualisation des données Big Data.


Les architectures Big Data :

Le fondement des architectures Big Data :
  • Quelles sont les évolutions technologiques qui révolutionnent l’architecture technique ?
  • Quelles sont les contraintes techniques ?
  • Performance, scalabilité, disponibilité.
  • Les caractéristiques d’une architecture Big Data hautement performante.
Panorama des nouvelles solutions Big Data :
  • Architecture orientée stockage : Hadoop, Spark, MPP.
  • Architecture orientée calcul : Grid Computing, GPU, Many core.
  • Architecture orientée temps réel : NoSQL, NewSQL.
  • Architecture orientée évènementiel : CEP, ESP, Storm, Flink.
Typologie des architectures Big Data :
  • Comment positionner un système Big Data dans le SI ?
  • Composants Big Data: Data Lake, Data Lab, Data Hub?
  • Qu’est ce que la Lambda Architecture ?
  • Déploiement physique, appliance ou cloud Big Data ?

Le stockage des Big Data, le Data Lake :

Technologies de stockage distribué :
  • La technologie HDFS : Principes et fonctionnement.
  • La granularité de cohérence des données : Les différents niveaux de cohérence.
  • Quel dimensionnement ? Serveurs, RAM, CPU, disques, réseau.
Manipulation et Extraction des données :
  • Outils de requêtage et de traitement Hadoop MapReduce.
  • Performance et limites du MapReduce.
  • Manipulation interactive : Impala, SparkSQL, MPP, Vertical distribué.
Le transactionnel Big Data NoSQL et NewSQL :
  • Les principales bases NoSQL: Cassandra, MongoDB, Redis Neo4j
  • Traitements analytiques en temps réel ? Fusionner Big Data et Fast Data
  • Panorama des solutions NewSQL : VoltDB, Clustrix, Aerospike.

Le traitement des Big Data, le Data Lab
:

Programmation parallèle MapReduce :
  • Fondamentaux du traitement MapReduce.
  • Fonctionnement MapReduce dans Hadoop.
  • Points de vigilance et administration.
Machine Learning en environnement parallèle :
  • Les contraintes de parallélisme des algorithmes de Machine Learning.
  • Les librairies de Machine Learning: Spark MLlib, Mahout, Hama, Scikit Learn, R.
  • Étude de cas.
Traitements des données non structurées :
  • Les types de données non structurées : Message, document, semi-structuré.
  • Les principes de l’analyse sémantique : Sentiment, univers, corrélation.
  • Les principes de l’analyse des images pour le Machine Learning.
  • Étude de cas.

La méthodologie pour un projet Big Data Analytics :


Le cadrage des projets Big Data :
  • Les différentes facettes à cadrer des projets.
Big Data :
  • Comment intégrer l’incertitude au Business Case projet ?
  • Comment estimer le budget et le délai d’un projet Big Data Analytics ?
Le management des projets de Big Data Analytics :
  • Une approche projet nécessairement agile.
  • Comment manager un projet Big Data ?
  • Les étapes d’un projet Big Data phase par phase.
L’organisation des projets Big Data Analytics :
  • Quelle gouvernance pour le Big Data?
  • Les différentes formes d’organisation. Retours d’expérience.
  • Comment recruter et organiser la montée en compétences des équipes.

 

La formation "Big Data : L’état de l’art" vous intéresse ?

Capgemini Institut vous rappellera pour préciser vos besoins et vous proposer un devis.


Les prochaines sessions

À Paris

Du 20/09/2018 au 21/09/2018

Du 11/10/2018 au 12/10/2018

Du 15/11/2018 au 16/11/2018

Centre

Capgemini Institut
24, rue du Gouverneur Général Eboué
92136 Issy les moulineaux cedex


Les internautes qui ont consulté cette annonce ont aussi consulté:

En résumé

Objectif

Certification / expertise

Durée

2 jour(s)

Coût

1965 € HT

Modes d'enseignement

En école ou centre de formation

Posez une question à notre responsable pédagogique

Recevez des formations similaires

Kelformation vous suggère des formations qui vous correspondent.

Inscrivez-vous et recevez directement les annonces par mail.