ITESCIA

Environnement R. Analyse de données

Certification / expertise

3 jour(s)

2290 € TTC

CFA

Consultez le site de l'organisme

Objectifs

Connaître les principales fondions statistiques 3e R, et savoir utiliser des programmes R dans un environnement BigData, en s'appuyant sur le système distribué hdfs.

Public visé

Chef de projet, data scientists, statisticien, développeur souhaitant comprendre les apports de R pour l'analyse des données, et savoir l'intégrer à un environnement Hadoop.

Programme

PRÉSENTATION R :
  • Le projet R Programming.
  • Calculs statistiques et génération de graphiques.
  • Points forts de R Programming.
  • Besoins du BigData.
  • Positionnement R programming par rapport à Hadoop.
MISE EN ŒUVRE DE R :
  • Travaux pratiques : Installation et tests sur une plate-forme CentOS.
  • Utilisation de R en mode commande.
  • Commandes de base. Syntaxe.
  • Opérations de base. Expressions.
  • Manipulations de nombres, vecteurs, tableaux, matrices. listes, etc ...
TABLEAUX ET MATRICES :
  • Déclaration, dimensionnement. indexation.
  • Opérations de base : Produit de tableaux, transposition, produits de matrice.
  • Matrices : Equations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré.
LISTES ET DATAFRAMES :
  • Définitions, cas d'utilisation.
  • Attachement, détachement. Chargement d'un dataframe.
  • La fonction scan.
STATISTIQUES :
  • Distributions embarquées : Uniforme, normale, poisson. exponentielle,...
  • Calculs statistiques - Modèles statistiques - Affichage en graphes, histogrammes.
IMPORT/EXPORT :
  • Formats texte, csv, xml, binaire, largeur fixe, images (jpeg, png).
  • Encodage - Filtrage - Importation SQL- Importation depuis un socket réseau.
  • Travaux pratiques : Importation de données géodésiques et export au format Json.
INTÉGRATION HADOOP :
  • Association de la puissance du calcul distribué fourni par les outils hadoop.
  • Différents moyens d'intégration : sparkR, RHbase, RHDFS, RHadoop, rmr2 pour utiliser le système distribué hdfs depuis R. pour accéder à HBatie depuis les programmes en R.
  • Transformation d'un dataframe R en un dataframe Spark.
  • Travaux pratiques avec Hadoop.
 

La formation "Environnement R. Analyse de données" vous intéresse ?

Recevez gratuitement le programme de la formation par ITESCIA.

Les données personnelles recueillies ci-dessus sont destinées à Figaro Classifieds ainsi qu’aux organismes que vous avez sélectionnés afin qu’ils vous contactent et vous adressent leurs informations relatives à votre demande en lien avec l’activité de l’organisme. Voir plus

Les prochaines sessions

À Paris

Du 06/12/2019 au 08/12/2019

Centre

ITESCIA
8 rue Pierre de Coubertin
95300 Pontoise
> Voir la carte


Les internautes qui ont consulté cette annonce ont aussi consulté:

En résumé

Objectif

Certification / expertise

Durée

3 jour(s)

Coût

2290 € TTC

Modes d'enseignement

Dans mon entreprise, En école ou centre de formation, À distance / e-learning

Type d'établissement

CFA

Posez une question à notre responsable pédagogique

Recevez des formations similaires

Kelformation vous suggère des formations qui vous correspondent.

Inscrivez-vous et recevez directement les annonces par mail.

Les données personnelles recueillies ci-dessus sont destinées à Figaro Classifieds afin de vous fournir les services auxquels vous souscrivez et notamment vous envoyer des offres de formations correspondant à votre recherche. Voir plus