Exportation de données de R: Comment exporter des données de R vers CSV, Excel

Table des matières:

Anonim

Comment exporter des données depuis R

Dans ce didacticiel, nous allons apprendre à exporter des données de l'environnement R vers différents formats.

Pour exporter des données sur le disque dur, vous avez besoin du chemin du fichier et d'une extension. Tout d'abord, le chemin est l'emplacement où les données seront stockées. Dans ce didacticiel, vous verrez comment stocker des données sur:

  • Le disque dur
  • Google Drive
  • Dropbox

Deuxièmement, R permet aux utilisateurs d'exporter les données dans différents types de fichiers. Nous couvrons l'extension du fichier essentiel:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Dans l'ensemble, il n'est pas difficile d'exporter des données de R.

Dans ce didacticiel, vous apprendrez-

  • Exporter vers le disque dur
  • Comment exporter un DataFrame vers un fichier CSV dans R
  • Comment exporter des données de R vers un fichier Excel
  • Exportation de données de R vers différents logiciels
  • Exportation de données de R vers un fichier SAS
  • Comment exporter des données de R vers un fichier STATA
  • Interagissez avec les services cloud
  • Google Drive
  • Exporter vers Dropbox

Exporter vers le disque dur

Pour commencer, vous pouvez enregistrer les données directement dans le répertoire de travail. Le code suivant imprime le chemin de votre répertoire de travail:

directory <-getwd()directory

Production:

## [1] "/Users/15_Export_to_do" 

Par défaut, le fichier sera enregistré dans le chemin ci-dessous.

Pour Mac OS:

/Users/USERNAME/Downloads/ 

Pour les fenêtres:

C:\Users\USERNAME\Documents\

Vous pouvez, bien sûr, définir un chemin différent. Par exemple, vous pouvez modifier le chemin d'accès au dossier de téléchargement.

Créer un bloc de données

Tout d'abord, importons le jeu de données mtcars et obtenons la moyenne des mpg et disp regroupés par engrenage.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Sortie ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Le tableau contient trois lignes et trois colonnes. Vous pouvez créer un fichier CSV avec la fonction write.csv dans R.

Comment exporter un DataFrame vers un fichier CSV dans R

La syntaxe de base de write.csv dans R pour exporter le DataFrame au format CSV dans R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Exemple:

write.csv(df, "table_car.csv")

Explication du code

  • write.csv (df, "table_car.csv"): Créez un fichier CSV sur le disque dur:
    • df: nom du bloc de données dans l'environnement
    • "table_car.csv": Nommez le fichier table_car et stockez-le sous csv

Remarque : vous pouvez utiliser la fonction write.csv dans R comme write.csv2 () pour séparer les lignes par un point-virgule pour l'exportation R vers les données csv.

write.csv2(df, "table_car.csv")

Remarque : à des fins pédagogiques uniquement, nous avons créé une fonction appelée open_folder () pour ouvrir le dossier du répertoire pour vous. Il vous suffit d'exécuter le code ci-dessous et de voir où le fichier csv est stocké. Vous devriez voir un fichier de noms table_car.csv pour l'exportation des données R vers csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Comment exporter des données de R vers un fichier Excel

Maintenant, nous allons apprendre à exporter des données de R vers Excel:

Exporter des données de R vers Excel est simple pour les utilisateurs de Windows et plus compliqué pour les utilisateurs de Mac OS. Les deux utilisateurs utiliseront la bibliothèque xlsx pour créer un fichier Excel. La légère différence vient de l'installation de la bibliothèque. En effet, la bibliothèque xlsx utilise Java pour créer le fichier. Java doit être installé s'il n'est pas présent sur votre machine pour l'exportation de Data R vers Excel.

Utilisateurs Windows

Si vous êtes un utilisateur Windows, vous pouvez installer la bibliothèque directement avec conda pour exporter le dataframe vers Excel R:

conda install -c r r-xlsx

Une fois la bibliothèque installée, vous pouvez utiliser la fonction write.xlsx (). Un nouveau classeur Excel est créé dans le répertoire de travail pour l'exportation R vers des données Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Si vous êtes un utilisateur de Mac OS, vous devez suivre ces étapes:

  • Étape 1: Installez la dernière version de Java
  • Étape 2: Installez la bibliothèque rJava
  • Étape 3: Installez la bibliothèque xlsx

Étape 1) Vous pouvez télécharger Java à partir du site officiel d'Oracle et l'installer.

Vous pouvez revenir à Rstudio et vérifier quelle version de Java est installée.

system("java -version")

Au moment du tutoriel, la dernière version de Java est la 9.0.4.

Étape 2) Vous devez installer rjava dans R. Nous vous recommandons d'installer R et Rstudio avec Anaconda. Anaconda gère les dépendances entre les bibliothèques. En ce sens, Anaconda gérera les subtilités de l'installation de rJava.

Tout d'abord, vous devez mettre à jour conda, puis installer la bibliothèque. Vous pouvez copier et coller les deux lignes de code suivantes dans le terminal.

conda - conda updateconda install -c r r-rjava

Ensuite, ouvrez rjava dans Rstudio

library(rJava)

Étape 3) Enfin, il est temps d'installer xlsx. Encore une fois, vous pouvez utiliser conda pour le faire:

conda install -c r r-xlsx

Tout comme les utilisateurs de Windows, vous pouvez enregistrer des données avec la fonction write.xlsx ()

library(xlsx)

Production:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Exportation de données de R vers différents logiciels

Exporter des données vers différents logiciels est aussi simple que de les importer. La bibliothèque "Havre" offre un moyen pratique d'exporter des données vers

  • spss
  • sas
  • stata

Tout d'abord, importez la bibliothèque. Si vous n'avez pas "Havre", vous pouvez aller ici pour l'installer.

library(haven) 

Fichier SPSS

Voici le code pour exporter les données vers le logiciel SPSS:

write_sav(df, "table_car.sav") 

Exportation de données de R vers un fichier SAS

Tout aussi simple que spss, vous pouvez exporter vers sas

write_sas(df, "table_car.sas7bdat")

Comment exporter des données de R vers un fichier STATA

Enfin, la bibliothèque Haven permet d'écrire un fichier .dta.

write_dta(df, "table_car.dta")

R

Si vous souhaitez enregistrer un bloc de données ou tout autre objet R, vous pouvez utiliser la fonction save ().

save(df, file ='table_car.RData')

Vous pouvez vérifier les fichiers créés ci-dessus dans le répertoire de travail actuel

Interagissez avec les services cloud

Enfin, R est équipé de bibliothèques fantastiques pour interagir avec les services de cloud computing. La dernière partie de ce didacticiel traite des fichiers d'exportation / importation depuis:

  • Google Drive
  • Dropbox

Remarque : cette partie du didacticiel suppose que vous disposez d'un compte Google et Dropbox. Sinon, vous pouvez rapidement en créer un pour - Google Drive: https://accounts.google.com/SignUp?hl=fr - Dropbox: https://www.dropbox.com/h

Google Drive

Vous devez installer la bibliothèque googledrive pour accéder à la fonction permettant d'interagir avec Google Drive.

La bibliothèque n'est pas encore disponible chez Anaconda. Vous pouvez l'installer avec le code ci-dessous dans la console.

install.packages("googledrive") 

et vous ouvrez la bibliothèque.

library(googledrive)

Pour les utilisateurs non-conda, l'installation d'une bibliothèque est facile, vous pouvez utiliser la fonction install.packages ('NOM DU PACKAGE) avec le nom du package entre parenthèses. N'oubliez pas le ''. Notez que R est censé installer automatiquement le paquet dans `libPaths (). Cela vaut la peine de le voir en action.

Télécharger sur Google Drive

Pour télécharger un fichier sur Google Drive, vous devez utiliser la fonction drive_upload ().

Chaque fois que vous redémarrez Rstudio, vous serez invité à autoriser l'accès tidyverse à Google Drive.

La syntaxe de base de drive_upload () est

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Après avoir lancé le code, vous devez confirmer plusieurs questions

drive_upload%<("table_car.csv", name ="table_car")

Production:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Vous tapez 1 dans la console pour confirmer l'accès

Ensuite, vous êtes redirigé vers l'API Google pour autoriser l'accès. Cliquez sur Autoriser.

Une fois l'authentification terminée, vous pouvez quitter votre navigateur.

Dans la console de Rstudio, vous pouvez voir le résumé de l'étape effectuée. Google a réussi à téléverser le fichier situé localement sur le Drive. Google a attribué un identifiant à chaque fichier du lecteur.

Vous pouvez voir ce fichier dans Google Spreadsheet.

drive_browse("table_car")

Production:

Vous serez redirigé vers Google Spreadsheet

Importer depuis Google Drive

Télécharger un fichier depuis Google Drive avec l'identifiant est pratique. Si vous connaissez le nom du fichier, vous pouvez obtenir son ID comme suit:

Remarque : en fonction de votre connexion Internet et de la taille de votre Drive, cela prend du temps.

x <-drive_get("table_car")as_id(x)

Vous avez stocké l'ID dans la variable x. La fonction drive_download () permet de télécharger un fichier depuis Google Drive.

La syntaxe de base est:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Vous pouvez enfin télécharger le fichier:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explication du code

  • drive_download (): Fonction pour télécharger un fichier depuis Google Drive
  • as_id (x): utilisez l'ID pour parcourir le fichier dans Google Drive
  • overwrite = TRUE: Si le fichier existe, écrasez-le, sinon exécution interrompue Pour voir le nom du fichier localement, vous pouvez utiliser:

Production:

Le fichier est stocké dans votre répertoire de travail. N'oubliez pas que vous devez ajouter l'extension du fichier pour l'ouvrir dans R. Vous pouvez créer le nom complet avec la fonction paste () (ie table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Production:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Enfin, vous pouvez supprimer le fichier de votre lecteur Google.

## remove filedrive_find("table_car") %>%drive_rm()

Production:

C'est un processus lent. Prend du temps pour supprimer

Exporter vers Dropbox

R interagit avec Dropbox via la bibliothèque rdrop2. La bibliothèque n'est pas non plus disponible à Anaconda. Vous pouvez l'installer via la console

install.packages('rdrop2')
library(rdrop2)

Vous devez fournir un accès temporaire à Dropbox avec vos informations d'identification. Une fois l'identification terminée, R peut créer, supprimer le téléchargement et le télécharger sur votre Dropbox.

Tout d'abord, vous devez donner accès à votre compte. Les informations d'identification sont mises en cache pendant toute la session.

drop_auth()

Vous serez redirigé vers Dropbox pour confirmer l'authentification.

Vous obtiendrez une page de confirmation. Vous pouvez le fermer et revenir à R

Vous pouvez créer un dossier avec la fonction drop_create ().

  • drop_create ('my_first_drop'): crée un dossier dans la première branche de Dropbox
  • drop_create ('First_branch / my_first_drop'): Crée un dossier dans le dossier First_branch existant.
drop_create('my_first_drop')

Production:

Dans DropBox

Pour télécharger le fichier .csv dans votre Dropbox, utilisez la fonction drop_upload ().

Syntaxe de base:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Production:

Chez DropBox

Vous pouvez lire le fichier csv depuis Dropbox avec la fonction drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Production:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Lorsque vous avez terminé d'utiliser le fichier et que vous souhaitez le supprimer. Vous devez écrire le chemin du fichier dans la fonction drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Production:

Il est également possible de supprimer un dossier

drop_delete('my_first_drop')

Production:

Résumé

Nous pouvons résumer toutes les fonctions dans le tableau ci-dessous

Bibliothèque

Objectif

Fonction

base

Exporter csv

write.csv ()

xlsx

Exporter Excel

write.xlsx ()

havre

Exporter les spss

write_sav ()

havre

Exporter des SAS

write_sas ()

havre

Exporter les statistiques

write_dta ()

base

Exporter R

sauvegarder()

Google Drive

Télécharger Google Drive

drive_upload ()

Google Drive

Ouvrir dans Google Drive

drive_browse ()

Google Drive

Récupérer l'ID de fichier

lecteur_get (as_id ())

Google Drive

Télécharger depuis Google Drive

download_google ()

Google Drive

Supprimer le fichier de Google Drive

drive_rm ()

rdrop2

Authentification

drop_auth ()

rdrop2

Créer un dossier

drop_create ()

rdrop2

Télécharger sur Dropbox

drop_upload ()

rdrop2

Lire le csv depuis Dropbox

drop_read_csv

rdrop2

Supprimer le fichier de Dropbox

drop_delete ()