Comment exporter des données depuis R
Dans ce didacticiel, nous allons apprendre à exporter des données de l'environnement R vers différents formats.
Pour exporter des données sur le disque dur, vous avez besoin du chemin du fichier et d'une extension. Tout d'abord, le chemin est l'emplacement où les données seront stockées. Dans ce didacticiel, vous verrez comment stocker des données sur:
- Le disque dur
- Google Drive
- Dropbox
Deuxièmement, R permet aux utilisateurs d'exporter les données dans différents types de fichiers. Nous couvrons l'extension du fichier essentiel:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATA
Dans l'ensemble, il n'est pas difficile d'exporter des données de R.
Dans ce didacticiel, vous apprendrez-
- Exporter vers le disque dur
- Comment exporter un DataFrame vers un fichier CSV dans R
- Comment exporter des données de R vers un fichier Excel
- Exportation de données de R vers différents logiciels
- Exportation de données de R vers un fichier SAS
- Comment exporter des données de R vers un fichier STATA
- Interagissez avec les services cloud
- Google Drive
- Exporter vers Dropbox
Exporter vers le disque dur
Pour commencer, vous pouvez enregistrer les données directement dans le répertoire de travail. Le code suivant imprime le chemin de votre répertoire de travail:
directory <-getwd()directory
Production:
## [1] "/Users/15_Export_to_do"
Par défaut, le fichier sera enregistré dans le chemin ci-dessous.
Pour Mac OS:
/Users/USERNAME/Downloads/
Pour les fenêtres:
C:\Users\USERNAME\Documents\
Vous pouvez, bien sûr, définir un chemin différent. Par exemple, vous pouvez modifier le chemin d'accès au dossier de téléchargement.
Créer un bloc de données
Tout d'abord, importons le jeu de données mtcars et obtenons la moyenne des mpg et disp regroupés par engrenage.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Sortie ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Le tableau contient trois lignes et trois colonnes. Vous pouvez créer un fichier CSV avec la fonction write.csv dans R.
Comment exporter un DataFrame vers un fichier CSV dans R
La syntaxe de base de write.csv dans R pour exporter le DataFrame au format CSV dans R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Exemple:
write.csv(df, "table_car.csv")
Explication du code
- write.csv (df, "table_car.csv"): Créez un fichier CSV sur le disque dur:
- df: nom du bloc de données dans l'environnement
- "table_car.csv": Nommez le fichier table_car et stockez-le sous csv
Remarque : vous pouvez utiliser la fonction write.csv dans R comme write.csv2 () pour séparer les lignes par un point-virgule pour l'exportation R vers les données csv.
write.csv2(df, "table_car.csv")
Remarque : à des fins pédagogiques uniquement, nous avons créé une fonction appelée open_folder () pour ouvrir le dossier du répertoire pour vous. Il vous suffit d'exécuter le code ci-dessous et de voir où le fichier csv est stocké. Vous devriez voir un fichier de noms table_car.csv pour l'exportation des données R vers csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Comment exporter des données de R vers un fichier Excel
Maintenant, nous allons apprendre à exporter des données de R vers Excel:
Exporter des données de R vers Excel est simple pour les utilisateurs de Windows et plus compliqué pour les utilisateurs de Mac OS. Les deux utilisateurs utiliseront la bibliothèque xlsx pour créer un fichier Excel. La légère différence vient de l'installation de la bibliothèque. En effet, la bibliothèque xlsx utilise Java pour créer le fichier. Java doit être installé s'il n'est pas présent sur votre machine pour l'exportation de Data R vers Excel.
Utilisateurs Windows
Si vous êtes un utilisateur Windows, vous pouvez installer la bibliothèque directement avec conda pour exporter le dataframe vers Excel R:
conda install -c r r-xlsx
Une fois la bibliothèque installée, vous pouvez utiliser la fonction write.xlsx (). Un nouveau classeur Excel est créé dans le répertoire de travail pour l'exportation R vers des données Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Si vous êtes un utilisateur de Mac OS, vous devez suivre ces étapes:
- Étape 1: Installez la dernière version de Java
- Étape 2: Installez la bibliothèque rJava
- Étape 3: Installez la bibliothèque xlsx
Étape 1) Vous pouvez télécharger Java à partir du site officiel d'Oracle et l'installer.
Vous pouvez revenir à Rstudio et vérifier quelle version de Java est installée.
system("java -version")
Au moment du tutoriel, la dernière version de Java est la 9.0.4.
Étape 2) Vous devez installer rjava dans R. Nous vous recommandons d'installer R et Rstudio avec Anaconda. Anaconda gère les dépendances entre les bibliothèques. En ce sens, Anaconda gérera les subtilités de l'installation de rJava.
Tout d'abord, vous devez mettre à jour conda, puis installer la bibliothèque. Vous pouvez copier et coller les deux lignes de code suivantes dans le terminal.
conda - conda updateconda install -c r r-rjava
Ensuite, ouvrez rjava dans Rstudio
library(rJava)
Étape 3) Enfin, il est temps d'installer xlsx. Encore une fois, vous pouvez utiliser conda pour le faire:
conda install -c r r-xlsx
Tout comme les utilisateurs de Windows, vous pouvez enregistrer des données avec la fonction write.xlsx ()
library(xlsx)
Production:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Exportation de données de R vers différents logiciels
Exporter des données vers différents logiciels est aussi simple que de les importer. La bibliothèque "Havre" offre un moyen pratique d'exporter des données vers
- spss
- sas
- stata
Tout d'abord, importez la bibliothèque. Si vous n'avez pas "Havre", vous pouvez aller ici pour l'installer.
library(haven)
Fichier SPSS
Voici le code pour exporter les données vers le logiciel SPSS:
write_sav(df, "table_car.sav")
Exportation de données de R vers un fichier SAS
Tout aussi simple que spss, vous pouvez exporter vers sas
write_sas(df, "table_car.sas7bdat")
Comment exporter des données de R vers un fichier STATA
Enfin, la bibliothèque Haven permet d'écrire un fichier .dta.
write_dta(df, "table_car.dta")
R
Si vous souhaitez enregistrer un bloc de données ou tout autre objet R, vous pouvez utiliser la fonction save ().
save(df, file ='table_car.RData')
Vous pouvez vérifier les fichiers créés ci-dessus dans le répertoire de travail actuel
Interagissez avec les services cloud
Enfin, R est équipé de bibliothèques fantastiques pour interagir avec les services de cloud computing. La dernière partie de ce didacticiel traite des fichiers d'exportation / importation depuis:
- Google Drive
- Dropbox
Remarque : cette partie du didacticiel suppose que vous disposez d'un compte Google et Dropbox. Sinon, vous pouvez rapidement en créer un pour - Google Drive: https://accounts.google.com/SignUp?hl=fr - Dropbox: https://www.dropbox.com/h
Google Drive
Vous devez installer la bibliothèque googledrive pour accéder à la fonction permettant d'interagir avec Google Drive.
La bibliothèque n'est pas encore disponible chez Anaconda. Vous pouvez l'installer avec le code ci-dessous dans la console.
install.packages("googledrive")
et vous ouvrez la bibliothèque.
library(googledrive)
Pour les utilisateurs non-conda, l'installation d'une bibliothèque est facile, vous pouvez utiliser la fonction install.packages ('NOM DU PACKAGE) avec le nom du package entre parenthèses. N'oubliez pas le ''. Notez que R est censé installer automatiquement le paquet dans `libPaths (). Cela vaut la peine de le voir en action.
Télécharger sur Google Drive
Pour télécharger un fichier sur Google Drive, vous devez utiliser la fonction drive_upload ().
Chaque fois que vous redémarrez Rstudio, vous serez invité à autoriser l'accès tidyverse à Google Drive.
La syntaxe de base de drive_upload () est
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Après avoir lancé le code, vous devez confirmer plusieurs questions
drive_upload%<("table_car.csv", name ="table_car")
Production:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Vous tapez 1 dans la console pour confirmer l'accès
Ensuite, vous êtes redirigé vers l'API Google pour autoriser l'accès. Cliquez sur Autoriser.
Une fois l'authentification terminée, vous pouvez quitter votre navigateur.
Dans la console de Rstudio, vous pouvez voir le résumé de l'étape effectuée. Google a réussi à téléverser le fichier situé localement sur le Drive. Google a attribué un identifiant à chaque fichier du lecteur.
Vous pouvez voir ce fichier dans Google Spreadsheet.
drive_browse("table_car")
Production:
Vous serez redirigé vers Google Spreadsheet
Importer depuis Google Drive
Télécharger un fichier depuis Google Drive avec l'identifiant est pratique. Si vous connaissez le nom du fichier, vous pouvez obtenir son ID comme suit:
Remarque : en fonction de votre connexion Internet et de la taille de votre Drive, cela prend du temps.
x <-drive_get("table_car")as_id(x)
Vous avez stocké l'ID dans la variable x. La fonction drive_download () permet de télécharger un fichier depuis Google Drive.
La syntaxe de base est:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Vous pouvez enfin télécharger le fichier:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Explication du code
- drive_download (): Fonction pour télécharger un fichier depuis Google Drive
- as_id (x): utilisez l'ID pour parcourir le fichier dans Google Drive
- overwrite = TRUE: Si le fichier existe, écrasez-le, sinon exécution interrompue Pour voir le nom du fichier localement, vous pouvez utiliser:
Production:
Le fichier est stocké dans votre répertoire de travail. N'oubliez pas que vous devez ajouter l'extension du fichier pour l'ouvrir dans R. Vous pouvez créer le nom complet avec la fonction paste () (ie table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Production:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Enfin, vous pouvez supprimer le fichier de votre lecteur Google.
## remove filedrive_find("table_car") %>%drive_rm()
Production:
C'est un processus lent. Prend du temps pour supprimer
Exporter vers Dropbox
R interagit avec Dropbox via la bibliothèque rdrop2. La bibliothèque n'est pas non plus disponible à Anaconda. Vous pouvez l'installer via la console
install.packages('rdrop2')
library(rdrop2)
Vous devez fournir un accès temporaire à Dropbox avec vos informations d'identification. Une fois l'identification terminée, R peut créer, supprimer le téléchargement et le télécharger sur votre Dropbox.
Tout d'abord, vous devez donner accès à votre compte. Les informations d'identification sont mises en cache pendant toute la session.
drop_auth()
Vous serez redirigé vers Dropbox pour confirmer l'authentification.
Vous obtiendrez une page de confirmation. Vous pouvez le fermer et revenir à R
Vous pouvez créer un dossier avec la fonction drop_create ().
- drop_create ('my_first_drop'): crée un dossier dans la première branche de Dropbox
- drop_create ('First_branch / my_first_drop'): Crée un dossier dans le dossier First_branch existant.
drop_create('my_first_drop')
Production:
Dans DropBox
Pour télécharger le fichier .csv dans votre Dropbox, utilisez la fonction drop_upload ().
Syntaxe de base:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Production:
Chez DropBox
Vous pouvez lire le fichier csv depuis Dropbox avec la fonction drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Production:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Lorsque vous avez terminé d'utiliser le fichier et que vous souhaitez le supprimer. Vous devez écrire le chemin du fichier dans la fonction drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Production:
Il est également possible de supprimer un dossier
drop_delete('my_first_drop')
Production:
Résumé
Nous pouvons résumer toutes les fonctions dans le tableau ci-dessous
Bibliothèque |
Objectif |
Fonction |
---|---|---|
base |
Exporter csv |
write.csv () |
xlsx |
Exporter Excel |
write.xlsx () |
havre |
Exporter les spss |
write_sav () |
havre |
Exporter des SAS |
write_sas () |
havre |
Exporter les statistiques |
write_dta () |
base |
Exporter R |
sauvegarder() |
Google Drive |
Télécharger Google Drive |
drive_upload () |
Google Drive |
Ouvrir dans Google Drive |
drive_browse () |
Google Drive |
Récupérer l'ID de fichier |
lecteur_get (as_id ()) |
Google Drive |
Télécharger depuis Google Drive |
download_google () |
Google Drive |
Supprimer le fichier de Google Drive |
drive_rm () |
rdrop2 |
Authentification |
drop_auth () |
rdrop2 |
Créer un dossier |
drop_create () |
rdrop2 |
Télécharger sur Dropbox |
drop_upload () |
rdrop2 |
Lire le csv depuis Dropbox |
drop_read_csv |
rdrop2 |
Supprimer le fichier de Dropbox |
drop_delete () |