Εξαγωγή δεδομένων από R: Τρόπος εξαγωγής δεδομένων από R σε CSV, Excel

Πίνακας περιεχομένων:

Anonim

Τρόπος εξαγωγής δεδομένων από το R

Σε αυτό το σεμινάριο, θα μάθουμε πώς να εξάγουμε δεδομένα από περιβάλλον R σε διαφορετικές μορφές.

Για να εξαγάγετε δεδομένα στον σκληρό δίσκο, χρειάζεστε τη διαδρομή αρχείου και μια επέκταση. Πρώτα απ 'όλα, η διαδρομή είναι η τοποθεσία όπου θα αποθηκευτούν τα δεδομένα. Σε αυτό το σεμινάριο, θα δείτε πώς να αποθηκεύσετε δεδομένα σε:

  • Ο σκληρός δίσκος
  • Google Drive
  • Dropbox

Δεύτερον, το R επιτρέπει στους χρήστες να εξάγουν τα δεδομένα σε διαφορετικούς τύπους αρχείων. Καλύπτουμε την επέκταση του βασικού αρχείου:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • ΣΤΑΤΑ

Συνολικά, δεν είναι δύσκολο να εξαχθούν δεδομένα από τον R.

Σε αυτό το σεμινάριο, θα μάθετε-

  • Εξαγωγή σε σκληρό δίσκο
  • Τρόπος εξαγωγής ενός DataFrame σε ένα αρχείο CSV στο R
  • Τρόπος εξαγωγής δεδομένων από R σε αρχείο Excel
  • Εξαγωγή δεδομένων από το R σε διαφορετικό λογισμικό
  • Εξαγωγή δεδομένων από το R στο αρχείο SAS
  • Τρόπος εξαγωγής δεδομένων από το R στο αρχείο STATA
  • Αλληλεπιδράστε με τις Υπηρεσίες Cloud
  • Google Drive
  • Εξαγωγή στο Dropbox

Εξαγωγή σε σκληρό δίσκο

Αρχικά, μπορείτε να αποθηκεύσετε τα δεδομένα απευθείας στον κατάλογο εργασίας. Ο ακόλουθος κώδικας εκτυπώνει τη διαδρομή του καταλόγου εργασίας σας:

directory <-getwd()directory

Παραγωγή:

## [1] "/Users/15_Export_to_do" 

Από προεπιλογή, το αρχείο θα αποθηκευτεί στην παρακάτω διαδρομή.

Για Mac OS:

/Users/USERNAME/Downloads/ 

Για Windows:

C:\Users\USERNAME\Documents\

Φυσικά, μπορείτε να ορίσετε διαφορετική πορεία. Για παράδειγμα, μπορείτε να αλλάξετε τη διαδρομή στο φάκελο λήψης.

Δημιουργία πλαισίου δεδομένων

Πρώτα απ 'όλα, ας εισαγάγουμε το σύνολο δεδομένων mtcars και πάρουμε τον μέσο όρο των mpg και disp ομαδοποιημένων ανά γρανάζι.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Έξοδος :

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Ο πίνακας περιέχει τρεις σειρές και τρεις στήλες. Μπορείτε να δημιουργήσετε ένα αρχείο CSV με τη συνάρτηση write.csv στο R.

Τρόπος εξαγωγής ενός DataFrame σε ένα αρχείο CSV στο R

Η βασική σύνταξη του write.csv σε R για εξαγωγή του DataFrame σε CSV σε R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Παράδειγμα:

write.csv(df, "table_car.csv")

Επεξήγηση κώδικα

  • write.csv (df, "table_car.csv"): Δημιουργήστε ένα αρχείο CSV στον σκληρό δίσκο:
    • df: όνομα του πλαισίου δεδομένων στο περιβάλλον
    • "table_car.csv": Ονομάστε το αρχείο table_car και αποθηκεύστε το ως csv

Σημείωση : Μπορείτε να χρησιμοποιήσετε τη συνάρτηση write.csv σε R ως write.csv2 () για να διαχωρίσετε τις σειρές με ένα ερωτηματικό για εξαγωγή R σε δεδομένα csv.

write.csv2(df, "table_car.csv")

Σημείωση : Μόνο για παιδαγωγικό σκοπό, δημιουργήσαμε μια συνάρτηση που ονομάζεται open_folder () για να ανοίξουμε το φάκελο καταλόγου για εσάς. Απλώς πρέπει να εκτελέσετε τον παρακάτω κώδικα και να δείτε πού αποθηκεύεται το αρχείο csv. Θα πρέπει να δείτε τα ονόματα αρχείων table_car.csv για εξαγωγή δεδομένων R στο csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Τρόπος εξαγωγής δεδομένων από R σε αρχείο Excel

Τώρα, θα μάθουμε πώς να εξάγουμε δεδομένα από το R στο Excel:

Η εξαγωγή δεδομένων από το R στο Excel είναι ασήμαντη για χρήστες Windows και πιο δύσκολη για χρήστες Mac OS. Και οι δύο χρήστες θα χρησιμοποιήσουν τη βιβλιοθήκη xlsx για να δημιουργήσουν ένα αρχείο Excel. Η μικρή διαφορά προέρχεται από την εγκατάσταση της βιβλιοθήκης. Πράγματι, η βιβλιοθήκη xlsx χρησιμοποιεί Java για τη δημιουργία του αρχείου. Η Java πρέπει να εγκατασταθεί εάν δεν υπάρχει στο μηχάνημά σας για εξαγωγή δεδομένων R στο Excel.

Χρήστες των Windows

Εάν είστε χρήστης των Windows, μπορείτε να εγκαταστήσετε τη βιβλιοθήκη απευθείας με conda για εξαγωγή πλαισίου δεδομένων για να υπερέχετε R:

conda install -c r r-xlsx

Μόλις εγκατασταθεί η βιβλιοθήκη, μπορείτε να χρησιμοποιήσετε τη συνάρτηση write.xlsx (). Δημιουργείται ένα νέο βιβλίο εργασίας του Excel στον κατάλογο εργασίας για εξαγωγή R σε δεδομένα Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Εάν είστε χρήστης Mac OS, πρέπει να ακολουθήσετε αυτά τα βήματα:

  • Βήμα 1: Εγκαταστήστε την πιο πρόσφατη έκδοση του Java
  • Βήμα 2: Εγκαταστήστε τη βιβλιοθήκη rJava
  • Βήμα 3: Εγκατάσταση βιβλιοθήκης xlsx

Βήμα 1) Θα μπορούσατε να κατεβάσετε την Java από τον επίσημο ιστότοπο της Oracle και να την εγκαταστήσετε.

Μπορείτε να επιστρέψετε στο Rstudio και να ελέγξετε ποια έκδοση του Java είναι εγκατεστημένη.

system("java -version")

Κατά τη στιγμή του σεμιναρίου, η τελευταία έκδοση του Java είναι 9.0.4.

Βήμα 2) Πρέπει να εγκαταστήσετε το rjava στο R. Σας προτείνουμε να εγκαταστήσετε το R και το Rstudio με το Anaconda. Το Anaconda διαχειρίζεται τις εξαρτήσεις μεταξύ βιβλιοθηκών. Υπό αυτήν την έννοια, η Anaconda θα χειριστεί τις περιπλοκές της εγκατάστασης rJava.

Πρώτα απ 'όλα, πρέπει να ενημερώσετε το conda και μετά να εγκαταστήσετε τη βιβλιοθήκη. Μπορείτε να αντιγράψετε και να επικολλήσετε τις επόμενες δύο γραμμές κώδικα στο τερματικό.

conda - conda updateconda install -c r r-rjava

Στη συνέχεια, ανοίξτε το rjava στο Rstudio

library(rJava)

Βήμα 3) Τέλος, είναι καιρός να εγκαταστήσετε το xlsx. Για άλλη μια φορά, μπορείτε να χρησιμοποιήσετε το conda για να το κάνετε:

conda install -c r r-xlsx

Όπως οι χρήστες των παραθύρων, μπορείτε να αποθηκεύσετε δεδομένα με τη συνάρτηση write.xlsx ()

library(xlsx)

Παραγωγή:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Εξαγωγή δεδομένων από το R σε διαφορετικό λογισμικό

Η εξαγωγή δεδομένων σε διαφορετικό λογισμικό είναι τόσο απλή όσο η εισαγωγή τους. Η βιβλιοθήκη "παράδεισος" παρέχει έναν βολικό τρόπο εξαγωγής δεδομένων σε

  • spss
  • sas
  • στατά

Πρώτα απ 'όλα, εισαγάγετε τη βιβλιοθήκη. Εάν δεν έχετε "καταφύγιο", μπορείτε να πάτε εδώ για να το εγκαταστήσετε.

library(haven) 

Αρχείο SPSS

Παρακάτω είναι ο κωδικός για την εξαγωγή των δεδομένων στο λογισμικό SPSS:

write_sav(df, "table_car.sav") 

Εξαγωγή δεδομένων από το R στο αρχείο SAS

Εξίσου απλό με το spss, μπορείτε να κάνετε εξαγωγή σε sas

write_sas(df, "table_car.sas7bdat")

Τρόπος εξαγωγής δεδομένων από το R στο αρχείο STATA

Τέλος, η βιβλιοθήκη haven επιτρέπει τη σύνταξη αρχείου .dta.

write_dta(df, "table_car.dta")

Ρ

Εάν θέλετε να αποθηκεύσετε ένα πλαίσιο δεδομένων ή οποιοδήποτε άλλο αντικείμενο R, μπορείτε να χρησιμοποιήσετε τη λειτουργία αποθήκευσης ().

save(df, file ='table_car.RData')

Μπορείτε να ελέγξετε τα αρχεία που δημιουργήθηκαν παραπάνω στον παρόντα κατάλογο εργασίας

Αλληλεπιδράστε με τις Υπηρεσίες Cloud

Τέλος, το R είναι εξοπλισμένο με φανταστικές βιβλιοθήκες για να αλληλεπιδρά με τις υπηρεσίες cloud computing. Το τελευταίο μέρος αυτού του σεμιναρίου ασχολείται με αρχεία εξαγωγής / εισαγωγής από:

  • Google Drive
  • Dropbox

Σημείωση : Αυτό το μέρος του σεμιναρίου προϋποθέτει ότι έχετε λογαριασμό στο Google και το Dropbox. Εάν όχι, μπορείτε να δημιουργήσετε γρήγορα ένα για - Google Drive: https://accounts.google.com/SignUp?hl=el - Dropbox: https://www.dropbox.com/h

Google Drive

Πρέπει να εγκαταστήσετε τη βιβλιοθήκη googledrive για να αποκτήσετε πρόσβαση στη λειτουργία που επιτρέπει την αλληλεπίδραση με το Google Drive.

Η βιβλιοθήκη δεν είναι ακόμη διαθέσιμη στο Anaconda. Μπορείτε να το εγκαταστήσετε με τον παρακάτω κώδικα στην κονσόλα.

install.packages("googledrive") 

και ανοίγετε τη βιβλιοθήκη.

library(googledrive)

Για χρήστες χωρίς conda, η εγκατάσταση μιας βιβλιοθήκης είναι εύκολη, μπορείτε να χρησιμοποιήσετε τη λειτουργία install.packages ('NAME OF PACKAGE) με το όνομα του πακέτου μέσα στην παρένθεση. Μην ξεχάσετε το ''. Σημειώστε ότι, το R υποτίθεται ότι θα εγκαταστήσει αυτόματα το πακέτο στα libPaths (). Αξίζει να το δούμε σε δράση.

Μεταφόρτωση στο Google Drive

Για να ανεβάσετε ένα αρχείο στο Google Drive, πρέπει να χρησιμοποιήσετε τη λειτουργία drive_upload ().

Κάθε φορά που κάνετε επανεκκίνηση του Rstudio, θα σας ζητείται να επιτρέψετε την πρόσβαση στο Google Drive.

Η βασική σύνταξη του drive_upload () είναι

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Αφού ξεκινήσετε τον κωδικό, πρέπει να επιβεβαιώσετε πολλές ερωτήσεις

drive_upload%<("table_car.csv", name ="table_car")

Παραγωγή:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Πληκτρολογείτε 1 στην κονσόλα για να επιβεβαιώσετε την πρόσβαση

Στη συνέχεια, ανακατευθύνεστε στο Google API για να επιτρέψετε την πρόσβαση. Κάντε κλικ στην επιλογή Να επιτρέπεται.

Μόλις ολοκληρωθεί ο έλεγχος ταυτότητας, μπορείτε να κλείσετε το πρόγραμμα περιήγησής σας.

Στην κονσόλα του Rstudio, μπορείτε να δείτε τη σύνοψη του βήματος που έχει γίνει. Η Google ανέβασε με επιτυχία το αρχείο που βρίσκεται τοπικά στο Drive. Η Google εκχώρησε ένα αναγνωριστικό σε κάθε αρχείο στη μονάδα δίσκου.

Μπορείτε να δείτε αυτό το αρχείο στο Google Spreadsheet.

drive_browse("table_car")

Παραγωγή:

Θα ανακατευθυνθείτε στο Google Spreadsheet

Εισαγωγή από το Google Drive

Η μεταφόρτωση ενός αρχείου από το Google Drive με το αναγνωριστικό είναι βολικό. Εάν γνωρίζετε το όνομα του αρχείου, μπορείτε να λάβετε το αναγνωριστικό του ως εξής:

Σημείωση : Ανάλογα με τη σύνδεσή σας στο Διαδίκτυο και το μέγεθος της μονάδας δίσκου σας, χρειάζονται χρόνοι

x <-drive_get("table_car")as_id(x)

Αποθηκεύσατε το αναγνωριστικό στη μεταβλητή x. Η λειτουργία drive_download () επιτρέπει τη λήψη ενός αρχείου από το Google Drive.

Η βασική σύνταξη είναι:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Μπορείτε τελικά να κατεβάσετε το αρχείο:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Επεξήγηση κώδικα

  • drive_download (): Λειτουργία λήψης ενός αρχείου από το Google Drive
  • as_id (x): Χρησιμοποιήστε το αναγνωριστικό για να περιηγηθείτε στο αρχείο στο Google Drive
  • overwrite = TRUE: Εάν υπάρχει αρχείο, αντικαταστήστε το, αλλιώς η εκτέλεση σταμάτησε Για να δείτε το όνομα του αρχείου τοπικά, μπορείτε να χρησιμοποιήσετε:

Παραγωγή:

Το αρχείο αποθηκεύεται στον κατάλογο εργασίας σας. Θυμηθείτε, πρέπει να προσθέσετε την έκταση του αρχείου για να το ανοίξετε στο R. Μπορείτε να δημιουργήσετε το πλήρες όνομα με τη λειτουργία επικόλλησης () (π.χ. table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Παραγωγή:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Τέλος, μπορείτε να καταργήσετε το αρχείο από το Google Drive.

## remove filedrive_find("table_car") %>%drive_rm()

Παραγωγή:

Είναι μια αργή διαδικασία. Χρειάζεται χρόνος για διαγραφή

Εξαγωγή στο Dropbox

Το R αλληλεπιδρά με το Dropbox μέσω της βιβλιοθήκης rdrop2. Η βιβλιοθήκη δεν είναι επίσης διαθέσιμη στο Anaconda. Μπορείτε να το εγκαταστήσετε μέσω της κονσόλας

install.packages('rdrop2')
library(rdrop2)

Πρέπει να παρέχετε προσωρινή πρόσβαση στο Dropbox με τα διαπιστευτήριά σας. Αφού ολοκληρωθεί η αναγνώριση, το R μπορεί να δημιουργήσει, να καταργήσει τη μεταφόρτωση και να πραγματοποιήσει λήψη στο Dropbox.

Πρώτα απ 'όλα, πρέπει να παραχωρήσετε πρόσβαση στον λογαριασμό σας. Τα διαπιστευτήρια αποθηκεύονται προσωρινά σε όλη την περίοδο σύνδεσης.

drop_auth()

Θα ανακατευθυνθείτε στο Dropbox για να επιβεβαιώσετε τον έλεγχο ταυτότητας.

Θα λάβετε μια σελίδα επιβεβαίωσης. Μπορείτε να το κλείσετε και να επιστρέψετε στο R

Μπορείτε να δημιουργήσετε ένα φάκελο με τη λειτουργία drop_create ().

  • drop_create ('my_first_drop'): Δημιουργήστε ένα φάκελο στον πρώτο κλάδο του Dropbox
  • drop_create ('First_branch / my_first_drop'): Δημιουργήστε ένα φάκελο μέσα στον υπάρχοντα φάκελο First_branch.
drop_create('my_first_drop')

Παραγωγή:

Στο DropBox

Για να ανεβάσετε το αρχείο .csv στο Dropbox σας, χρησιμοποιήστε τη λειτουργία drop_upload ().

Βασική σύνταξη:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Παραγωγή:

Στο DropBox

Μπορείτε να διαβάσετε το αρχείο csv από το Dropbox με τη λειτουργία drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Παραγωγή:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Όταν τελειώσετε με τη χρήση του αρχείου και θέλετε να το διαγράψετε. Πρέπει να γράψετε τη διαδρομή του αρχείου στη συνάρτηση drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Παραγωγή:

Είναι επίσης δυνατή η διαγραφή ενός φακέλου

drop_delete('my_first_drop')

Παραγωγή:

Περίληψη

Μπορούμε να συνοψίσουμε όλες τις συναρτήσεις στον παρακάτω πίνακα

Βιβλιοθήκη

Σκοπός

Λειτουργία

βάση

Εξαγωγή csv

write.csv ()

xlsx

Εξαγωγή excel

write.xlsx ()

επίνειο

Εξαγωγή spss

write_sav ()

επίνειο

Εξαγωγή sas

write_sas ()

επίνειο

Εξαγωγή στατικών

write_dta ()

βάση

Εξαγωγή R

αποθηκεύσετε()

googledrive

Ανεβάστε το Google Drive

drive_upload ()

googledrive

Άνοιγμα στο Google Drive

drive_browse ()

googledrive

Ανάκτηση αναγνωριστικού αρχείου

drive_get (as_id ())

googledrive

Dowload από το Google Drive

λήψη_google ()

googledrive

Κατάργηση αρχείου από το Google Drive

drive_rm ()

rdrop2

Πιστοποίηση

drop_auth ()

rdrop2

Δημιουργήστε ένα φάκελο

drop_create ()

rdrop2

Μεταφόρτωση στο Dropbox

drop_upload ()

rdrop2

Διαβάστε το csv από το Dropbox

drop_read_csv

rdrop2

Διαγραφή αρχείου από το Dropbox

drop_delete ()