Στην ανάλυση δεδομένων μπορείτε να ταξινομήσετε τα δεδομένα σας σύμφωνα με μια συγκεκριμένη μεταβλητή στο σύνολο δεδομένων. Στο R, μπορούμε να χρησιμοποιήσουμε τη βοήθεια της σειράς συνάρτησης (). Στο R, μπορούμε εύκολα να ταξινομήσουμε ένα διάνυσμα συνεχούς μεταβλητής ή μεταβλητής παράγοντα. Η τακτοποίηση των δεδομένων μπορεί να είναι αύξουσα ή φθίνουσα σειρά.
Σύνταξη:
sort(x, decreasing = FALSE, na.last = TRUE):
Διαφωνία:
- x : Ένα διάνυσμα που περιέχει συνεχή ή μεταβλητή παράγοντα
- μείωση : Έλεγχος για τη σειρά της μεθόδου ταξινόμησης. Από προεπιλογή, η μείωση ορίζεται σε «FALSE».
- τελευταίο : Υποδεικνύει εάν η τιμή "NA" πρέπει να τεθεί τελευταία ή όχι
Παράδειγμα 1
Για παράδειγμα, μπορούμε να δημιουργήσουμε ένα πλαίσιο δεδομένων ανατροπής και να ταξινομήσουμε μία ή περισσότερες μεταβλητές. Ένα πλαίσιο δεδομένων ανατροπής είναι μια νέα προσέγγιση στο πλαίσιο δεδομένων. Βελτιώνει τη σύνταξη του πλαισίου δεδομένων και αποφεύγει την απογοητευτική μορφοποίηση τύπων δεδομένων, ειδικά για το χαρακτήρα σε παράγοντα. Είναι επίσης ένας βολικός τρόπος για να δημιουργήσετε ένα πλαίσιο δεδομένων με το χέρι, που είναι ο σκοπός μας εδώ. Για να μάθετε περισσότερα σχετικά με την κασέτα, ανατρέξτε στο σύντομο χρονογράφημα: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)
Παραγωγή:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Παράδειγμα 2
# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)
Παραγωγή:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Παράδειγμα 3
# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)
Παραγωγή:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277