Στο HBase, μπορούμε να δημιουργήσουμε λειτουργίες πίνακα με δύο τρόπους
- Εντολή Shell
- API JAVA
Θα μάθουμε να χρησιμοποιούμε και τα δύο για να δημιουργήσουμε πίνακες.
- HBase Δημιουργία πίνακα με Java API
- HBase Δημιουργία πίνακα με Shell
HBase δημιουργήστε έναν πίνακα με Java API
Σε αυτήν την ενότητα, θα εκτελέσουμε ορισμένες από τις λειτουργίες χρησιμοποιώντας κωδικοποίηση Java μέσω Java API.
Μέσω του Java API, μπορούμε να δημιουργήσουμε πίνακες στο HBase και επίσης να φορτώσουμε δεδομένα σε πίνακες χρησιμοποιώντας την κωδικοποίηση Java.
- Δημιουργία σύνδεσης με HBase μέσω Java API
- Χρησιμοποιώντας το Eclipse για κωδικοποίηση Java, εντοπισμό σφαλμάτων και δοκιμές
Δημιουργία σύνδεσης μέσω Java API:
Τα ακόλουθα βήματα μας καθοδηγούν να αναπτύξουμε κώδικα Java για να συνδέσουμε το HBase μέσω Java API.
Βήμα 1) Σε αυτό το βήμα, πρόκειται να δημιουργήσουμε ένα έργο Java σε έκλειψη για σύνδεση HBase.
Δημιουργία νέου ονόματος έργου "HbaseConnection" στην έκλειψη.
Για εγκατάσταση ή δημιουργία προγράμματος που σχετίζεται με Java
Εάν παρατηρήσουμε το παραπάνω στιγμιότυπο οθόνης.
- Δώστε το όνομα του έργου σε αυτό το πλαίσιο. Στην περίπτωσή μας, έχουμε το όνομα του έργου "HbaseConnection"
- Επιλέξτε αυτό το πλαίσιο για να αποθηκευτεί η προεπιλεγμένη τοποθεσία. Σε αυτό το / home / hduser / work / HbaseConnection είναι η διαδρομή
- Επιλέξτε το πλαίσιο για περιβάλλον Java εδώ. Σε αυτό το JavaSE-1.7 είναι η έκδοση Java
- Ορίστε την επιλογή σας όπου θέλετε να αποθηκεύσετε το αρχείο. Στην περίπτωσή μας, έχουμε επιλέξει τη δεύτερη επιλογή "Δημιουργία ξεχωριστού φακέλου για πηγές και αρχεία κλάσης"
- Κάντε κλικ στο κουμπί τερματισμού.
- Όταν κάνετε κλικ στο κουμπί Τέλος, πρόκειται να δημιουργήσει το έργο "HbaseConnection" στο Eclipse
- Θα έρθει απευθείας στην αρχική σελίδα έκλειψης αφού κάνετε κλικ στο κουμπί τερματισμού.
Βήμα 2) Στην αρχική σελίδα έκλειψης ακολουθήστε τα παρακάτω βήματα
Right click on project -> Select Build Path -> Configure build path
Από το παραπάνω στιγμιότυπο οθόνης
- Κάντε δεξί κλικ σε ένα έργο
- Επιλέξτε διαδρομή κατασκευής
- Επιλέξτε διαμόρφωση διαδρομής κατασκευής
Αφού κάνετε κλικ στο Configure Build path, θα ανοίξει ένα άλλο παράθυρο όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης
Σε αυτό το βήμα, θα προσθέσουμε σχετικά βάζα HBase στο έργο java όπως φαίνεται στο στιγμιότυπο οθόνης.
- Σημαντικά βάζα για προσθήκη hbase-0.94.8.jar, hadoop-core-1.1.2.jar
- Κάντε κλικ στο κουμπί τερματισμού
- Ελάτε σε βιβλιοθήκες
- Πατήστε την επιλογή - Προσθήκη εξωτερικών βάζων
- Επιλέξτε τα απαραίτητα σημαντικά βάζα
- Πατήστε το κουμπί ολοκλήρωσης για να προσθέσετε αυτά τα αρχεία στο 'src' του έργου java κάτω από βιβλιοθήκες
Μετά την προσθήκη αυτών των βάζων, θα εμφανιστεί στην τοποθεσία του έργου "src". Όλα τα αρχεία Jar που εμπίπτουν στο έργο είναι τώρα έτοιμα για χρήση με το οικοσύστημα Hadoop.
Βήμα 3) Σε αυτό το βήμα χρησιμοποιώντας το HBaseConnection.java, η σύνδεση HBase θα δημιουργηθεί μέσω Java Coding
- Στο επάνω μενού του Eclipse, εκτελέστε ένα πρόγραμμα java όπως φαίνεται παρακάτω
Εκτέλεση -> Εκτέλεση ως -> Εφαρμογή Java
- Επιλέξτε Εκτέλεση
- Επιλέξτε Εκτέλεση ως εφαρμογή Java
- Αυτός ο κωδικός θα δημιουργήσει μια σύνδεση με το HBase μέσω Java API
- Μετά την εκτέλεση αυτού του κωδικού, ο πίνακας «guru99» θα δημιουργηθεί στο HBase με δύο οικογένειες στηλών που ονομάζονται «εκπαίδευση» και «έργα». Προς το παρόν, το κενό σχήμα δημιουργείται μόνο στο HBase.
Από το παραπάνω στιγμιότυπο οθόνης εκτελούμε τις ακόλουθες λειτουργίες.
- Χρησιμοποιώντας το HTableDescriptor μπορούμε να δημιουργήσουμε έναν πίνακα "guru99" στο HBase
- Χρησιμοποιώντας τη μέθοδο addFamily, θα προσθέσουμε τα "εκπαίδευση" και "έργα" ως ονόματα στηλών στον πίνακα "γκουρού99".
Η παρακάτω κωδικοποίηση πρόκειται να
- Δημιουργία σύνδεσης με HBase και
- Δημιουργήστε πίνακα "guru99" με δύο στήλες
Κωδικός τοποθετείται κάτω από το έγγραφο HBaseConnection_Java
// Place this code inside Hbase connectionimport java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apache.hadoop.hbase.HTableDescriptor;Import org.apache.hadoop.hbase.client.HBaseAdmin;public class HBaseConnection{public static void main(String[] args) throws IOException{HBaseConfigurationhc = new HBaseConfiguration(new Configuration());HTableDescriptorht = new HTableDescriptor("guru99");ht.addFamily( new HColumnDescriptor("education"));ht.addFamily( new HColumnDescriptor("projects"));System.out.println( "connecting" );HBaseAdminhba = new HBaseAdmin( hc );System.out.println( "Creating Table" );hba.createTable( ht );System.out.println("Done… ");}}
Απαιτείται κωδικός που πρέπει να τοποθετήσετε στο HBaseConnection.java και πρέπει να εκτελέσετε ένα πρόγραμμα java
Μετά την εκτέλεση αυτού του προγράμματος, πρόκειται να δημιουργήσει μια σύνδεση με το HBase και με τη σειρά του, θα δημιουργήσει έναν πίνακα με ονόματα στηλών.
- Το όνομα του πίνακα είναι "guru99"
- Τα ονόματα των στηλών είναι "εκπαίδευση" και "έργα"
Βήμα 4) Μπορούμε να ελέγξουμε εάν ο πίνακας "guru99" δημιουργείται με δύο στήλες στο HBase ή όχι χρησιμοποιώντας τη λειτουργία κελύφους HBase με την εντολή "list".
Η εντολή "list" παρέχει πληροφορίες για όλους τους πίνακες που δημιουργούνται στο HBase.
Σε αυτήν την οθόνη, πρόκειται να κάνουμε
- Έλεγχος κώδικα στο κέλυφος HBase εκτελώντας την εντολή "list".
- Εάν εκτελέσουμε την εντολή "list", θα εμφανιστεί ο πίνακας που δημιουργήθηκε στο HBase όπως παρακάτω. Στην περίπτωσή μας, μπορούμε να δούμε τον πίνακα "guru99" δημιουργείται
HBase Δημιουργία πίνακα με Shell
Η σύνταξη για τη δημιουργία πίνακα είναι
Syntax: create,
Παράδειγμα:-
hbase(main):001:0> create 'education' ,'guru99'0 rows(s) in 0.312 seconds=>Hbase::Table - education
Το παραπάνω παράδειγμα εξηγεί πώς να δημιουργήσετε έναν πίνακα στο HBase με το καθορισμένο όνομα που δίνεται σύμφωνα με το λεξικό ή τις προδιαγραφές σύμφωνα με την οικογένεια στηλών. Εκτός από αυτό, μπορούμε επίσης να περάσουμε και ορισμένα χαρακτηριστικά εύρους πινάκων σε αυτό.
create 'guru99', {NAME=>'Edu', VERSIONS=>213423443}
Περίληψη:
Το HBase είναι μια βάση δεδομένων NoSQL προσανατολισμένη στη στήλη για την αποθήκευση μεγάλου όγκου δεδομένων πάνω από το οικοσύστημα Hadoop. Ο χειρισμός πινάκων στο HBase είναι πολύ κρίσιμο πράγμα γιατί όλες οι σημαντικές λειτουργίες όπως λειτουργίες δεδομένων, βελτιώσεις δεδομένων και μοντελοποίηση δεδομένων μπορούμε να εκτελέσουμε μόνο μέσω πινάκων στο HBase. Οι πίνακες εκτελούν τις ακόλουθες λειτουργίες 1) Δημιουργία πινάκων με ονόματα στηλών και σειρές 2) Εισαγωγή τιμών σε πίνακες 3) Ανάκτηση τιμών από πίνακες