Τι είναι το urllib;
Το urllib είναι μια ενότητα Python που μπορεί να χρησιμοποιηθεί για το άνοιγμα διευθύνσεων URL. Ορίζει συναρτήσεις και τάξεις που βοηθούν στις ενέργειες URL.
Με το Python μπορείτε επίσης να αποκτήσετε πρόσβαση και να ανακτήσετε δεδομένα από το Διαδίκτυο όπως XML, HTML, JSON κ.λπ. Μπορείτε επίσης να χρησιμοποιήσετε το Python για να εργαστείτε απευθείας με αυτά τα δεδομένα. Σε αυτό το σεμινάριο θα δούμε πώς μπορούμε να ανακτήσουμε δεδομένα από τον Ιστό. Για παράδειγμα, εδώ χρησιμοποιήσαμε μια διεύθυνση URL βίντεο guru99 και πρόκειται να αποκτήσουμε πρόσβαση σε αυτήν τη διεύθυνση URL βίντεο χρησιμοποιώντας το Python καθώς και να εκτυπώσουμε αρχείο HTML αυτής της διεύθυνσης URL.
Σε αυτό το σεμινάριο θα μάθουμε
- Πώς να ανοίξετε το URL χρησιμοποιώντας το Urllib
- Πώς να διαβάσετε το αρχείο HTML για τη διεύθυνση URL σας στο Python
Πώς να ανοίξετε το URL χρησιμοποιώντας το Urllib
Πριν εκτελέσουμε τον κώδικα για σύνδεση σε δεδομένα Διαδικτύου, πρέπει να εισαγάγουμε δήλωση για ενότητα βιβλιοθήκης URL ή "urllib".
- Εισαγωγή urllib
- Ορίστε την κύρια λειτουργία σας
- Δηλώστε τη μεταβλητή webUrl
- Στη συνέχεια, καλέστε τη συνάρτηση urlopen στη βιβλιοθήκη lib lib URL
- Το URL που ανοίγουμε είναι εκπαιδευτικός γκουρού99 στο youtube
- Στη συνέχεια, θα εκτυπώσουμε τον κωδικό αποτελέσματος
- Ο κωδικός αποτελεσμάτων ανακτάται καλώντας τη συνάρτηση getcode στη μεταβλητή webUrl που έχουμε δημιουργήσει
- Θα το μετατρέψουμε σε συμβολοσειρά, ώστε να μπορεί να συνδυαστεί με τη συμβολοσειρά μας "κωδικός αποτελέσματος"
- Αυτός θα είναι ένας κανονικός κωδικός HTTP "200", υποδεικνύοντας ότι το αίτημα http υποβλήθηκε σε επεξεργασία με επιτυχία
Πώς να λάβετε τη μορφή αρχείου HTML στη διεύθυνση Python
Μπορείτε επίσης να διαβάσετε το αρχείο HTML χρησιμοποιώντας τη "λειτουργία ανάγνωσης" στο Python και όταν εκτελείτε τον κώδικα, το αρχείο HTML θα εμφανιστεί στην κονσόλα.
- Καλέστε τη συνάρτηση ανάγνωσης στη μεταβλητή webURL
- Η μεταβλητή ανάγνωσης επιτρέπει την ανάγνωση του περιεχομένου των αρχείων δεδομένων
- Διαβάστε ολόκληρο το περιεχόμενο της διεύθυνσης URL σε μια μεταβλητή που ονομάζεται δεδομένα
- Εκτελέστε τον κώδικα - Θα εκτυπώσει τα δεδομένα σε μορφή HTML
Εδώ είναι ο πλήρης κωδικός
Παράδειγμα Python 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Παράδειγμα Python 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)