Qu'est-ce que l'urllib?
urllib est un module Python qui peut être utilisé pour ouvrir des URL. Il définit des fonctions et des classes pour aider dans les actions d'URL.
Avec Python, vous pouvez également accéder et récupérer des données d'Internet comme XML, HTML, JSON, etc. Vous pouvez également utiliser Python pour travailler directement avec ces données. Dans ce didacticiel, nous allons voir comment nous pouvons récupérer des données sur le Web. Par exemple, ici, nous avons utilisé une URL de vidéo guru99, et nous allons accéder à cette URL de vidéo en utilisant Python ainsi qu'en imprimer le fichier HTML de cette URL.
Dans ce tutoriel, nous allons apprendre
- Comment ouvrir une URL à l'aide d'Urllib
- Comment lire le fichier HTML de votre URL en Python
Comment ouvrir une URL à l'aide d'Urllib
Avant d'exécuter le code pour nous connecter aux données Internet, nous devons importer une instruction pour le module de bibliothèque d'URL ou "urllib".
- Importer urllib
- Définissez votre fonction principale
- Déclarez la variable webUrl
- Appelez ensuite la fonction urlopen sur la bibliothèque URL lib
- L'URL que nous ouvrons est le tutoriel guru99 sur youtube
- Ensuite, nous allons imprimer le code de résultat
- Le code de résultat est récupéré en appelant la fonction getcode sur la variable webUrl que nous avons créée
- Nous allons convertir cela en une chaîne, afin qu'elle puisse être concaténée avec notre chaîne "code résultat"
- Ce sera un code HTTP standard "200", indiquant que la requête http est traitée avec succès
Comment obtenir l'URL du formulaire de fichier HTML en Python
Vous pouvez également lire le fichier HTML en utilisant la "fonction de lecture" en Python, et lorsque vous exécutez le code, le fichier HTML apparaîtra dans la console.
- Appelez la fonction de lecture sur la variable webURL
- La variable de lecture permet de lire le contenu des fichiers de données
- Lire l'intégralité du contenu de l'URL dans une variable appelée data
- Exécutez le code - Il imprimera les données au format HTML
Voici le code complet
Exemple Python 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Exemple Python 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)