Définition des modules python pour le web scraping
Modules python pour le web scraping
On appelle “module” tout fichier constitué de code Python (c’est-à-dire tout fichier avec l’extension .py) importé dans un autre fichier ou script.
Lors de la construction d’un programme python, nous devons importer certains modules externes, développés par des développeurs externes dans le but de mieux organiser nos programmes. Etant un langage open source, python propose une multitude de modules externes qu’il est nécessaire d’utiliser dans nos programmes (python <3).
Chaque projet python dispose de ses propres objectifs et de sa propre structure, il est donc nécessaire d’importer les modules dont nous avons besoin.
Pour notre web scraping, vous trouverez la liste des modules nécessaires ci-dessous. Nous n’allons pas rentrer dans les détails de chacun mais je vous invite à feuilleter les documentations pour approfondir votre compréhension.
#Requests : manipuler les requêtes HTTP
#Pandas : manipulation de données et preprocessing
#Numpy : calculs scientifiques, matriciels
#Zipfile : manipuler les fichiers zips
#os : manipuler les fichiers sur la machine
#BeautifulSoup : analyse syntaxique de documents HTML