Contenu
Comment créer le jeu de données ?
Afin d’analyser la transformation digitales des entreprises de services, les données à utiliser pour ce challenge doivent provenir en partie de Google Trends. En effet, les requêtes effectuées sur le moteur de recherche fournissent des informations quasiment à temps réels. Elles représentent des besoins exprimés directement par les internautes : besoin d’information ou de consommation. Pour chaque requête, Google peut enregistrer les réponses aux questions suivantes : quoi, quand, où, qui.
Google ne donne pas accès aux données relatives à ses requêtes dans le détail. Les logs indiquent la quantité de recherche ayant été effectuées pour un terme donné, par rapport au nombre total de recherches effectuées sur Google au cours de la même période. Ils ne représentent pas le volume de recherche en valeur absolue, car les données sont normalisées et présentées sur une échelle allant de 0 à 100.
D’autres sources de données en libre accès peuvent être utilisés. Par exemple, prendre en compte les effets de pandémie et du confinement (mobilité). Dans ce cas, le jeu de données devra être cohérent et les jointures réalisées correctement.
Quelques liens pour collecter des données sur Google Trends:
- Une demarche pour collecter les données de Google trends avec la librairie Pytrends
- Un autre tuto pour utiliser Pytrends
- Une démarche pour collecter les données de Google Trends avec le package gtrendsR
- Démarche sous Python pour obtenir des données quotidiennes
- Exemple de code pour obtenir des données quotidiennes
- Vous devez être connecté-e pour participer à cette Discussion.