Analyser le parcours client avec SQL

Partie 4
Chapitre 4 sur 5
Partie 4 – 4. Analyse des séquences d’événements dans les interactions clients

4.4 Démarches pas à pas, avec code SQL à l’appui

Nous utilisons SQL pour extraire et quantifier les séquences d’événements. La première étape consiste à identifier le nom de l’événement précédent dans la séquence d’actions de l’utilisateur, en utilisant la fonction LAG :

SELECT
user_id,
event_name,
event_timestamp,
event_id,
LAG(event_name) OVER(PARTITION BY user_id ORDER BY event_timestamp) AS prev_event
FROM data

Ensuite, nous créons des paires de chaînes d’événements et les regroupons pour en compter la fréquence :

SELECT
prev_event || '-' || event_name AS event_pair,
COUNT(*) AS event_pair_count
FROM lag_data
WHERE prev_event IS NOT NULL
GROUP BY event_pair
ORDER BY event_pair_count DESC

Notons que pour améliorer la qualité des données analysées, nous nettoyons les données en éliminant les événements sans précédent.

Voici le résultat de la requête: