인구통계학적 데이터를 통해 고객세그멘테이션 진행 (성별, 수입, 나이)
KMeans 알고리즘을 사용하였고, 훈련데이터는 약 12000행, 평가할 데이터는 3000행을 따로 떼어놓음
엘보우 차트서 3을 팔꿈치로 보고 k = 3 으로 설정
아래는 훈련데이터의 3D그래프
훈련데이터로 만든 KMeans 객체로 평가 데이터 역시 클러스터링 해준다.
다음 그렇게 나뉘어진 고객들의 거래빈도, 거래금액, 보상, 프로모션 열람율과 완료율을 총 5가지 변수를 살펴본다.
차례대로 훈련데이터와 평가데이터의 페어플롯과 3D 그래프이다 (보상, 거래빈도, 거래금액)
그래프로 확인이 어렵다면 수치로 확인해보자
훈련데이터, 평가데이터 기술통계값
0번 그룹
열람율 | 완료율 | 획득보상 | 거래횟수 | 거래금액 | |
훈련데이터 | 70.39% | 47.79% | 8.09 | 10.01 | 81.09 |
평가데이터 | 72.64% | 48.58% | 8.35 | 10.22 | 81.28 |
1번 그룹
열람율 | 완료율 | 획득보상 | 거래횟수 | 거래금액 | |
훈련데이터 | 77.43% | 61.99% | 11.04 | 8.07 | 120.75 |
평가데이터 | 77.78% | 62.67% | 9.02 | 4.85 | 149.80 |
2번 그룹
열람율 | 완료율 | 획득보상 | 거래횟수 | 거래금액 | |
훈련데이터 | 77.02% | 73.67% | 13.51 | 7.77 | 150.39 |
평가데이터 | 76.85% | 74.03% | 9.10 | 4.43 | 140.24 |
전체적으로 열람율과 완료율에서 오차가 적고, 0번 그룹의 경우 나머지 변수들에서도 오류가 적음을 알 수 있다.
단, 1번 그룹과 2번 그룹의 획득보상, 거래횟수 등에서 차이를 보이는 점은 아쉬움이 남는다.
정리 및 결론
각 기존 고객의 인구통계학적 데이터(훈련데이터)로 그룹화한 고객군별로,
열람율, 완료율, 획득보상, 거래횟수, 거래금액의 특징에 맞게 페르소나를 부여하여 맞춤 프로모션 제안 전략을 세우고,
신규고객의 가입정보를 토대로 똑같이 그룹화를 진행에 각 고객군별로 맞춤 프로모션을 제안한다.
피드백
다른 평가지표를 사용하거나 지도학습으로 이를 해결할 수 있는지 찾아보자.
'프로젝트 > 부트캠프' 카테고리의 다른 글
스타벅스 마케팅 데이터 분석 (1) | 2025.01.01 |
---|