인구통계학적 데이터를 통해 고객세그멘테이션 진행 (성별, 수입, 나이) 

KMeans 알고리즘을 사용하였고, 훈련데이터는 약 12000행, 평가할 데이터는 3000행을 따로 떼어놓음

 

엘보우 차트서 3을 팔꿈치로 보고 k = 3 으로 설정

 

아래는 훈련데이터의 3D그래프

 

훈련데이터로 만든 KMeans 객체로 평가 데이터 역시 클러스터링 해준다.

 

다음 그렇게 나뉘어진 고객들의 거래빈도, 거래금액, 보상, 프로모션 열람율과 완료율을 총 5가지 변수를 살펴본다.

 

 

차례대로 훈련데이터와 평가데이터의 페어플롯과 3D 그래프이다 (보상, 거래빈도, 거래금액)

왼쪽: 훈련데이터, 오른쪽: 평가데이터
왼쪽: 훈련데이터, 오른쪽: 평가데이터

 

그래프로 확인이 어렵다면 수치로 확인해보자

 

훈련데이터, 평가데이터 기술통계값

 

0번 그룹

  열람율 완료율 획득보상 거래횟수 거래금액
훈련데이터 70.39% 47.79% 8.09 10.01 81.09
평가데이터 72.64% 48.58% 8.35 10.22 81.28

 

1번 그룹

  열람율 완료율 획득보상 거래횟수 거래금액
훈련데이터 77.43% 61.99% 11.04 8.07 120.75
평가데이터 77.78% 62.67% 9.02 4.85 149.80

 

2번 그룹

  열람율 완료율 획득보상 거래횟수 거래금액
훈련데이터 77.02% 73.67% 13.51 7.77 150.39
평가데이터 76.85% 74.03% 9.10 4.43 140.24

 

 

전체적으로 열람율과 완료율에서 오차가 적고, 0번 그룹의 경우 나머지 변수들에서도 오류가 적음을 알 수 있다.

단, 1번 그룹과 2번 그룹의 획득보상, 거래횟수 등에서 차이를 보이는 점은 아쉬움이 남는다.

 

정리 및 결론

각 기존 고객의 인구통계학적 데이터(훈련데이터)로 그룹화한 고객군별로,

열람율, 완료율, 획득보상, 거래횟수, 거래금액의 특징에 맞게 페르소나를 부여하여 맞춤 프로모션 제안 전략을 세우고,

신규고객의 가입정보를 토대로 똑같이 그룹화를 진행에 각 고객군별로 맞춤 프로모션을 제안한다.

 

피드백

다른 평가지표를 사용하거나 지도학습으로 이를 해결할 수 있는지 찾아보자.

 

'프로젝트 > 부트캠프' 카테고리의 다른 글

스타벅스 마케팅 데이터 분석  (1) 2025.01.01

목차

  1. 분석 배경
  2. 무엇을 하나요?
  3. 결론
  4. 전략시 고려사항
  5. 고객 세그먼테이션
  6. 참고 사항

 

1. 분석 배경

여러분은 꿈에 그리던 스타벅스에 데이터분석가로 입사하였습니다. 🎉 스타벅스가 다루고 있는 데이터 중 고객들에게 나가는 프로모션에 대한 데이터를 가지고 의미있는 인사이트를 도출하길 원합니다.

 

 

2. 무엇을 하나요?

2-1) 수집된 데이터들을 이해하고 특성파악하는 작업

2-2) 고객 세그먼테이션을 진행하고, 각 고객군별 맞춤 전략 도출

 

 

3. 결론

고객들을 여러 특성을 기준으로 살펴보았고, 총 5가지의 고객군으로 나누었습니다. 그런 다음 데이터 내에서 확인된 정보들을 바탕으로 고객군 별로 전략을 작성하였습니다.

고객군 특징 전략
VIP 고객 고소득, 고거래, 프로모션 적극활용 한정판 상품 판매 및 관련 프로모션 제공
프로모션 마스터 구매 빈도가 높고 프로모션 활용도도 높음 적립형 프로모션 이벤트 제공
잠재 VIP 고객 고소득이지만 거래 빈도는 낮음 프리미엄 음료 프로모션 및 정보성 프로모션 제공
출근길 직장인 구매빈도는 높지만 거래 빈도는 낮음 BOGO 프로모션 제공
무관심 고객 수입이 낮고 브랜드와 연결고리가 약함 할인 및 휴먼 고객 대상 프로모션 제공

 

 

4. 전략시 고려사항

 

4-1) 프로모션 마케팅 채널은 이메일과 모바일, 소셜미디어를 중점적으로 활용한다. 열람율은 채널에 영향을 주는 것으로 판단된다.

 

 

4-2) 프로모션별로 완료율, 기대 거래 회수와 기대 거래 금액이 다르다. 

프로모션 참여도가 높고 기댓값도 높은 프로모션을 활용하자.

 

 

4-3) 15년 중순, 17년 중순에 실행했던 이벤트성 프로모션이 있다면 진행해보자.

 

15년 중순과 17년 중순에 일간 가입자 수가 급격하게 늘어남을 볼 수 있다. 그리고 18년 초부터는 가입자 수가 감소하는 추세이다. 15년과 17년 중순 진행했던 프로모션이 있다면 다시금 진행해보고, 18년 초에 진행한 프로모션이 있다면 해당 이벤트를 재검토해본다. 물론 다른 외부 변수의 영향일 가능성이 높다. 이를 확인하고 검토해보자.

 

 

4-4) 프로모션은 주기적으로 제공하여야 한다.

프로모션이 발송된 직후 거래량이 급증하고 서서히 줄어드는 것을 볼 수 있다. 주기적으로 프로모션을 제공해서 고객들의 구매를 유도하자.

 

 

4-5) 최종적으로 고객군 별로 반응이 좋지 않은 프로모션은 제외하자

 

출근길 직장인 고객이나 무관심 고객에게는 C와 D 프로모션을 제외해 불필요한 비용을 아낄 수 있다.

 

 

5. 고객 세그먼테이션

 

총 17000명의 고객 중 결측치와 이상치를 제외한 14487명의 고객데이터로 고객별로 연령, 성별, 가입기간, 수입, 거래빈도, 거래금액, 프로모션 열람율, 프로모션 완료율까지 9가지 변수를 사용해 KMeans 알고리즘을 통하여 5가지 고객군으로 분류했습니다. 

(열람율과 완료율은 고유값이 적고 식별하기에 어려움이 있어 페어플롯에서 제외했습니다)

 

 

6. 참고사항

 

1. 열람율 분석시 프로모션별 발송 개수와 시간에 따른 발송 추이를 확인하였고, 편향이 없음을 확인했습니다.

 

2. 완료율과 보상은 음의 관계를 보입니다.

 

이는 Discount  유형의 프로모션이 보상이 적은데도 불구하고 상대적으로 Bogo 유형 프로모션보다 완료율이 높음에 있습니다.  사람들이 Bogo 유형보다 Discount 유형의 프로모션을 선호한다고 볼 수 있습니다.

 

'프로젝트 > 부트캠프' 카테고리의 다른 글

신규 고객 맞춤형 프로모션 제안  (0) 2025.01.03

+ Recent posts