////////
Search
Duplicate

데이터 분석

Tags
회의록
Archive
ETA
2025/07/14
Main Task
Sub Task
담당자
메모
상태
Done
생성 일시
2025/07/14 01:45
우선 순위
High
진행률 %
개인 분석 진행 사항
매우 중요한 부분! 충성고객 → 3회 이상 구매 & 3회 이상 completed & 평균 평점 4점 이상
타깃(페르소나) → 평점(2~3점), 구매완료 횟수(1~2회), 구매 개수
민규
세희
승인
지연
수민
실행 및 진행 사항 정리
# 두 그룹의 비율 계산 ratio1 = df[df['Is Loyal 2'] == True]['Age Group'].value_counts(normalize=True) ratio2 = df[df['Is Target'] == True]['Age Group'].value_counts(normalize=True) ratio3 = df['Age Group'].value_counts(normalize=True) # 공통 카테고리 정렬 (예: Completed, Cancelled) labels = sorted(set(ratio1.index).union(set(ratio2.index))) # y값을 label 순서에 맞게 정렬 y1 = [ratio1.get(label, 0) for label in labels] y2 = [ratio2.get(label, 0) for label in labels] y3 = [ratio3.get(label, 0) for label in labels] # 그래프 그리기 import numpy as np x = np.arange(len(labels)) # x를 정수 인덱스로 설정 width = 0.25 # 각 막대의 너비 plt.figure(figsize=(8, 5)) plt.bar(x - width, y1, width=width, label='충성 고객', color='skyblue') plt.bar(x, y2, width=width, label='타깃 고객', color='pink') plt.bar(x + width, y3, width=width, label='전체', color='gray') plt.xticks(x, labels) plt.ylim(0, 0.3) plt.xlabel('Age Group') plt.ylabel('비율') plt.title('세 그룹의 나이 비율 비교') plt.legend() plt.tight_layout() plt.show()
Python
복사
세그먼트 & CLV(목표) 재설정
충성 : Completed 3회 이상, Rating 4~5점
타깃 : Completed 1~2회, Rating 2~3점
구매 횟수
평점
구매 금액
평가(고객 세그먼트)
명칭
3회 이상
4~5점
상위 50%
우리 브랜드에 관심은 있고, 만족도가 높으면서, 지불 금액이 높은 고객
충성 고객
하위 50%
우리 브랜드에 관심은 있고, 만족도가 높으면서, 지불 금액이 낮은 고객
1~3점
상위 50%
우리 브랜드에 관심은 있고, 만족도가 낮으면서, 지불 금액이 높은 고객
타깃 고객 1
하위 50%
우리 브랜드에 관심은 있고, 만족도가 낮으면서, 지불 금액이 낮은 고객
3회 미만
4~5점
상위 50%
우리 브랜드에 관심은 없고, 만족도가 높으면서, 지불 금액이 높은 고객
타깃 고객 2
하위 50%
우리 브랜드에 관심은 없고, 만족도가 높으면서, 지불 금액이 낮은 고객
1~3점
상위 50%
우리 브랜드에 관심은 없고, 만족도가 낮으면서, 지불 금액이 높은 고객
타깃 고객 3
하위 50%
우리 브랜드에 관심은 없고, 만족도가 낮으면서, 지불 금액이 낮은 고객
CLV 구성요소
1.
1회 평균 구매 금액
2.
만족도 (Rating)
3.
구매 횟수 (Completed 기준)
⇒ 타깃 그룹마다 구성 요소에서의 중요도가 달라짐
길튜님 피드백
CLV의 Feature 가중치 ?? (33.3%) -CLV의 Feature 매우 중요 eg. 고객 점수 매기기. -목표에 따라 가중치가 달라짐
구매 횟수를 3회 이상으로 나눈 이유: 데이터가 취소 퍼센티지가 30% 이상이었고 3회이상이면 취소된 퍼센티지가 10% 미만으로 떨어졌다.
위의 근거처럼 평점, 구매 금액의 데이터 근거 적기 -기준을 만들 때 타당성 정하기 -구매 횟수에 대한 취소 횟수 변수를 둘 것
eg. 구매 횟수는 가산점, 취소 횟수는 감점 eg. 구매 점수, 취소 점수