실행 및 진행 사항 정리
각 등급별 이상치 제외 시 고객 수 50명씩 줄어듬
n_top = 3 # 상위 N명
top_n_each = (
df.sort_values(['Blue_Segment', 'New_CLV'], ascending=[True, False])
.groupby('Blue_Segment')
.head(n_top)
.reset_index(drop=True)
)
# 각 고객별 조합 문자열 생성
top_n_each['조합'] = (
"제품은 '" + top_n_each['Product Type'].astype(str) + "', "
+ "결제는 '" + top_n_each['Payment Method'].astype(str) + "', "
+ "배송은 '" + top_n_each['Shipping Type'].astype(str) + "'"
)
# 결과 출력
for segment in ['BLUE DIAMOND', 'BLUE SAPPHIRE', 'BLUE MARINE', 'BLUE OCEAN', 'BLUE SKY']:
print(f"\n:큰_파란색_네모: [세그먼트: {segment}] CLV 상위 3명 조합")
display(
top_n_each[top_n_each['Blue_Segment'] == segment][
['Customer ID', 'New_CLV', '조합']
]
)
Python
복사
Task :
우리의 목적은 우수고객 유치 또는 유지 입니다.
여기서 우수고객 기준은 모두 동일 합니다. 다만 가중치는 다를 수 있습니다.
각자의 가중치를 정리해서 적어주시면 좋을 것 같습니다.
가중치(혜선’s) 별로 고객 세그먼트 다시 분류하기
제가 생각해보니까 혜선님 가중치로만 3분의 세그먼트를 바라보면 될 것 같습니다.(왜냐면 구체적 데이터가 뽑히진 않았으니까.)
비지도학습 ⇒ 고객 클러스터링 / 고객의 군집화 / 군집 알고리즘
3.
고객 세그먼트 분류하기
설재웅
한다혜
라혜선
차서영
강민석
4.
CLV와 평점의 비율을 조절하기 ⇒ 우리 팀의 우수고객 지표의 우선순위로 결정하기
설재웅
한다혜
라혜선
차서영
강민석
실행 및 진행 사항 정리
피피티
상위 10명 샘플 (New_CLV 기준)
Customer ID | Total Purchase Amount | New_CLV | Premium 상품 | Premium 결제 | Premium 배송 | 평균 재구매간격(일) | 이탈고객 | 세그먼트 |
16624 | 12990.99 | 0.9996 | 1 | 1 | 1 | 101.0 | 1 | vvip |
18933 | 11643.94 | 0.9996 | 1 | 1 | 1 | NaN | 1 | vvip |
17250 | 16992.55 | 0.9994 | 1 | 1 | 1 | 10.5 | 1 | vvip |
17236 | 25167.95 | 0.9990 | 1 | 1 | 1 | 43.0 | 0 | vvip |
11827 | 14976.83 | 0.9987 | 1 | 1 | 1 | 189.0 | 1 | vvip |
18548 | 19120.16 | 0.9986 | 1 | 1 | 1 | 79.3 | 1 | vvip |
19981 | 12728.99 | 0.9974 | 1 | 1 | 1 | 129.0 | 1 | vvip |
11987 | 12440.15 | 0.9973 | 1 | 1 | 1 | 152.0 | 1 | vvip |
12027 | 11569.69 | 0.9971 | 1 | 1 | 1 | NaN | 1 | vvip |
11912 | 21994.58 | 0.9969 | 1 | 1 | 1 | 39.5 | 1 | vvip |
• NaN은 해당 고객의 재구매가 1회(또는 없음)일 때 발생할 수 있습니다.
세그먼트별 이탈 고객 합계
Segment | Churned Customers |
vvip | 1,737 |
vip | 1,665 |
standard | 1,283 |
gold | 1,218 |
sliver | 1,102 |
세그먼트별 구매건수
Segment | Total Purchase Count |
vvip | 2,624 |
vip | 2,625 |
standard | 2,687 |
gold | 2,764 |
sliver | 2,731 |
“고액 고객(상위 세그먼트)”일수록한 번에 큰 금액을 쓰는 경향이 있고,하위 세그먼트는 “자주 소액 구매”하는 고객이 많을 수 있음을 의미
강민석 미래예측 관련 주저리
GPT 선생님과의 정리를 위한 상담결과
근데 너한테 상담하고 싶은게있음 일단 아까 말헀듯이 빠레토 법칙을 들이밀면서 60%중하위권/ 20%상위권 얘내들 각각 이 극상위권 20%로 가려면 어떤걸 추가하면 얼마나 이동할지 확률을 각각 저기 보이는 타입(컬럼별로) 보고싶은거야.
1 근데 위에건 정제한거고 그냥 내머릿속 다 말해볼게.
2. 일단 기준이 되는 극상위권행동이없음 그래서 일단 저렇게 탑3만 뽑은건데 다뽑으면 존나많아 그래서 어떤걸 기준으로 삼고 극상위권에 진입했다고 볼 수 있는지?
3. 나머 60/20 얘들도 마찬가지로 시작점을 어떤걸 기준으로 해야 맞는건지 모르겠어
4. 난그냥ㅇ 발표할때 논리적 타당성만 있으면되거든
흠 그리고 또 고려해볼게 있나
5. 내가 너한테요청한건 정제한거지만 내가 너한테 요청하고 싶은거 다 말해볼게
일단 60/20 애들의 기준 부터 극상위권의 기준으로 진입하기 까지 각 컬럼을 바꿔가며 어떤게 가장 효율이 좋은지 결과 알고 싶고 각각 몇퍼인지 도
근데 이 효율이란게 어떤기준으로 산정되는건지도 궁금하고
결국우리는 NEW CLV가 올라야되는거거든
상담 결과
결과



