Task : 가설 모아서 함께 파보기
4/16
아래는 각자 진행했던 가설들을 카테고리에 매칭한 것.
다같이 하는이유: 깊이있고 빠르게 추려내기
대전제 조건
•
주어진 구매 데이터를 기반으로 다음을 분석합니다
•
결과 유의사항 등 인사이트 간결하고 명확하게 정리
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안 3 /7
재웅-고가의 제품을 구매하는 고객이 Add-ons Purchased의 경우가 많을 것이다 >귀무가설 채택!
가격별/타입별 저중고를 나누었으나 둘다 의미없었음
본인 진행상황 코드
인사이트
짱구- 분기별 매출 급감 구간이 있을것이다. > 그래프로 결론 머신러닝으로 튀는 구간 잡기 >그 전에 품목 다합쳐야됨
본인 진행상황 코드
인사이트
다혜 -스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
◦
재구매율은 토탈펄체이스 어마운트기준으로 아이디로 카운트하기!
◦
대립가설채택! >스마트폰구매고객이 헤드폰보다 만족도 높다!! 재구매는 귀무! 연관없음!
본인진행상황코드
서영 - 멤버십에 가입한 고객은 가입하지 않은 고객보다 재구매율이 높을 것이다.
진행 상황 코드
분석 결과 및 인사이트
서영 - 특정 결제 수단으로 결제한 사용자의 이탈률이 높을 것이다. > 데이터 이쁨 마치 나같음(차서영) 캐쉬 직불카드 확연하게 높았음, 이건에 관한 해결방한 제시 너~무 명확함, 해당결제수단 방법을 개선한다거나 과정을 경량화 한다거나 직관적으로 알 수 있다. 적극추진요청!
진행 상황 코드
분석 결과 및 인사이트
혜선 - 구매 주기와 이탈률 | 가설: 첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
진행 상황 코드
인사이트
2.제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략1/1
혜선 - 제품군 별 재 구매율 차이 | 가설 : Product Type 별로 재구매율이 유의미하게 다르다.
진행 상황 코드
인사이트
다혜 - 2.배송유형에 따라 제품평점의 평균값에 유의미한 차이가 있을 것이다
또다른 가설! 2-1고가의 상품은 제일 빠른 배송 방법을 선택했을 가능성이 높을까요????
3.고객 생애 가치(CLV) 증대를 위한 전략적 제안
total purchased amount 컬럼은 = CLV의 척도
3/4
서영 - 구매가 이루어진 날짜는 월말(연말아님)에 집중되어 있을 것이다. > 예상했던대로 월말이 가장많이 나왔다, 해결은 중순월초 할인쿠폰 이벤트를 한다거나 고객 이끄는 방안 만들 수 있음, 월초 중순에 구매율을 높일 수 있는 이벤트를 기획할 수 있다. >>>> 데이터 이쁨 마치나같음(다혜왈) 좋은뎨?
진행 상황 코드
분석 결과 및 인사이트
혜선 - 로열티 멤버십 효과 | 가설: 멤버십을 가입한 고객의 재구매율은 멤버십을 가입하지 않은 고객 보다 높다.
진행 상황 코드
인사이트
혜선 - 첫 주문 금액과 고객 생애 주기와의 상관관계 | 가설: 첫 구매 주문 금액이 높은 고객일 수록 고객 생애 가치가 높다.
진행 상황 코드
인사이트
혜선 - 구매 만족도와 CLV의 관계
가설1. 첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.
가설 2. 총 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.
진행 상황 코드
인사이트
#고객정보: 구매 횟수, CLV 코드
customer_info = SSE.groupby('Customer ID').agg(repurchase_count = ('Total Purchase Amount','count'),
CLV = ('Total Purchase Amount','sum')).reset_index()
Python
복사
실행 및 진행 사항 정리
대립가설 채택 list 2/2
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안
다혜 -스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
재구매율은 토탈펄체이스 어마운트기준으로 아이디로 카운트하기!
대립가설채택! >스마트폰구매고객이 헤드폰보다 만족도 높다!! 재구매는 귀무!연관없음!
본인진행상황코드
재웅- 학기 시작전 태블릿 노트북 구매가 많을 것이다
본인 진행상황 코드
인사이트
2.제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략
3.고객 생애 가치(CLV) 증대를 위한 전략적 제안
혜선 - 구매 만족도와 CLV의 관계
가설1. 첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.
가설 2. 총 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.
진행 상황 코드
인사이트
카테고리별 가설 모으기
2.
단계별로 나눠서 다같이 단계를 뿌시기
a. 시각화
b. p-value검정(통계분석)
c. 가설 확장 및 카테고리 그룹핑하기
d. 머신러닝 예측
C단계에서 3.PPT 발표 논리구조 생각해보기***
아래는 공유 PPT링크 입니다. 하다가 머리가 간지럽거나 답답할때 시각화 해보는것도 좋은 방법입니다.
결과
1.
가설을 한데 모았다.
2.
팀원들의 실력이 늘어가는 것이 눈으로 보였고 나또한그랬다.
3.
유의미한 가설을 20개 > 7~8개로 압축하였다.
4.
이 과정에서 뜻하지 않는 결과를 도출 하였고 > 머신러닝까지의 연결성 > 역시 데이터는 뜯어볼 수 록 슈뢰딩거의 고양이 같다는 생각을 하였다.
5.
내일은 가설 검증을 마치고 튜터님께 질문을 드릴 예정 이며 가설을 완벽하게 검정하는것이 목표!
