Task :
대전제 조건
•
주어진 구매 데이터를 기반으로 다음을 분석합니다
•
결과 유의사항 등 인사이트 간결하고 명확하게 정리
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안 5/6
재웅-고가의 제품을 구매하는 고객이 Add-ons Purchased의 경우가 많을 것이다 >귀무가설 채택!
가격별/타입별 저중고를 나누었으나 둘다 의미없었음
본인 진행상황 코드
인사이트
짱구- 분기별 매출 급감 구간이 있을것이다. > 그래프로 결론 머신러닝으로 튀는 구간 잡기 >그 전에 품목 다합쳐야됨
매출 급증구간이 발견되었음 분기별은 아니지만 월별 그리고 다시 일별로 나누었을때 해당값을 구할 수 있었음으로 맨 아래 그래프로 대체하겠음.
본인 진행상황 코드
인사이트
다혜 -스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
◦
재구매율은 토탈펄체이스 어마운트기준으로 아이디로 카운트하기!
◦
대립가설채택! >스마트폰구매고객이 헤드폰보다 만족도 높다!! 재구매는 귀무! 연관없음!
본인진행상황코드
서영 - > 특정 결제 수단으로 결제한 사용자의 이탈률이 높을 것이다. 데이터 이쁨 마치 나같음(차서영) 캐쉬 직불카드 확연하게 높았음, 이건에 관한 해결방한 제시 너~무 명확함, 해당결제수단 방법을 개선한다거나 과정을 경량화 한다거나 직관적으로 알 수 있다. 적극추진요청!
대립가설 채택!
특정 날짜기준 결제타입별 이탈자가 < 이 전제조건이 맞나?
1.
관건
a.
이탈률 기준은 90일 근거 정함 → 하단에 정리 완료
b.
위 기준으로 이탈자를 확인했더니(결제수단별) 유의미한 차이가있었다(통계적으로)
c.
이 결제수단별 이탈율을 감소하는 예측이관건(머신러닝)
결론:
1.
위 세가지를 통해서 결제수단별 이탈율을 우리가 원하는 결제수단을 옮길 수 있는지(삼성카드 유치목적)
2.
실제로 원인이 다른게 있을 수 도 있다를 찾기위함.
>유의미한 차이가 있었다. 차서영이 결국해냈다.
>앞으로 이탈률과 결제수단이 서로 얽히는 관계를 찾아봐야한다.
결과 :
재웅 : 90일 초과 구매자 = 이탈자 따라서 계좌이체가 58퍼로 제일높다, 직불카드가 70퍼로 높고 검정시 유의미함 > 대립가설 채택!
혜썬 : 30일 이내 구매 하지않은 고객 = 이탈자, 따라서 이탈율 모두 높았으나 통계적 유의미 하였음
워크플로우 : 머신러닝을 이용한 결제 수단별 이탈율 하락 예측 과 결제수단을 우리가 원하는 수단으로 옮길 수 있는 방안 > 자사몰 포인트 캐쉬백,
진행 상황 코드
분석 결과 및 인사이트
혜선 - 구매 주기와 이탈률 | 가설: 첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
1.귀무가설 기각 > 대립가설채택 유의미함.
1-1. > 3,6,90일 단위로 봐도 이탈율이 현저히낮음(30일 이내 재구매자) > 따라서 30일 이내재구매자가 아닌사람과 이탈율이 동등하게 나오는 지점을 마지노선으로 잡고 리마인드 이벤트를 기획 할 수 도있다. 30~마지노선 기간까지를 CLV핫타임으로 정의내릴 수 도 있다. > 이건 이구간대 가격이 얼마나 집중되있는지를 봐야될 수 도있다.
2.타입별 월별 판매량을 쪼개봤더니 2024년 1월부터 판매량 급증 원인분석 시급
진행 상황 코드
인사이트
2.제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략 1/2
혜선 - 제품군 별 재 구매율 차이 | 가설 : Product Type 별로 재구매율이 유의미하게 다르다.
귀무가설 채택!
진행 상황 코드
인사이트
다혜 - 2.배송유형에 따라 제품평점의 평균값에 유의미한 차이가 있을 것이다
대립가설채택!
코드
유의미하는 차이는 있었으나 세임데이가 제일 높지않고 제일낮음(배송속도에따라 평점이 높은게아님) > 배송 방법의 품질 개선
또다른 가설! 2-1고가의 상품은 제일 빠른 배송 방법을 선택했을 가능성이 높을까요????
3.고객 생애 가치(CLV) 증대를 위한 전략적 제안 3/4
total purchased amount 컬럼은 = CLV의 척도
서영 - 구매가 이루어진 날짜는 월말(연말아님)에 집중되어 있을 것이다. > 예상했던대로 월말이 가장많이 나왔다, 해결은 중순월초 할인쿠폰 이벤트를 한다거나 고객 이끄는 방안 만들 수 있음, 월초 중순에 구매율을 높일 수 있는 이벤트를 기획할 수 있다. >>>> 데이터 이쁨 마치나같음(다혜왈) 좋은뎨?
귀무가설로 봐야할지? > 중립지대 (너무길어서 토글에 넣음)
진행 상황 코드
분석 결과 및 인사이트
2.혜선 - 로열티 멤버십 효과 | 가설: 멤버십을 가입한 고객의 재구매율은 멤버십을 가입하지 않은 고객 보다 높다.
멤버쉽 가입할수록 CLV높다 > 귀무
멤버쉽 재구매율 높다 > 대립가설 채택
연령대별로?
멤버십이 의미가 없다는 거니까 멤버쉽을 강화하는게 CLV증진에 키포인트가 될 수 있다.
진행 상황 코드
인사이트
혜선 - 첫 주문 금액과 고객 생애 주기와의 상관관계 | 가설: 첫 구매 주문 금액이 높은 고객일 수록 고객
진행 상황 코드
인사이트
혜선 - 구매 만족도와 CLV의 관계
가설1. 첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.(귀무가설)
가설 2. 총 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다. (대립가설)
진행 상황 코드
인사이트
# 2) 완료 주문만 필터(필요 시)
SSE = SSE[SSE['Order Status'] == 'Completed']
# 3) 주문 월(order_month) 생성
SSE['order_month'] = SSE['Purchase Date'].dt.to_period('M')
# 4) 제품별 월별 구매 건수 집계
monthly_sales = (
SSE
.groupby(['order_month', 'Product Type'])
.size()
.reset_index(name='sales_count')
)
# 5) pivot: 각 제품을 컬럼으로 펼치기
pivot_SSE = monthly_sales.pivot(
index='order_month',
columns='Product Type',
values='sales_count'
).fillna(0)
# 6) x축에 매월 표시할 datetime 인덱스
x = pivot_SSE.index.to_timestamp()
# 7) 라인 차트 그리기
plt.figure(figsize=(12, 6))
for product in pivot_SSE.columns:
plt.plot(x, pivot_SSE[product], marker='o', label=product)
# 8) xticks를 모든 월로 설정
plt.xticks(x, [d.strftime('%Y-%m') for d in x], rotation=45)
plt.title('Monthly Purchase Volume by Product Type')
plt.xlabel('Month')
plt.ylabel('Number of Purchases')
plt.legend(title='Product Type', loc='upper left', bbox_to_anchor=(1, 1))
plt.tight_layout()
plt.show()
Python
복사
실행 및 진행 사항 정리
기준 정리
CLV : TOTAL PURCHASED AMOUT 컬럼
이탈기준 : 90일 이상 재구매가 없는 사용자
근거 분석 코드
대립가설 목록
1. 고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안
•
특정 결제 수단으로 결제한 사용자의 이탈률이 높을 것이다.
•
스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
•
첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
•
분기별 매출 급감 구간이 있을 것 이다.
◦
2023년 12월에서 2024년 1월에 급 상승하는 결과 확인
◦
그래프로 결론 머신러닝으로 튀는 구간 잡기 > 그 전에 품목 다합쳐야 됨
2. 제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략
•
배송유형에 따라 제품평점의 평균값에 유의미한 차이가 있을 것이다
3. 고객 생애 가치(CLV) 증대를 위한 전략적 제안
•
총 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다.
•
첫 구매 주문 금액이 높은 고객일 수록 고객 생애 가치가 높다.
튜터님한테 질문하기 위한 대립가설 채택 논리구조
대립가설 중점 답변받고싶은내용:
저희 잘하고 있나요!!튜터님!!
부족한 부분은 뭘까요!!!
뭘 잘했는지 알려주시면
더 깊게 파는데 도움될것같습니다!
전체피드백
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안
1-1. 특정 결제 수단으로 결제한 사용자의 이탈률이 높을 것이다.
근거
파생 가능 가설
튜터님 피드백
1-2. 스마트폰을 구매한 고객은 헤드폰을 구매한 고객보다 만족도가 높을 것이고 재구매율 또한 높을 것이다.
근거
파생 가능 가설
1-3. 첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
근거
파생 가능 가설
1-2.타입별 월별 판매량을 쪼개봤더니 2024년 1월부터 판매량 급증 원인분석 필요
1-4. 분기별 매출 급감 구간이 있을 것이다.
근거
파생 가능 가설
2.
제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략
2-1. 배송 유형에 따라 제품 평점의 평균 값에 유의미한 차이가 있을 것이다
근거
유의미하는 차이는 있었으나 same day가 제일 높지않고 제일낮음(배송속도에따라 평점이 높은게아님) > 배송 방법의 품질 개선
파생 가능 가설
3.
고객 생애 가치(CLV) 증대를 위한 전략적 제안
3-1. 총 평점이 높은 고객이 재구매율과 고객 생애 가치가 높다.
근거
파생 가능 가설
3-2. 첫 구매 주문 금액이 높은 고객일 수록 고객 생애 가치가 높다.
근거
파생 가능 가설
중립지대 > 너무 아까운대이거 버려요 우리? 튜터님...? 































































버려
튜터님한테 질문하기 위한 중립가설 논리구조
(튜터님 방향성좀 잡아주세요 ㅠㅠ 1.더파봐라(어떻게?) 2.버려라(다른거에 집중!)
너무 복잡하고 유의미하다고 나왔으나 의미없어보이는데 버리기는 아까운)
목표에서 멀어지면 필요없음 해봤자 의미없음.
1. 구매가 이루어진 날짜는 월말 (연말아님)에 집중되어 있을 것이다.
2. 구매 만족도와 CLV의 관계
귀무가설 목록
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안 5/6
재웅-고가의 제품을 구매하는 고객이 Add-ons Purchased의 경우가 많을 것이다 >귀무가설 채택!
가격별/타입별 저중고를 나누었으나 둘다 의미없었음
본인 진행상황 코드
인사이트
2.제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략 1/2
혜선 - 제품군 별 재 구매율 차이 | 가설 : Product Type 별로 재구매율이 유의미하게 다르다.
귀무가설 채택!
진행 상황 코드
인사이트
3.고객 생애 가치(CLV) 증대를 위한 전략적 제안 3/4
혜선 - 구매 만족도와 CLV의 관계
가설1. 첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다
진행 상황 코드
인사이트
혜선 - 로열티 멤버십 효과 | 가설: 멤버십을 가입한 고객의 재구매율은 멤버십을 가입하지 않은 고객 보다 높다.
멤버쉽 가입할수록 CLV높다 > 귀무
진행 상황 코드
인사이트
튜터님께 질문하기 위한 귀무가설 채택 논리구조
중점사항 우리가 귀무가설 채택한 것을 관점을 바꿔 다른 시도를 했음에도 (이렇게 까지헀는데도?!) 유의미한 차이가 없었다. 튜터님 저희 또 시도해 봐야 될까요? 버릴까요?
1.고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안 5/6
1.
고가의 제품을 구매하는 고객이 Add-ons Purchased의 경우가 많을 것이다 > 관련없음
대략 0.1%의 차이가 있었고 p-value > 0.05 임으로 통계적 의미 X
근거
파생 가능 가설
2.제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략 1/2
1.
Product Type 별로 재구매율이 유의미하게 다르다. > 통계적으로 유의미한 결과가 나오지 않음
p-value가 0.05보다 크므로 “상품 유형별로 재구매 비율이 다르다”는 대립가설을 기각
수치상으로 스마트폰(44.7%)과 스마트워치(44.0%)가 약간 낮고 노트북(46.3%)이 약간 높은 편이지만 통계적으로 유의미한 차이로 보기는 어려움
근거
파생 가능 가설
3.고객 생애 가치(CLV) 증대를 위한 전략적 제안 3/4
1.
첫 구매 시 Rating이 높은 고객이 재구매율과 고객 생애 가치가 높다
> 통계적으로 유의미한 관계가 발견되지 않음
첫 구매 평점과 재구매율 사이에는 통계적으로 유의미한 관계가 발견되지 않음
(P-value = 0.786)
첫 구매 평점과 CLV 사이에는 통계적으로 유의미한 관계가 발견되지 않음
(P-value = 1.000)
첫 구매에 점수를 높게 준 고객(≥3점)은 오히려 CLV 가 낮고 재구매율도 통계적으로 차이가 없어
“첫 구매 만족도”가 충성도·가치로 직결된다고 보기 어려움
근거.
•
P-value 0.786 (재구매율), 1.000 (CLV) → 통계적으로 의미 있는 차이 없음
•
시각적으로 볼 때도, 극적인 경향 차이도 보이지 않음
•
즉, 첫 구매 평점만으로는 CLV나 재구매 여부를 예측하기 어렵다는 결론
결과
오늘의 칭찬자:
라혜선 선생님이 마법의 코드로 우리의 문제를 해결하셨다.
오더주문 스테이터스를 컴플리트로 정리 하니 팀원 모두의 행 결과가 같아졌다
혜선님 포도알 3개적립!!!!!!!!!
전체피드백
1.
데이터 분석의 목표와 연결이 어떻게 되는거지? 라는 의문이 남았다.
2.
가설 설정이 잘 되어있고 판단과 근거들은 의미가 파악될 정도로 정리가 잘 되어있다.
a.
그래서 이 가설들과 근거들을 이걸 어떻게 할 건지 팀 논의 필요
3.
짧은 시간에 많은 가설 검증 시도를 어캐했누;;
4.
좋은 점 : 가설들이 다 별개의 것이다.
a.
단편적 가설들이기 때문에 “스마트폰이랑 헤드폰을 구매한 고객이 만족도가 달라? “ 에서 한 단계가 더 들어가 “왜 다른거야??”를 확인해보면 좋을 것 같다.
b.
이러한 플로우로 단계별로 계속 왜 달라진 건지를 파악해내는 깊이가 필요함.
c.
30일 이내 이탈률이 낮은 원인 분석
i.
제품의 특성이 30일 이내에 무조건 부속품을 바꿔야하는 종류 | ex: 세탁기
ii.
1차적인 원인에서 2차적인 근거로 넘어갈 때 왜 차이가 났는지 고민해보고 증명하는 과정이 있으면 좋을 것같다. == ‘깊이 있는 분석’
5.
우리가 갖고 있는 정보와 데이터는 한정적이기 때문에 쉽지 않을 수 있기에 선택과 집중 그리고 아이디어를 모아야 한다!!
a.
성기훈메타 이미 우리는 이 게임을 해봤어요!!
4조 채택 가설
1.
고객 세그먼트별 구매 행동 분석 및 맞춤형 마케팅 전략 제안
a.
분기별 매출이 다를 것이다.
b.
첫 구매 후 30일 이내 재구매한 고객은 재구매 하지 않은 고객 보다 이탈률이 낮다.
c.
이탈률(90일 기준)으로 된 가설 1개 추가요.
2.
제품별 판매 성과 분석 및 재고/제품 라인업 최적화 전략
a.
배송 유형에 따라 제품 평점의 평균 값에 유의미한 차이가 있을 것이다
3.
고객 생애 가치(CLV) 증대를 위한 전략적 제안
a.
첫 구매 주문 금액이 높은 고객일 수록 고객 생애 가치가 높다.
i.
꼭 첫 구매 주문금액이어야 할까요? 한번생각해보면 좋을 것 같습니다.
b.
총 평점이 높은 고객이 재구매율과 고객 생애 가치가 높다.
내일 만나서 생각할 것
•
•
가설이 나오게 된 경위부터 결론까지 플로우가 자연스럽게 이어지도록 정리하기
•
목표에 맞는 세미 결론 짓기
•
우리가 한 검정이 최종적으로 옳게된 방법인지 검증





