6/17 (화)

프로젝트 가설 분석 과정

담당 가설: 잠재 전환형 유저(중저가형) -mid_50k_150k + new + 검색 유입 + 리뷰 클릭 X + 할인 노출 O

# mid_50k_150k + new + 검색 유입 + 리뷰 클릭 X + 할인 노출 O 만 보기

import pandas as pd
df5 = pd.read_csv("df5.csv")


filtered_df = df5[
    (df5['price_band'] == 'mid_50k_150k') &
    (df5['user_type'] == 'new') &
    (df5['traffic_source'] == 'search') &
    (df5['review_clicked'] == False) &
    (df5['discount_exposed'] == True)
]
filtered_df

# 상품 타입별 이탈률 보기

# 'churned' 플래그 생성: add_to_cart == 'No' 인 경우 True
filtered_df = filtered_df.copy()
filtered_df['churned'] = filtered_df['add_to_cart'] == 'No'

# product_category별 이탈률 계산
churn_summary = (
    filtered_df
    .groupby('product_category')
    .agg(
        total_users=('user_id', 'count'),
        churned_users=('churned', 'sum')
    )
    .assign(dropout_rate=lambda x: (x['churned_users'] / x['total_users']) * 100)
    .reset_index()
)

# 결과 출력
print(churn_summary)
Python
복사

product_category	total_users	churned_users	dropout_rate
accessory	6	4	66%
bag	6	4	66%
fashion	8	5	62%
outlet	10	10	100%

-아울렛 이탈 100%

검색으로 유입 됐으며, 할인률을 봄.

중저가 제품을 싸게 살 기회이지만, 장바구니에 담지 않음

애매한 할인은 오히려 구매 요인이 떨어진다.

(중복 할인 상태지만 구매하지 않았음)

# pdp


# 1. 분석 타겟 필터링
target_users = df5[
    (df5['price_band'] == 'mid_50k_150k') &
    (df5['user_type'] == 'new') &
    (df5['traffic_source'] == 'search') &
    (df5['review_clicked'] == False) &
    (df5['discount_exposed'] == True)
]

# 2. 체류시간 + 상품 카테고리별 분석
summary = target_users.groupby(['duration_group_label', 'product_category']).agg(
    total_users=('user_id', 'count'),
    avg_pdp_duration=('pdp_duration_sec', 'mean'),
    churned_users=('add_to_cart', lambda x: (x == 'No').sum()),
    converted_users=('purchase_completed', lambda x: (x == 'Yes').sum())
).reset_index()

# 3. 비율 계산
summary['dropout_rate'] = (summary['churned_users'] / summary['total_users']) * 100
summary['conversion_rate'] = (summary['converted_users'] / summary['total_users']) * 100

# 4. 반올림
summary['avg_pdp_duration'] = summary['avg_pdp_duration'].round(1)
summary['dropout_rate'] = summary['dropout_rate'].round(1)
summary['conversion_rate'] = summary['conversion_rate'].round(1)

summary
Python
복사

체류시간 구간	상품	이탈률	전환율
매우 짧음	fashion	0%	0%
매우 짧음	accessory	50%	0%
매우 짧음	outlet	100%	0%
짧음	fashion	60%	20%
짧음	accessory	0%	0%
짧음	outlet	100%	0%
짧음	bag	50%	0%
김	fashion	100.0%	0%
김	accessory	100%	0%
김	outlet	100%	0%
김	bag	66.7%	0%
매우 김	fashion	100%	0%
매우 김	accessory	100%	0%
매우 김	bag	100%	0%

체류 시간 관련 시각화

담당 가설: 무반응형 신규 유저 -

•

(under_50k + mid_50k_150k) + new + ad 유입 + 리뷰 클릭 X + 할인 노출 x

카테고리 별 이탈률

#유저 필터링
import pandas as pd

# CSV 파일 불러오기
df = pd.read_csv("df.csv")

# 조건 필터링
df_filtered = df[
    (df['price_band'].isin(['under_50k', 'mid_50k_150k'])) &
    (df['user_type'] == 'new') &
    (df['traffic_source'] == 'ad') &
    (df['review_clicked'] == False) &
    (df['discount_exposed'] == False)
]
print("전체 유저 수:", df.shape[0])


# 카테고리 별 이탈률 적용

# 1. 이탈 여부 플래그 생성
df_filtered['is_abandon'] = df_filtered['add_to_cart'] == "No"

# 2. product_category별 총 유저 수와 이탈 유저 수 집계
abandon_summary = (
    df_filtered
    .groupby('product_category')
    .agg(
        total_users=('add_to_cart', 'count'),
        abandon_users=('is_abandon', 'sum')
    )
    .reset_index()
)

# 3. 이탈률 계산 (%)
abandon_summary['abandon_rate'] = (abandon_summary['abandon_users'] / abandon_summary['total_users']) * 100

# 결과 출력
abandon_summary


Python
복사

시각화

순수 광고 유입..

‘outlet’을 제외하면 전부 이탈함 = 광고 말고 다른 추가 액션이 필요..

•

그나마 가격 메리트가 있는 아울렛만 조금 장바구니에 슥슥..

담당 가설: 리뷰 반응형 신규 유저

(under_50k + mid_50k_150k) + new + ad 유입 + 리뷰 클릭 ㅇ + 할인 노출 x

시각화

광고+리뷰 신규 유입

•

‘fashion’ 올 이탈.. 광고 보고 왔지만 리뷰 보고 후퇴