Task : 데이터를 연령 기반으로 그룹화 하기
50대 이상 고령층의 이탈률이 높은 것은 가독성이나 인터페이스 불편 등 연령 특화 UX 부족 때문일 가능성이 있다.
•
birthday 컬럼을 활용해 age / age_group 파생 변수를 만들어서 연령별 비교 분석을 한다.
연령층(경제적 상황)(성인/미성년자)에 따라 구독 유형이 비싸질수록 이탈률이 낮아질 것이다.
•
age 컬럼과 subscription_plan 컬럼을 활용해서 상관관계를 비교 분석한다.
실행 및 진행 사항 정리
# age 100 이상 이상치 제거
merged_df = merged_df[merged_df["age"] <= 100]
Python
복사
결과