구독 플랜별 이탈 시점에서 유의미한 차이를 보일 것이다.
→ 구독 플랜이 유료인 유저가 더 적게 이탈할것이다.
Task
•
last_access_timestamp : 13월달 결측치 수정해야함
◦
결측치 20개
•
정민님 전처리
1.
연령 및 연령대 도출을 위한 birthday 데이터 타입 변환
2.
100세 이상 이상치 삭제
'데이터프레임' = '데이터프레임'['데이터프레임'['age'] < 100]
Python
복사
실행 및 진행 사항 정리
•
5% 미만이라 결측치 행 삭제
•
타입 datetime으로 변경
•
age 파생 컬럼으로 만들어 나이 구한 다음 > 이상치 처리로 삭제
결과





