Task : 연령대에 따른 유의미한 데이터 도출하기
1.
결측치 및 이상치 확인 후 대체하기
2.
가설 입증을 위한 컬럼 생성
3.
연령대별 유의미한 차이점 도출하기
실행 및 진행 사항 정리
1.
연령대별 평균 독서 중단 위치
60대 (53.4) → 40대 (51.2) → 30대 (50.9) → 50대 (50.7) → 20대 (50.3) → 10대 (47.9)
###피드백
전체적으로 잘 진행하고 있습니다.
1. dropout_reason_detail 의 결측치 값들을 제거하기 보다
"해당없음" 과 같이 대체하면 통계 결과가 더 명확해 질 수 있을거 같습니다.
2. 연령대별 비교 등 집단 간 차이는 본격적 시각화 단계 이전에도
바차트, 히트맵, 박스플롯 등 시각화 추가로 설득력 강화 가능
JavaScript
복사
결과
