////////
Search
Duplicate
🐻

데이터 전처리(3) - 연령대에 따른 완독률

Tags
Archive
ETA
2025/06/13
Main Task
Sub Task
담당자
메모
상태
In progress
생성 일시
2025/06/16 11:02
우선 순위
진행률 %
Task : 연령대에 따른 유의미한 데이터 도출하기
1.
결측치 및 이상치 확인 후 대체하기
2.
가설 입증을 위한 컬럼 생성
3.
연령대별 유의미한 차이점 도출하기
실행 및 진행 사항 정리
1.
연령대별 평균 독서 중단 위치
60대 (53.4) → 40대 (51.2) → 30대 (50.9) → 50대 (50.7) → 20대 (50.3) → 10대 (47.9)
###피드백 전체적으로 잘 진행하고 있습니다. 1. dropout_reason_detail 의 결측치 값들을 제거하기 보다 "해당없음" 과 같이 대체하면 통계 결과가 더 명확해 질 수 있을거 같습니다. 2. 연령대별 비교 등 집단 간 차이는 본격적 시각화 단계 이전에도 바차트, 히트맵, 박스플롯 등 시각화 추가로 설득력 강화 가능
JavaScript
복사
결과