////////
Search
Duplicate

결측치 및 이상치

Tags
Archive
ETA
Main Task
Sub Task
담당자
메모
상태
In progress
생성 일시
2025/06/16 11:02
우선 순위
진행률 %
Task : 결측치 및 이상치 확인 및 대체
실행 및 진행 사항 정리
1.
dropout_reason_detail 결측치 대체
NaN 값 → ‘해당없음’ 으로 대체
2.
birthday 결측치 대체
NaN값 → 10개 drop
3.
데이터 타입 변환 (quick_preview_used)
object → boolean(T/F)으로 변환
4.
데이터 타입 변환 (last_access_timestamp)
object → datetime으로 변환
5.
데이터 형식 통일 (gender)
male,female (소문자 형식으로 통일)
6.
데이터 형식 통일 (theme_mode)
light, dark, custom (세가지 모드로 통일)
가설에 따른 데이터 전처리
1.
연령 및 연령대 도출을 위한 birthday 데이터 타입 변환
datetime으로 변환
2.
100세 이상 이상치 삭제
'데이터프레임' = '데이터프레임'['데이터프레임'['age'] < 100]
Python
복사
결과