////////
Search
Duplicate

구독 플랜 & 완독률

Tags
Archive
ETA
2025/06/17
Main Task
Sub Task
담당자
메모
상태
Done
생성 일시
2025/06/16 10:17
우선 순위
진행률 %
Task : 1
df1['new_exit_position_numeric'] = pd.cut( df1['exit_position_numeric'], bins=[0,5,35,90,100], labels=['극초반', '초반','중후반', '완독'] )
Python
복사
Task : 2
# birthday 컬럼 중 NaN 값 제거 df3 = df3.dropna(subset=["birthday"])
Python
복사
실행 및 진행 사항 정리
1. df1[df1.new_exit_position_numeric.isna( )] — exit_position_numeric == 0 일때 null 값 발생 —
Index
user_id
exit_position_numeric
new_exit_position_numeric
genre
80
user_0081
0
NaN
웹툰
258
user_0259
0
NaN
자기계발
275
user_0276
0
NaN
경제/시사
358
user_0359
0
NaN
자기계발
382
user_0383
0
NaN
웹툰
389
user_0390
0
NaN
자기계발
406
user_0407
0
NaN
웹툰
501
user_0502
0
NaN
웹툰
523
user_0524
0
NaN
자기계발
591
user_0592
0
NaN
소설
592
user_0593
0
NaN
소설
599
user_0600
0
NaN
웹툰
632
user_0633
0
NaN
경제/시사
893
user_0894
0
NaN
자기계발
df3[df3.new_age.isna()] — 10개의 NaN값 발생 —
Index
user_id
gender
birthday
birth_year
age
new_age
subscription_plan
62
user_0063
male
NaN
NaN
NaN
NaN
pay_per_book
363
user_0364
female
NaN
NaN
NaN
NaN
monthly
433
user_0434
male
NaN
NaN
NaN
NaN
free_trial
575
user_0576
male
NaN
NaN
NaN
NaN
pay_per_book
737
user_0738
female
NaN
NaN
NaN
NaN
monthly
754
user_0755
male
NaN
NaN
NaN
NaN
free_trial
757
user_0758
male
NaN
NaN
NaN
NaN
free_trial
835
user_0836
male
NaN
NaN
NaN
NaN
pay_per_book
941
user_0942
female
NaN
NaN
NaN
NaN
pay_per_book
942
user_0943
female
NaN
NaN
NaN
NaN
monthly
결과
0을 -1로 변경 후 null 0개
df1['new_exit_position_numeric'] = pd.cut( df1['exit_position_numeric'], bins=[-1,5,35,90,100], labels=['극초반', '초반','중후반', '완독'] )
Python
복사
결측치 제거
# birthday 컬럼 중 NaN 값 제거 df3= df3.dropna(subset=["birthday"])
Python
복사