Task : 프로젝트 계획, 분석 방향 설정
[ 일정 ]
22, 23일 : 전처리 & EDA (두가지를 딱 잘라서 어느걸 먼저라고 정하기 어렵다고 생각해서 묶었어요)
상황에따라서 24일까지로 연장될 수 있음.
24일 : 모델링 시작. 여러가지 방법으로 테스트.
26일 : 하이퍼파라미터 조정, 지표 확인.
29, 30일 : 발표자료 준비
[분석 주제]
대출 신청 시기와 과거 금융이력, 대출 목적이 채무 상환 여부와 관련이 있는가
구예진
이하진
이원혁
안영준
[튜터링]
소현 튜터님 아이디어:
다음달에 못 갚을 거 같은 고객 위험도 점수 산출해서 담당자에게 메일보내기
실행 및 진행 사항 정리
# issue_d : 대출개시일
# 'earliest_cr_line': '최초신용거래일'
# 'sec_app_earliest_cr_line': '공동신청자최초신용거래일'
df2=df.copy()
# 대출개시일 (문자열) → 대출개시일 (datetime)
# 결측치는 nan -> NaT 로 변환됨.
df2['대출개시일'] = pd.to_datetime(df2['대출개시일'], format='%b-%Y')
print(f"{df2['대출개시일'].iloc[0]} → {df2['대출개시일'].iloc[0]}")
# 대출개시일 (datetime) 에서 연, 월, 분기 추출해서 별도 컬럼에 할당
df2['대출개시_연'] = df2['대출개시일'].dt.year
df2['대출개시_월'] = df2['대출개시일'].dt.month
df2['대출개시_분기'] = df2['대출개시일'].dt.quarter
print(f"issue date : {df2['대출개시일'].iloc[0]} → "
f"Year={df2['대출개시_연'].iloc[0]}, "
f"Month={df2['대출개시_월'].iloc[0]}, "
f"Quarter={df2['대출개시_분기'].iloc[0]}")
df2['최초신용거래일'] = pd.to_datetime(df2['최초신용거래일'], format="%b-%Y")
print(f"{df2['최초신용거래일'].iloc[0]} → {df2['최초신용거래일'].iloc[0]}")
df2['최초신용거래일_연'] = df2['최초신용거래일'].dt.year
df2['최초신용거래일_월'] = df2['최초신용거래일'].dt.month
df2['최초신용거래일_분기'] = df2['최초신용거래일'].dt.quarter
print(f"earliest_cr_line_date : {df2['최초신용거래일'].iloc[0]} → "
f"Year={df2['최초신용거래일_연'].iloc[0]}, "
f"Month={df2['최초신용거래일_월'].iloc[0]}, "
f"Quarter={df2['최초신용거래일_분기'].iloc[0]}")
df2['공동신청자최초신용거래일'] = pd.to_datetime(df2['공동신청자최초신용거래일'], format="%b-%Y")
print(f"{df2['공동신청자최초신용거래일'].iloc[0]} → {df2['공동신청자최초신용거래일'].iloc[0]}")
df2['공동신청자최초신용거래일_연'] = df2['공동신청자최초신용거래일'].dt.year
df2['공동신청자최초신용거래일_월'] = df2['공동신청자최초신용거래일'].dt.month
df2['공동신청자최초신용거래일_분기'] = df2['공동신청자최초신용거래일'].dt.quarter
print(f"sec_app_earliest_cr_line_date : {df2['공동신청자최초신용거래일'].iloc[0]} → "
f"Year={df2['공동신청자최초신용거래일_연'].iloc[0]}, "
f"Month={df2['공동신청자최초신용거래일_월'].iloc[0]}, "
f"Quarter={df2['공동신청자최초신용거래일_분기'].iloc[0]}")
Python
복사
•
dtype 숫자인데 날짜 정보인 컬럼 혹시 있을수 있으니 찾아보기
•
mixed_type : verification_status_joint , sec_app_earliest_cr_line
◦
결측치 포함되어있어서 처리 필요
•
In grace period : 유예기간을 의미. 데이터에서 제외(Current 와 같은 맥락에서)
•
Does not meet the credit policy : 신용정책기준(FICO) 에 미달을 의미.
◦
2010년 경 내부 심사규정 변경 때문에
이전 심사기준에는 만족하지만 현행 심사기준에는 미달인 경우를 의미
◦
모델링에서는 제외
◦
일반적인 완전 상환 또는 채무불이행과는 다른 기준을 적용해볼까?
•
(FICO점수) 1인신청 2인신청 시 처리방법 (원혁님 방법)
결과
