Task : [방향성설정] 튜터님께 드릴 질문 리스트및 피드백 정리(1차)
제목: 빌려줄 결심
부제목: LendingClub 대출 데이터 기반 부도 리스크 요인 분석 및 우량 고객 선별(가제)
스토리텔링(예시(안) -
추가)
▼ 발표자료는 이쪽으로~~ 리포트 형식 !!!!!
4조의 데이터 분석 목적:
① LendingClub 대출 데이터를 활용하여
② 차입자의 특성과 대출 구조가 실제 부도(연체) 발생에 어떤 영향을 미치는지 정량적으로 분석하고
③ 이를 바탕으로 부도 리스크를 낮추고 상환 가능성이 높은 우량 고객을 선별할 수 있는 기준을 도출
[문제정의 4가지 선정(팀 투표결과 14가지 문제 정의 중 4개 선정) -
추가]
① 대출 목적에 따른 상환률 차이
- LendingClub에 loan purpose 변수 존재
- 상환 상태(fully paid / default 등) 있음
- 분석 방식: 목적별 상환률 비교, 비율 비교, 카이제곱 검정 등
② 소득 대비 대출 비율이 높을수록 부도율이 높은가?
- 연소득, 대출금액 모두 존재
- 파생 변수 생성 가능 (대출금/소득, 월상환금/소득 등)
- 분석 방식: 구간화 후 부도율 비교, 로지스틱 회귀에서 계수 해석
- 질문핵심: 왜 부도가 나는가
③ 차입자의 어떤 특성이 부도 리스크를 가장 크게 높이는가?
-신용등급, 이자율, 소득, 근속연수 등 사용 예정?
-분석 방식(확정x 가정): 로지스틱 회귀, 변수 중요도 등 비교
④ 우량 고객 타겟팅(부도 리스크 분석)
인사이트 : 우량 고객은 어떤 공통점이 있는가?
-분석 방식:부도 확률 낮은 고객군 정의 → 조건 기반 세그먼트 도출
*우량고객에 대한 정의? → 딥하게 고민해봐야 하는 부분
대출액이 많은데 상환 중인 사람들은 포함 ? 미포함 ? > 지금 당장 정하는게 아니라 데이터 분석 한 다음에 확인 가능
부도 리스크가 낮고 상환 성공률이 높은 고객 군 > 조건? 변수간 상관관계? > 분석해봐야 함
상환 성공률 → 어떤 조건으로 봐야 할지
[질문지]
1.
킥오프로 발표 방향성을 위와 같이 정해보았는데 방향성 설정이 잘 됐는지(부족한 부분/보완점/피봇(해야하는지) 피드백 부탁드립니다)
•
사용가능한 변수들 더 많이 알아보기(현재 151개) 대출 상황 관련 어떠한 것들을 많이 보는지 논문 확인 필요
2.
핵심변수 설정 관련 : 차별성 있는 핵심변수 설정은 어떻게 하는지(방법) / 어디서 찾는지 / 혹시 힌트 주실 수 있으신지 / 로지스틱 회귀로 모델 만든 다음, 좋은 변수 찾고~
3.
금융 도메인 맞게 딱딱/근엄한 리포트 형식 발표자료 vs
가벼운 느낌으로 페르소나/스토리텔링 발표 자료(수강생 버전) 어떤걸 추천하시는지 가벼운 느낌은 x 포트폴리오로 쓸 것 // 업체 면접 볼 때 쓸 거기 때문에 전문가라는 관점으로 접근해보기
4.
금융 데이터를 분석한다면 이 부분은 더 생각해봐야 한다~ 조언/힌트 있으신지 → 지금 단계에서는 해볼 수 있는 거 많이 없어
일단 계획한 내용들 우선 해보기 // 151개 중 어떤 좋은 피처 뽑을 수 있는가가 관건
5.
‘우량고객’에 관한 정의를 직접 내려야 하는데 어떤 방식으로 접근하는게 좋을지 → 분석하면서 잡아가야 함
*우량고객에 대한 정의?
대출액이 많은데 상환 중인 사람들은 포함 ? 미포함 ?
부도 리스크(도메인 직접 찾아봐야 함)가 낮고 상환 성공률이 높은 고객 군 구하는 조건?
’상환 성공률’ → 어떤 조건을 메인으로 잡고 봐야 할지
케이스가 다양,,, 명확하게 체계화해서 구분 필요해
다양한 케이스를 직접 뽑아봐야 하는데
[튜터님 피드백 정리]
실행 및 진행 사항 정리
결과
