Task :
일정 분배
예)
•
12/18 (목)- 프로젝트 킥오프
•
12/19 (금)- 비니지스 문제 설정 및 계획
•
12/20~ 12/21 (주말)
•
12/22 (월)-전처리 및 EDA (z-score, IQR 등 합의)
•
12123 (화) - 중간 점검 및 통계 분석: 기획 및 전처리 완료
•
12/24 (수)- 머신러닝 준비 및 모델링 시작
•
12/25 (목-크리스마스)- 머신러닝 심화 및 최적화
•
12/26 (금) - 분석 마무리
•
12/29 (월) - 콘텐츠 정리 및 PPT 제작
•
12/30 (화) - PPT완성 및 발표 영상 제작
•
12/31(수) - 제출 &발표
중요도
•
전처리 30%
•
머신러닝 30%
•
스토리텔링(기획,해석등) 40%
세부 내용
1. 프로젝트 전체 흐름
1.
데이터 선택
2.
EDA 및 전처리
•
이상치 처리
•
결측치 처리
•
시각화를 통한 데이터 분포 확인
3.
머신러닝 적용
4.
모델 선택
•
성능, 해석 가능성, 문제 적합성 기준
•
선택 이유 명확히 설명
5.
고객 분류 또는 예측
6.
결과 해석
7.
인사이트 도출 및 발전 방향 제시
8.
보고 및 결과 공유
2. 머신러닝 활용 방향
•
여러 머신러닝 기법을 우선적으로 시도
◦
약 5~6개 모델을 다양하게 실험
•
실험 이후, 최종적으로 1~2개 모델 선정
•
단순한 성능 비교가 아니라
◦
왜 이 모델을 선택했는지
◦
다른 모델은 왜 제외했는지
를 설명하는 것이 중요
•
머신러닝은 목적이 아니라,
인사이트 도출을 위한 도구로 사용
3. 결과 스토리 구성 방향
분석 결과는 아래 흐름을 기준으로 정리한다. (예시)
•
고객은 특정 기준에 따라 분류되었다
•
각 고객군은 서로 다른 패턴을 보인다
•
고객군별 행동 또는 소비 특성이 확인된다
•
이를 바탕으로 다음과 같은 전략을 제안할 수 있다
◦
특정 고객군 대상 푸시 전략
◦
맞춤형 이벤트 또는 캠페인
◦
추가 실험 또는 분석의 발전 가능성 제시
4. 시각화 및 결과물 방향
•
디자인 완성도는 평가 대상이 아님
•
캔바로 여러 장의 슬라이드를 꾸미는 데에 많은 시간을 쓰는 것보다
핵심 내용을 담은 대시보드 1장을 지향
•
시각화 자체보다
지표 선택 이유와 해석이 중요
5. 머신러닝 모델 개수 가이드
•
실험용 모델: 5~6개
•
최종 설명 및 발표용 모델: 1~2개
•
중요한 것은 모델 수가 아니라
모델 선택에 대한 논리와 사고 과정
결과
