공유 사항
•
기획을 하고 전처리가 완료되는 시점은 23일까지 권장
•
결측치와 이상치 등 전처리 방식을 팀원과 완전하게 통일 필요
•
24~29일 까지 머신 러닝 + 인사이트 도출 권장
•
31일 발표
•
머신 러닝을 시작하기 전에 어째서 이 머신 러닝을 택했는지 등등의 과정의 타당한 이유를 가지는 것이 필요 - 중요!
•
예쁘게 PPT 를 만드는 것 보다도 잘 정리된 대시보드를 보여주는 것이 좋은 발표 (단, 대시보드는 시간이 남는다면 시도할 것)
•
기획은 러프하게 진행
•
내가 궁금한 것, 팀원과 궁금한 것을 조사해보며 가지를 잡아가는 과정이 필요
→ 스토리텔링이 되기 위해서 필요한 과정
•
이 고객은 이러한 구매 패턴을 가지고 있고, 이러한 경우에 더 좋은 고객이 되는 패턴을 발견했다. 그렇기에 이 방법을 적용하면 좋을 것 같다.
•
프로젝트가 끝난 시점엔 모두가 완성된 코드를 가지고 있어야 함.
→ 모두의 코드를 학습해서 나의 것으로 만들어야 할 필요가 있음!
스탠다드반 ML·EDA 일정·가이드
프로젝트 일정 및 단계별 가이드
데이터 선택 및 기획 단계 (12월 18일까지)
•
오늘까지 데이터 선택 완료 필수
•
기획은 러프하게 진행하되, 큰 주제(마케팅 전략 수립 등) 설정 후 세부 영역(고객, 매출, 상품)으로 분할
•
팀원별로 담당 영역을 나누어 각자의 궁금점과 분석 포인트 발굴
EDA 및 전처리 단계 (12월 18일-24일)
•
12월 23일-24일까지 EDA 완료 권장
•
전처리 방법론 사전 합의 필수: 이상치 처리(Z-score, IQR 등), 결측치 처리 방법을 팀 내 통일
•
데이터 분포 확인, 시각화를 통한 패턴 파악
•
개별 분석 후 팀원 간 연결고리 발견 및 스토리텔링 구상
머신러닝 및 인사이트 도출 (12월 24일-29일)
•
다양한 머신러닝 기법 적용 및 비교 분석
•
모델 선택 근거와 결과 해석에 중점
•
고객 분류/예측 결과를 바탕으로 실무 적용 가능한 인사이트 도출
•
코드는 이미 제공되어 실제 소요 시간은 단축 가능
결과 리포트 및 발표 준비 (12월 29일-31일 오전 10시)
•
발표 자료보다는 대시보드 제작 우선 권장
•
시각적 완성도보다 내용의 충실성에 집중
•
31일 오전 10시 최종 제출
핵심 프로젝트 수행 원칙
협업 및 코드 공유
•
프로젝트 종료 시점에 모든 팀원이 동일한 완성된 코드 보유 필수
•
개별 작업 결과물의 팀 내 공유를 통한 전체 역량 향상
•
면접 대비 차원에서 타인이 작성한 코드에 대한 이해도 확보
분석 접근 방법
•
단순 나열식 분석 지양: "고객은 이랬고, 매출은 이랬다" 방식 금지
•
연결고리 중심 분석: "고객이 이러한 특성을 보이며, 이러한 매출 패턴을 가지고, 특정 상품을 구매하므로, 이런 마케팅 전략이 효과적이다" 형태
•
외부 데이터 활용 가능: DMC 리포트 등을 통한 마케팅 트렌드 조사
중요도 배분 및 평가 기준
•
EDA 및 전처리: 30%
•
머신러닝: 30%
•
분석 기획 및 스토리텔링: 40%
시각화의 미적 완성도나 발표 자료의 디자인은 평가 대상이 아니며, 내용의 논리성과 실무 적용 가능성에 중점을 둔다.
튜터 지원 체계
정기 팀 방문을 통한 진도 점검 및 질의응답 진행 예정이며, 팀별 상황에 따른 일정 조율 가능하다. 긴급 이슈 발생 시 즉시 상담 가능하며, 일반적인 질문은 팀 노션에 정리하여 면담 시간에 일괄 답변 제공
이번 프로젝트의 핵심은 머신러닝 결과와 분석 결과의 연결을 통한 실무형 인사이트 도출이며, 단순한 기술 적용을 넘어선 비즈니스 가치 창출에 중점을 둔 학습 경험을 제공
강선우 - PPT
김효진 - PM
김우주 - 발표
권유석 - 녹화
이기창 - 대시보드
