1. 프로젝트 정보
프로젝트 주제 기재
목적과 목표 설정 기재
2. 프로젝트 결과물
PPT 자료
3. 팀 정보
팀 원 소개
4. 영상 자료
발표 영상
5. 서면 피드백
메인 튜터
데이터 전처리
•
고객 데이터의 fasion_news_frequency 결측값을 “Unknown”으로 통일하고, 상품 데이터의 detail_desc는 분석 목적상 불필요하여 제거하는 등 결측치 처리 기준이 명확했습니다.
•
고객 ID, 상품 ID를 중심으로 trasaction 데이터를 병합해 하나의 단일 분석용 데이터셋을 만든 과정이 매우 안정적이었습니다.
•
단순하게 이상치 제거가 아니라, 원 데이터의 heavy-tail 구조, log 변환 후 분포 개선 여부, z-score / IQR 비교 등 가격(price) 컬럼 이상치 처리 의사결정이 탁월했습니다.
•
병합 시 inner join 선택 이유를 간단히 명시하면 더 완성도 높은 전처리 근거가 되었을 것 같습니다.
EDA
•
연령대별 총매출, 평균매출 비교 구조가 매우 명확했습니다.
•
회원상태(Active/Pre-active) 기반 비즈니스 의미 해석이 우수했습니다.
•
재구매 주기 분석이 데이터 기반 전략 수립에 직결된 점이 좋았습니다.
•
상품군별 트렌드와 월매출 분석이 체계적이며 시각화가 잘 표현되었습니다.
•
연령대뿐 아니라 성별, 가격대, 상품군 선호 조합 등을 더 하면 고객 세그멘테이션의 깊이가 더 올라갈 것 같습니다.
인사이트
•
각 분석 파트마다 비즈니스 전략이 명확하게 연결되었습니다.
•
결론 파트에서 부서별 actionable plage을 제시한 점이 매우 우수합니다.
•
Cross-selling / Up-selling 연관 상품 분석이 추가되면 전략 적용 범위가 더 확장될 수 있을 것 같습니다.
2조는 기초 프로젝트임에도 매우 고도화된 비즈니스 분석 수준을 보여주었습니다. 고생 많았습니다!
서브 튜터
“가격의 분포가 원래 heavy-tail(긴 꼬리)을 가지는 산업이어서, 이상치로 판별하지 않고 넘어감”
이상치 처리를 배우게 되면 이상치 처리를 위한 이상치 처리를 하게 되는 경우가 많은데, 비즈니스에 대한 이해도를 기반으로 합리적인 의사결정을 한 부분이라 좋았습니다
그 밖에도 매출과 리텐션과 같이 실제 산업에서 중요하게 다룰만한 지표를 중심으로 데이터셋의 현황을 파악하고 EDA 를 진행한 부분에 있어서 좋은 비즈니스 관점을 가지고 의도에 적절한 데이터 분석을 수행하셨다고 보여집니다.
이번 기초 프로젝트 주차까지 배운 내용들을 잘 종합해서 기술적으로 활용하셨고, 기술을 비즈니스 맥락에 맞게 적절히, 의도에 맞게 선택, 적용, 활용하셨다고 보여집니다. 앞으로의 학습과 프로젝트가 기대되는 것 같습니다. 고생하셨습니다!
