/////
Search

[전처리 및 EDA]

날짜
2025/12/20
Archive
Tags
ETA
2025/12/22
Main Task
Sub Task
담당자
메모
상태
In progress
생성 일시
2025/12/18 10:54
생성자
우선 순위
진행률 %
[전처리 및 EDA]
Task : 1. 테이블 전처리
orders -> 공통 geolocation -> 현지섭 review -> 채다윤 customer -> 심재호 item -> 최원의 payments -> 문인 sellers -> 송종옥
1.
리뷰 그룹 간 판매자 -구매자 거리 확인 (다윤)
2.
물건 값 대비 배송비 (배송비 부담되는 지역 식별) (원의)
3.
판매자/ 구매자 공간분포상황 - 지섭
4.
지역별 주문량확인 / 빈도 (지역을 세세하게) / 지역별 카테고리 확인 (송종옥)
5.
판매자 - 구매자 지역 조합별 배송지연 패턴 (어려움예상) 예) SP-MA (심재호)
6.
제품 무게별 배송지연상황(원의)
무게 구간 별 지연 비율
실행 및 진행 사항 정리

전처리(결측치,이상치,파생변수) 코드 정리 및 설명

olist_orders_dataset.csv (공통)
olist_order_items_dataset.csv (최원의)
olist_order_reviews_dataset.csv (채다윤)
olist_order_payments_dataset.csv (문 인)
olist_customers_dataset.csv (심재호)
olist_sellers_dataset.csv (송종옥)
olist_geolocation_dataset.csv (현지섭)
olist_products_dataset.csv (심재호/공통)
product_category_name_translation.csv(채다윤/공통)

EDA 결과

~점수와 ~거리의 평균 체크 (이름) (예시)
(state)별 물건 값 대비 배송비 비중 분석 (최원의)
거리와 타변수들과의 관계 분석 (심재호)
리뷰점수그룹간의 거리 차이 분석(채다윤)
현지섭
문인
송종옥
결과