Search

[기초 프로젝트] 전처리 / EDA 각자 해보기

상태
완료
담당자
날짜
2025/11/20 19:00
주제
0
《김연준 튜터 님의 조언》
그래프 많이 그리기 → 그래프의 추세를 살피기
파생변수 생성 고려 가능
페르소나에 빙의 → 딥 다이브 (마치 회사 직원이 된 것처럼!)
《곽승예 튜터 님의 조언》
결론을 미리 정해두는 경우 → 결과가 완전히 다르게 나올 수도 있음
가설을 세우는 건 ok, 결론은 섣불리 no (가설 ≠ 결론)
걸음수 + 칼로리 + 운동량 → 체중이 얼마나 감소했는지
심박수 ~ 수면 시간
활동량, 걸음 수, 수면 품질(실제 수면 시간 / 침대 위 시간) ← 수면 품질 좋은 사람들의
활동량이 칼로리 소모량에 미치는 영향 분석 1.하루 총 걸음수,활동 거리,활동시간이 칼로리에 어떤영향을 미치는가
1.활동량에따라 수면의 질이 달라지는가 2.활동 시간때에 따라 운동효과가 있나 3.활동량에따라 수명이 늘어나는가 4.잠을 언제자야 건강해지는가 5.잠을 늦게자는거와 BMI지수와 상관관계가 있는지
김나희
김영호
이찬혁
정지연
조재민

데이터 정제

웨어러블 행동 데이터: 사용자 기준은 좀 널널하게 잡는다 ()
단기 데이터만 존재하는 두 명 제거해야 함
착용 안 한 사람들: 활동 x 칼로리 소모 o (기초대사량 추정)
→ 해당 아이디 걸음수 0 // 유저가 직접 집계한 거리 수 有
어떻게 할당 할 것 인가?
Id
ActivityDate
TotalSteps
TotalDistance
TrackerDistance
LoggedActivitiesDistance
2891001357
4/1/2016
0
0
0
4.828032017

분류 기준

변수들
활동 강도
걸음 수
활동 거리
활동 시간
소모 칼로리
앉아있는 상태
1)
통제: 걸음 수
독립: 활동 강도
종속: 칼로리 소모량
2)
앉아있는 시간 ~ 활동 강도
3)
수면의 질 ~ 운동 빈도가 높은 사람 / 낮음 사람 (기준: 주 n일 이상)
운동 강도
운동 시간 수
운동 거리
4)
활동 강도 기준 구분 (강/중/약) → 각 고객에게 맞게 적절한 퀘스트/일간,주간 목표 제시

목표

유저 패턴 나누기 → user segment