•
데이터셋의 행 갯수가 어느 정도여야 적합한 데이터셋인지 궁금합니다.
⇒ 적절한게 얼마냐라는 것은 정해져 있지 않음.
⇒ 다다익선.
⇒ 확보한 데이터에서는 특별한 인사이트 도출이 힘들다면 추가 수집이 필요할 것으로 여겨짐.
⇒ 양보다는 어떤 데이터가 담겨져 있는지 세심한 분석이 필요할 것.
⇒ 인사이트의 효용가치에 따라 판단.
세희 질문
•
패스트푸드 성분이 나타나 있는 데이터셋을 분석하다 생긴 궁금증인데, 일단 버거와 other로 2그룹으로만 나눠서 비교하며 분석을 진행했습니다. 버거가 중점이라 일단 이렇게 했는데 버거와 치킨 이런식으로 세세하게 비교해 패스트푸드 성분을 제대로 분석하는게 좋은건지 아니면 이대로 마쳐도 괜찮은건지 궁금합니다!
⇒ 단순히 어떻게 나누는 것보다는 어떻게 활용할 것인지 중요
⇒ 활용 목적에 따라서 나누는게 중요하기 때문에 활용 목적을 명확히 설정하고 진행하면 좋을 것 같다.
•
저희가 조사하다가 최근 “헬스 페스트 푸드”라고 해서 샐러드, 포케와 같이 건강하지만 빠른 시간 내에 서비스 되는 음식이 떠오르고 있다는 사실을 알게 되었습니다.
이와 같이 “페스트 푸드”는 빠르게 서비스 되는 음식으로도 해석되고 조금은 불량한 음식인 인스턴트 푸드를 일컫기도 합니다.
데이터 셋에서 이 2가지 용어가 혼제되어서 나타난 경우가 있는데, 이런 경우 저희가 좀 더 중점으로 생각되는 페스트 푸드의 정의를 기준으로 진행해도 괜찮을 까요?
•
기존 고객 데이터를 분석하여 그걸 기준으로 새로운 고객 데이터를 설정할 텐데 고객 데이터 중 연령대, 성별에 대한 데이터를 구하기 힘든데, 이런 경우 데이터 기반이 아니라 브랜드의 아이덴티티 및 방향성을 바탕으로 임의로 설정해도 되나요?
•
보내주신 google sheet에서 실험 목표 파트에 있는 내용을 조금 이해하기 힘듭니다.
•
혹시, 예시를 들어주실 수 있나요?