///////
Search
Duplicate
💾

데이터셋 분석

Tags
2주차
Archive
ETA
2025/08/26
Main Task
Sub Task
담당자
링크
메모
상태
Done
생성 일시
2025/08/26 00:00
생성자
우선 순위
진행률 %
결론
나트륨, 지방, 콜레스테롤을 핵심으로 저당에만 국한하지않고 데이터를 보기

리뷰데이터

link iconMcDonald's Store Reviews ⇒ 맥도날드 매장 리뷰
link iconMcDonalds Yelp! Reviews ⇒ 맥도날드 레스토랑에서 식사를 한 고객의 평점, 리뷰, 도시, 감정 등에 대한 내용.
⇒ 메뉴PART에 각 메뉴별로 일일권장량이 %로 표시되어 있음.
⇒ 항목에 리뷰 데이터도 있기 때문에 복합적으로도 바라볼 수 있을 듯.

고객 데이터

link iconOnline Food Dataset ⇒ 온라인 음식 주문 (성별, 나이, 직업, 주문 위치) 등 고객 정보 데이터 정립에 도움이 될 듯..
'Age', 'Gender', 'Marital Status', 'Occupation', 'Monthly Income', 'Educational Qualifications', 'Family size', 'latitude', 'longitude', 'Pin code', 'Output', 'Feedback'
link iconCustomer_Spending_Dataset ⇒ 991개 데이터
link iconCustomer Purchase Dataset ⇒ 구매금액, 구매빈도 1순위
link icon경기도_카드 소비 데이터_20250331 ⇒ 경기도 카드 소비 데이터 (슬랙 공유)
사람들이 가격 지불을 어디까지 할 수 있나.
PRICE 설정을 위한 데이터
++추가
판매데이터
1.
Order ID: A unique identifier for each sales order. This can be used to track individual transactions.
2.
Order Date: The date when the order was placed. This column is essential for time-series analysis, such as identifying sales trends over time or seasonality.
3.
Product: The name or type of the product sold. This column is crucial for analyzing sales performance by product category.
4.
Price : The unit price of the product. This, along with 'Quantity Ordered', is used to calculate the total price of each order.
5.
Quantity : The number of units of the product sold in a single order. This is a key metric for calculating revenue and understanding sales volume.
6.
Purchase Type : The order was made online or in-store or drive-thru.
7.
Payment Method : How the payment for the order was done.
8.
Manager : Name of the manager of the store.
9.
City : The location of the store. This can be used for geographical analysis of sales, such as identifying top-performing regions or optimizing logistics.

성분

음식 별 성분 정보
햄버거와 일반음식의 성분 차이점에 대한 인사이트를 얻을 데이터셋
식품코드, 식품명, 데이터구분코드, 데이터구분명, 식품기원코드, 식품기원명, 식품대분류코드, 식품대분류명, 대표식품코드, 대표식품명, 식품중분류코드, 식품중분류명, 식품소분류코드, 식품소분류명, 식품세분류코드, 식품세분류명, 영양성분함량기준량, 에너지(kcal), 수분(g), 단백질(g), 지방(g), 회분(g), 탄수화물(g), 당류(g), 식이섬유(g), 칼슘(mg), 철(mg), 인(mg), 칼륨(mg), 나트륨(mg), 비타민 A(μg RAE), 레티놀(μg), 베타카로틴(μg), 티아민(mg), 리보플라빈(mg), 니아신(mg), 비타민 C(mg), 비타민 D(μg), 콜레스테롤(mg), 포화지방산(g), 트랜스지방산(g), 출처코드, 출처명, 식품중량, 업체명, 데이터생성방법코드, 데이터생성방법명, 데이터생성일자, 데이터기준일자
식품 대분류 코드 (01) = 밥류
식품 대분류 코드 (02) = 식품 대분류명 (빵 및 과자류)
식품 대분류 코드 (03) = 식품 대분류명 (면 및 만두류)
식품 대분류 코드 (04) = 식품 대분류명 (죽 및 스프)
식품 대분류 코드 (05) = 식품 대분류명 (국 및 탕)
식품 대분류 코드 (06) = 식품 대분류명 (찌개 및 전골류)
link iconKaggleMcDonalds Menu EDA 🔥🔥🔥 → sugar 양 데이터에 나와있음
맥도날드 메뉴에 대한 칼로리와 구체적인 성분 데이터셋
카테고리메뉴, 메뉴항목, 1회 제공량당 크기, 에너지(kCal), 단백질(g), 총 지방(g), 포화지방(g), 트랜스 지방(g), 콜레스테롤(mg), 총 탄수화물(g)
Menu Category
Menu Items
Per Serve Size
Energy (kCal)
Protein (g)
Total fat (g)
Sat Fat (g)
Trans fat (g)
Cholesterols (mg)
Total carbohydrate (g)
Total Sugars (g)
Added Sugars (g)
Sodium (mg)
link iconFastfood Nutrition → 패스트 푸드 관련 정보가 성분이랑 함께 담긴 데이터 BUT, 당분 관련 내용은 X
맥도날드와 타 패스트푸드의 칼로리, 대략적인 성분 데이터셋
식당,품목명,칼로리_지방, 총 지방, 포화지방, 트랜스 지방, 콜레스테롤, 나트륨. 총 탄수화물
restaurant
item
calories
cal_fat
total_fat
sat_fat
trans_fat
cholesterol
sodium
total_carb
fiber
sugar
protein
vit_a
vit_c
calcium
salad
마케팅 방안 참고용
link iconFast Food Marketing Campaign A\B Test ⇒ 레스토랑 체인점이 신메뉴 출시 시 마케팅 진행을 어떻게 하면 좋을지에 대한 a/b test 내용이 담겨 있어서 마케팅 방안 설립 시 도움이 될 것 같음.
분석할 데이터셋의 우선 순위를 정해서 선별
그 이후, 내용을 분석하다가 유의미한 인사이트가 도출되면 정리
그 다음 데이터셋 분석으로 넘어감.

각 항목별 분석할 사항

고객

link iconCustomer Purchase Dataset ⇒ 구매금액, 구매빈도 1순위
결과
고객 연령 → 10대,20대
구매횟수(빈도) → 월의 몇번 or 주에 몇번
구매가격 ⇒ 승인님이 가져와주신 경기도 카드실적 내역
성별 (코드 사용해서 랜덤으로 부여) ⇒ 일단 pass

성분

음식 별 성분 정보
전국통합식품영양성분정보_음식_표준데이터.csv
4.4 MB
결과
햄버거가 다른 종류의 음식 종류 데이터와 다른 점
칼로리,
link iconFastfood Nutrition → 패스트 푸드 관련 정보가 성분이랑 함께 담긴 데이터 BUT, 당분 관련 내용은 X
결과
다른 패스트푸드와 비교

메뉴+별점리뷰

리뷰

먼저 burger 파트 분석
link iconMcDonald's Store Reviews ⇒ 맥도날드 매장 리뷰
감성분석 (워드클라우드) - 긍정 / 부정 키워드 따로
link iconMcDonalds Yelp! Reviews ⇒ 맥도날드 레스토랑에서 식사를 한 고객의 평점, 리뷰, 도시, 감정 등에 대한 내용.
부정 키워드
추가로 볼 사항 (우리의 진행방향 및 목표)