결론
•
나트륨, 지방, 콜레스테롤을 핵심으로 저당에만 국한하지않고 데이터를 보기
리뷰데이터
•
•
⇒ 메뉴PART에 각 메뉴별로 일일권장량이 %로 표시되어 있음.
⇒ 항목에 리뷰 데이터도 있기 때문에 복합적으로도 바라볼 수 있을 듯.
고객 데이터
•
'Age', 'Gender', 'Marital Status', 'Occupation', 'Monthly Income',
'Educational Qualifications', 'Family size', 'latitude', 'longitude',
'Pin code', 'Output', 'Feedback'
•
•
•
•
++추가
판매데이터
1.
Order ID: A unique identifier for each sales order. This can be used to track individual transactions.
2.
Order Date: The date when the order was placed. This column is essential for time-series analysis, such as identifying sales trends over time or seasonality.
3.
Product: The name or type of the product sold. This column is crucial for analyzing sales performance by product category.
4.
Price : The unit price of the product. This, along with 'Quantity Ordered', is used to calculate the total price of each order.
5.
Quantity : The number of units of the product sold in a single order. This is a key metric for calculating revenue and understanding sales volume.
6.
Purchase Type : The order was made online or in-store or drive-thru.
7.
Payment Method : How the payment for the order was done.
8.
Manager : Name of the manager of the store.
9.
City : The location of the store. This can be used for geographical analysis of sales, such as identifying top-performing regions or optimizing logistics.
성분
•
음식 별 성분 정보
⇒ 햄버거와 일반음식의 성분 차이점에 대한 인사이트를 얻을 데이터셋
◦
식품코드, 식품명, 데이터구분코드, 데이터구분명, 식품기원코드, 식품기원명, 식품대분류코드, 식품대분류명, 대표식품코드, 대표식품명, 식품중분류코드, 식품중분류명, 식품소분류코드, 식품소분류명, 식품세분류코드, 식품세분류명, 영양성분함량기준량, 에너지(kcal), 수분(g), 단백질(g), 지방(g), 회분(g), 탄수화물(g), 당류(g), 식이섬유(g), 칼슘(mg), 철(mg), 인(mg), 칼륨(mg), 나트륨(mg), 비타민 A(μg RAE), 레티놀(μg), 베타카로틴(μg), 티아민(mg), 리보플라빈(mg), 니아신(mg), 비타민 C(mg), 비타민 D(μg), 콜레스테롤(mg), 포화지방산(g), 트랜스지방산(g), 출처코드, 출처명, 식품중량, 업체명, 데이터생성방법코드, 데이터생성방법명, 데이터생성일자, 데이터기준일자
식품 대분류 코드 (01) = 밥류
식품 대분류 코드 (02) = 식품 대분류명 (빵 및 과자류)
식품 대분류 코드 (03) = 식품 대분류명 (면 및 만두류)
식품 대분류 코드 (04) = 식품 대분류명 (죽 및 스프)
식품 대분류 코드 (05) = 식품 대분류명 (국 및 탕)
식품 대분류 코드 (06) = 식품 대분류명 (찌개 및 전골류)
•
⇒ 맥도날드 메뉴에 대한 칼로리와 구체적인 성분 데이터셋
◦
카테고리메뉴, 메뉴항목, 1회 제공량당 크기, 에너지(kCal), 단백질(g), 총 지방(g), 포화지방(g), 트랜스 지방(g), 콜레스테롤(mg), 총 탄수화물(g)
Menu Category | Menu Items | Per Serve Size | Energy (kCal) | Protein (g) | Total fat (g) | Sat Fat (g) | Trans fat (g) | Cholesterols (mg) | Total carbohydrate (g) | Total Sugars (g) | Added Sugars (g) | Sodium (mg) |
•
⇒ 맥도날드와 타 패스트푸드의 칼로리, 대략적인 성분 데이터셋
◦
식당,품목명,칼로리_지방, 총 지방, 포화지방, 트랜스 지방, 콜레스테롤, 나트륨. 총 탄수화물
restaurant | item | calories | cal_fat | total_fat | sat_fat | trans_fat | cholesterol | sodium | total_carb | fiber | sugar | protein | vit_a | vit_c | calcium | salad |
•
마케팅 방안 참고용
◦
분석할 데이터셋의 우선 순위를 정해서 선별
그 이후, 내용을 분석하다가 유의미한 인사이트가 도출되면 정리
그 다음 데이터셋 분석으로 넘어감.
각 항목별 분석할 사항
고객
•
◦
결과
▪
고객 연령 → 10대,20대
▪
구매횟수(빈도) → 월의 몇번 or 주에 몇번
▪
구매가격 ⇒ 승인님이 가져와주신 경기도 카드실적 내역
▪
성별 (코드 사용해서 랜덤으로 부여) ⇒ 일단 pass
성분
•
음식 별 성분 정보
◦
결과
▪
햄버거가 다른 종류의 음식 종류 데이터와 다른 점
•
칼로리,
•
◦
결과
▪
다른 패스트푸드와 비교
메뉴+별점리뷰
리뷰
•
◦
먼저 burger 파트 분석
•
◦
감성분석 (워드클라우드) - 긍정 / 부정 키워드 따로
•
◦
부정 키워드
추가로 볼 사항 (우리의 진행방향 및 목표)
