//////
Search
Duplicate
📜

4조 최종 프로젝트 중간 보고서 확정안

[템플릿 활용 가이드]

이 템플릿은 프로젝트 진행 상황을 점검하고, 앞으로의 계획을 정리하기 위한 목적으로 작성되었습니다. 템플릿 내 예시는 단순 참고 용이며, 팀의 프로젝트 방향과 내용에 맞게 수정이 필요합니다.
활용 방법

프로젝트 개요

해결해야될 문제가 뭔가요?
데이터셋으로 세대별 여행 관력 동향 파악
선호 여행 일수 bar차트
시각화 자료: 성별/연령대 별 여행 시 선호도를 보여주는 Heatmap
연령대 별 선호 지역 bar차트
세대 별 여가 활동 목적

결론

전 세대 취향 인사이트
1박 2일/ 여행 시 식도락, 자연, 친족(친구), 휴식 선호/ 강원도 선호
이런 결과로 어떤 형태의 패키지를 생성해야 할지 정할 수 있었으나,
각 세대 별 특성을 찾기에는 위 데이터 만으로는 부족하여 아래와 같이 데이터셋(CSV)파일 제외 뉴스, 트렌드 동향 파악을 진행하였음.
데이터셋 이외의 뉴스 보도자료, SNS 등 트렌드 동향 파악
1.
MZ - 탐험 성향 강함, 밍글링 형태 선호, 평상시 하지 못했던 것 즐기고 싶어함
MZ세대 여행 취향 분석
유튜브 밍글링 워드클라우드
2.시니어 - 액티브/패시브로 나누고 액티비티함과 웰니스를 즐기는 시니어
시니어 세대 여행 취향 분석 - 액티브/시니어로 나누어 활동적이거나, 힐링을 원함
3. 이외에 국내는 즉흥이라는 매력이 있는것으로 파악

결론

▷ MZ : 짜릿함, 모험심, 에너지 소비 없는 타인나 다운 여행 원함
도출 키워드 : 밍글링 (타인과 여행 패키지로 묶여 친밀감을 쌓음), 추가 해야 됨
▷ 시니어 : 액티브, 패시브 시니어 ⇒ 젊음을 유지하는 사람과, 휴식을 즐기는 사람
도출 키워드 : 액티브 시니어, 패시브 시니어, 자연, 건강 회복, 심리적 안정, 휴식 중심, 문화 체험, 예술 감상

종합 인사이트 요약

전 세대 여행 패키지 방향 : 강원도, 식도락, 휴식, 단기
세대 별 여행 방향
MZ 세대(<50) :
>모험심, 액티비티 상품<
1)미션형 랜덤 밍글링 투어 : 자연속에서 팀단위로 다양한 미션을 수행하며 교류하는 액티비티 중심 투어
예시 : 보물찾기, 스탬프 투어, 사진 챌린지
2)DIY 밍글링 투어 : 현지에서만 할 수 있는 원데이 클래스에서 다양한 사람들과 소통하며 직접 무언가를 만드는 체험형 투어
예시 : 카이막, 베이킹, 인형, 드림캐쳐
3)펫 밍글링 투어 : 반려동물을 키우는 사람들이 함께모여 소통하는 반려인 중심의 교류형 투어
예시 : 애견동반식당/카페/야외공간
4)식도락 밍글링 투어 : 팀 단위로 지역 맛집을 탐방하며 즉석에서 맛과 감정을 공유하는 미식 중심 투어
예시 : 지역내 맛집 탐방, 맛집 미션 투어
시니어 세대(50<) :
시니어 세대 상품 구성중 고충
1.
너무 단조로움
2.
시니어에 대해 특성을 고려하고 상품을 짜도 휴식, 웰니스 이런게 mz상품처럼 다이내믹 하지않고, 온천, 휴식, 크루즈처럼 한정되있음
3.
굳이 시니어/엠지를 나눠야되나?
a.
ex)밍글링을 시니어세대끼리 같이하자
>휴식·Wellness·자연 중심의 상품<
1) 효도 관광 패키지
형태 : 1박 2일 또는 당일치기
특징 : 편안한 교통 수단 + 짧은 이동 동선 + 온천·웰빙 식사 중심
예시 코스 : 강릉 경포해변 산책 → 오죽헌 → 강릉 커피 거리 카페 휴식
2) 프리미엄 투어
형태 : 1박 2일
특징 : 고급 숙소 + 문화 예술 + 웰니스 프로그램을 올인원으로 제공
예시 코스 : 프리미엄 크루즈 숙박 → 공연 관람 → 건강 프로그램 체험
타겟 유저 별 메세지/소재 아이디어 도출 → 메세지/소재 설계안 초안 작성
보고서 및 발표 자료 : 분석 결과를 요약한 프레젠테이션 자료와 PDF 보고서
분석 대상 및 범위 : 25년도/24년도 CSV파일, 유튜브 데이터 크롤링
데이터 출처 : 문화 빅데이터 플랫폼
데이터셋(2025년도)
유튜브 크롤링
분석 목적 : 세대별 여행 트렌드를 분석하고 이에 맞는 국내 여행 패키지를 기획하기 위함.
프로젝트 이름 : 신규 여행사 브랜드 런칭 및 여행 광고 기획

데이터 개요 - 여행 시기 특성 CSV파일

PPT Page
7p : 여행 기간 분포
12p
13p
15p : 여행 선호도 TOP5
데이터셋
CI_TOUR_ERA_CHARTR_INFO_20250728.csv
72.7 KB
데이터셋 설명
온라인(PC모바일) 소비자 서베이 데이터(2015.8월부터 매주 수집)
여행 시기에 따른 여행 지역과 기간, 여행 목적, 여행 동행자 인원과 관계를 응답함
여행 동행자와 지역에 따라 어떤 여행을 하는지 파악할 수 있음
본 데이터 셋에는 응답자 특성(성별, 연령대, 거주 지역, 소득 수준 등)이 포함됨
데이터 수집 방법: 문화 빅데이터 플랫폼에서 다운로드
데이터셋의 크기: 319행, 20열
주요 변수 및 설명:
변수명
설명
데이터 타입
RESPOND_ID
응답자ID
VARCHAR
EXAMIN_BEGIN_DE
조사시작일자
VARCHAR
TOUR_CTPRVN_NM
여행시도명
VARCHAR
TOUR_SIGNGU_NM
여행시군구명
VARCHAR
TOUR_BEGIN_DE
여행시작일자
VARCHAR
TOUR_PD_VALUE
여행기간값
VARCHAR
TOUR_COM_NMPR_NM
여행동행자인원명
VARCHAR
COM_ONE_TY
동행자1유형
VARCHAR
COM_TWO_TY
동행자2유형
VARCHAR
COM_THREE_TY
동행자3유형
VARCHAR
COM_FOUR_TY
동행자4유형
VARCHAR
COM_FIVE_TY
동행자5유형
VARCHAR
COM_SIX_TY
동행자6유형
VARCHAR
TOUR_PURPS_NM
여행목적명
VARCHAR
SEXDSTN_FLAG_CD
성별구분코드
VARCHAR
AGRDE_FLAG_NM
연령대구분명
VARCHAR
MRRQ_AT_NM
결혼여부명
VARCHAR
CHLDRN_TY_NM
자녀유형명
VARCHAR
OCCP_NM
직업명
VARCHAR
HSHLD_INCOME_DGREE_NM
가구소득정도명
VARCHAR
데이터 전처리 과정
RESPOND_ID, EXAMIN_BEGIN_DE 컬럼 제거
df = df.drop(columns=["RESPOND_ID", "EXAMIN_BEGIN_DE"])
Python
복사
Index(['TOUR_CTPRVN_NM', 'TOUR_SIGNGU_NM', 'TOUR_BEGIN_DE', 'TOUR_PD_VALUE', 'TOUR_COM_NMPR_NM', 'COM_ONE_TY', 'COM_TWO_TY', 'COM_THREE_TY', 'COM_FOUR_TY', 'COM_FIVE_TY', 'COM_SIX_TY', 'TOUR_PURPS_NM', 'SEXDSTN_FLAG_CD', 'AGRDE_FLAG_NM', 'MRRG_AT_NM', 'CHLDRN_TY_NM', 'OCCP_NM', 'HSHLD_INCOME_DGREE_NM'], dtype='object')
Plain Text
복사
TOUR_BEGIN_DE → datetime 변환
df["TOUR_BEGIN_DE"] = pd.to_datetime(df["TOUR_BEGIN_DE"], errors="coerce")
Python
복사
TOUR_BEGIN_DE datetime64[ns]
Plain Text
복사
결측치 '응답 없음'으로 변환
df = df.fillna("응답 없음")
Python
복사
COM_ONE_TY 0 COM_TWO_TY 0 COM_THREE_TY 0 COM_FOUR_TY 0 COM_FIVE_TY 0 COM_SIX_TY 0
Plain Text
복사
MZ/시니어 그룹 파생 변수 생성
def group_age(age): if age in ["20대", "30대", "40대"]: return "MZ" elif age in ["50대", "60대 이상"]: return "시니어" else: return "응답 없음" df["AGE_GROUP"] = df["AGRDE_FLAG_NM"].apply(group_age)
Python
복사
여행 목적(TOUR_PURPS_NM): 긴 문자열 → 간단한 카테고리 명으로 치환
rename_map = { "자연 풍경 감상 (산/ 바다 등)" : "자연", "식도락 (지역 특색/제철 음식)" : "식도락", "친지/친구/친척 만나기" : "친지 방문", "역사-유적 감상 (유적지/ 박물관 등)" : "역사·유적", "문화-예술 즐기기 (미술관/ 공연 등)" : "문화·예술", "놀이/테마공원-온천 등 즐기기" : "놀이/온천", "취미-운동 활동 (등산/ 낚시/ 골프 등)" : "취미/운동", "도시 경관 감상 (건축물/ 거리 등)" : "도시경관", "축제-행사 참여" : "축제", "휴식" : "휴식", "쇼핑" : "쇼핑", "기타" : "기타" } pivot_age_renamed = pivot_age.rename(columns=rename_map)
Python
복사
TOUR_PURPS_NM 0 친지 방문 1 친지 방문 2 식도락 3 역사·유적 4 취미/운동 ... ... 314 식도락 315 문화·예술 316 자연 317 놀이/온천 318 휴식
Plain Text
복사

데이터 개요 - MZ세대 문화여가 활동 특징 CSV파일

PPT Page
26p : 20-40대 여가 활동 TOP 5
27p : 50-60 여가 활동 TOP 5
데이터셋
CI_MZ_GNETN_INTRST_CLTUR_LSR_ACT_INFO_20250730.csv
156.1 KB
데이터셋 설명
온라인(PC모바일) 소비자 서베이 데이터(2021.11월부터 매주 수집)
2030세대의 관심 여가 활동에 대한 태도와 활동 전반에 대한 응답 내용
2030세대의 주 여가 시간 활용 목적의 1~2순위, 일 평균 여가 활동 시간, 주로 여가 시간을 보내는 방법의 비율, 관심 여가 활동 1~5순위 값을 포함함.
본 데이터 셋에는 응답자 특성(성별, 연령대, 거주 지역, 소득 수준 등)이 포함됨.
여가 활동 Top 5 집계,
데이터 수집 방법: 문화 빅데이터 플랫폼
데이터셋의 크기: 527행, 20열
주요 변수 및 설명
변수명
설명
데이터 타입
RESPOND_ID
응답자ID
VARCHAR
EXAMIN_BEGIN_DE
조사시작일자
VARCHAR
SEXDSTN_FLAG_CD
성별구분코드
VARCHAR
AGRDE_FLAG_NM
연령대구분명
VARCHAR
ANSWRR_OC_AREA_NM
답변자거주지역명
VARCHAR
HSHLD_INCOME_DGREE_NM
가구소득정도명
VARCHAR
LSR_TIME_USE_PURPS_RN1_VALUE
레저시간사용목적1순위값
VARCHAR
LSR_TIME_USE_PURPS_RN2_VALUE
레저시간사용목적2순위값
VARCHAR
WORKDAY_DAY_AVRG_LSR_TIME_VALUE
평일일평균레저시간값
VARCHAR
WKEND_DAY_AVRG_LSR_TIME_VALUE
주말일평균레저시간값
VARCHAR
LSR_TIME_REST_RCRT_USE_RATE
레저시간휴식오락사용비율
DECIMAL
LSR_TIME_HOBBY_USE_RATE
레저시간취미사용비율
DECIMAL
LSR_TIME_SELF_IMPT_USE_RATE
레저시간본인계발사용비율
DECIMAL
LSR_TIME_TWDPSN_RLTN_FLWSP_USE_RATE
레저시간대인관계교제사용비율
DECIMAL
LSR_TIME_ETC_USE_RATE
레저시간기타사용비율
DECIMAL
INTRST_LSR_ACT_RN1_VALUE
관심레저활동1순위값
VARCHAR
INTRST_LSR_ACT_RN2_VALUE
관심레저활동2순위값
VARCHAR
INTRST_LSR_ACT_RN3_VALUE
관심레저활동3순위값
VARCHAR
INTRST_LSR_ACT_RN4_VALUE
관심레저활동4순위값
VARCHAR
INTRST_LSR_ACT_RN5_VALUE
관심레저활동5순위값
VARCHAR
데이터 전처리 과정
결측치 처리 방법(컬럼별 결측치 없었음)
# 컬럼별 결측치 개수 확인 missing_counts = df.isnull().sum() print("===== 각 컬럼별 결측치 개수 =====") print(missing_counts)
Python
복사
연령대구분명(AGRDE_FLAG_NM) → MZ/시니어 그룹 파생 변수(AGE_GROUP) 생성
def categorize_age(age_str): if age_str in ['20대', '30대', '40대']: return 'MZ' elif age_str in ['50대', '60대']: return 'Senior' else: return 'Other' df['AGE_GROUP'] = df['AGRDE_FLAG_NM'].apply(categorize_age) # 그룹별 인원 수 확인 df['AGE_GROUP'].value_counts()
Python
복사

탐색적 데이터 분석(EDA)

전처리 과정 끝난 CSV 파일, 코랩 링크
processed_travel_data.csv
85.7 KB
1.
기술 통계 분석
주요 변수의 분포(예: 월평균 요금의 평균: 50, 표준편차: 10)
평균, 중앙값, 표준편차 등 기초 통계량
여행 시기 특성
MZ세대 문화여가 활동 특징
2.
데이터 시각화
(예: 상관관계 분석: Heatmap을 통해 주요 변수 간 상관관계 파악)
(예: 변수 간 관계: Scatter plot, Box plot 활용)
(예: 범주형 변수의 빈도 분석: Bar chart로 이탈 여부 시각화)
여행 시기 특성
MZ세대 문화여가 활동 특징
3.
패턴 및 트렌드
1) MZ세대 (20~40대)
근거자료
튜터님한테 질문사항- 아래 여가활동 관련 인사이트중 mz의 선호패턴을 여행에 어떻게 녹일지는 모르겠습니다. 근거자료와 같이 여행을 선택할때 SNS또는 인플루언서를 통해한다는 점과 엮을 수 있을지,, 어쨌든 남겨놓았고 시니어는 국내여행이 선호여가활동에 해당이되어 남겨놓았습니다.
여가 활동
영상 콘텐츠 시청이 압도적(20대 36%, 30대 34%, 40대 44%) → 디지털 소비 중심의 여가 패턴
게임·낮잠·만화책 보기 등 집·개인 중심 활동이 상위권
30대 이후에는 국내 여행·맛집 탐방·산책이 조금씩 늘어나며 경험형 여가 활동으로 확장
여행 지역
강원도가 압도적 1위, 제주·서울·경북·경기 순 → 접근성과 콘텐츠 다양성이 강점
여행 기간
1박 2일(최다), 2박 3일(다음), 3박 이상은 적음 → 짧고 빠른 체류 패턴
여행 목적
휴식이 특히 40대에서 두드러짐(34%) → 일·가정 부담에 따른 워라밸 회복 니즈
자연·식도락은 20~30대에서도 꾸준히 인기
친지 방문도 14~17%로 유지 → 관계 중심 동기 존재
축제·취미 활동은 일부 20~30대에서만 나타남 → 체험·이벤트 성향 반영
→ 분산형 패턴: 여가·여행 모두에서 다양한 선택지가 공존 (집·디지털 → 체험·휴식까지 확장)
2) 시니어 세대 (50대 이상)
여가 활동
50대: 산책·걷기(44%), 국내여행(32%), 영상 시청(37%) → 활동+소비형 균형
60대 이상: 걷기·속보·조깅(35%), 산책(36%), 종교활동(18%) → 건강·사회적 네트워크 중심
여행 지역
강원도 1위는 동일. 그 외 제주·서울·경북·경기 → 안정적 인기 지역 선호
여행 기간
1~2박 중심은 MZ와 유사하나, 3박 이상 체류 비중이 조금 더 있음 → 여유 있는 체류 성향
여행 목적
자연 감상이 압도적(50대 33%, 60대 이상 39%) → 자연 중심 힐링이 최우선
식도락(15~16%)이 두 번째 축
휴식은 12~13%로 MZ보다 낮음 → 휴식보다 활동적 감상형 여행
축제·취미는 비중이 거의 없음
→ 집중형 패턴: 자연·식도락 등 몇 가지 핵심 목적에 몰림
4.
주요 인사이트 도출
세대별 여행·여가 목적의 집중도 차이
MZ: 분산형 (축제·체험 + 휴식·자연)
시니어: 집중형 (자연·식도락, 걷기·건강 중심)
→ 마케팅 메시지 차별화 필요
휴식 vs 활동 대비
20~30대는 자연·식도락 + 축제/취미 활동도 일정 비중
체험형, 짧고 굵은 활동과 결합된 여행 선호
40대에서 ‘휴식’ 비율이 34%로 최우선
일·가정 부담 → 번아웃 회복형 힐링 패키지 니즈
시니어는 자연 감상이 압도적 (50대 33%, 60대 이상 39%)
걷기·건강 관련 여가(산책, 속보, 조깅 등)가 핵심 → 여행에서도 자연·건강·풍경 특화형 상품 선호
휴식보다는 활동적 힐링(자연 속 걷기, 풍경 감상)을 통해 만족감 추구
관계 유지 목적(친지·지인 방문)
전 세대 공통 존재 → “가족·지인과 함께하는 여행” 메시지는 전 연령대에 유효
차별적 상품 전략
MZ 타깃: 단기·체험형 패키지 (축제·취미·휴식·도시경관)
→ “짧고 굵게 즐기고 힐링하는 여행” 브랜딩
시니어 타깃: 장기·안정형 패키지 (자연·식도락·걷기)
→ “편안히 즐기며 맛보고 쉬는 여행” 브랜딩
결론: p-value=0.004 → MZ세대와 시니어 세대 간 여행 목적 분포가 통계적으로 유의미하게 다름
따라서, 상품 기획·마케팅에서 반드시 세대별 맞춤형 전략이 필요함

현재까지의 진행 상황

진행한 작업
데이터 전처리: 결측치 제거, 이상치 처리 완료
주요 변수의 기술 통계 및 시각화 완료
타켓 별 주요 소구점 및 메세지 발굴 완료
해결된 문제
데이터셋 수집과정에서 난항이 있었으나, 이후 적절한 여행·관광 데이터 확보
결측치가 많은 변수를 다루기 위한 전략 수립 및 적용
진행 중 문제
(예: 데이터 부족으로 인한 추가 수집 필요)
(예: 특정 변수의 패턴 해석 어려움)

다음 단계 계획

추가로 분석할 내용
기획안 마무리 및 소재 제작
소재 기반 광고 집행
광고 성과 기반 보고서 작성
예상 일정
(예: 1월 21일까지 심층 분석 완료)
(예: 최종 보고서 작성: 2월 5일 완료 예정)

부록

사용된 툴 및 라이브러리
Python(pandas, matplotlib, seaborn 등)
참고 자료 및 출처
(예: 전체 데이터 형태, 데이터 출처 URL, 참고한 연구 논문 등)
기타 시각화 자료
(예: EDA 과정에서 생성된 기타 시각화 자료 첨부)

튜터 피드백 정리

피드백 내용
1. 세대별 상품 기획 방식
질문(팀): MZ와 시니어를 나눠 기획하는 대신, 세대별 공통점(예: 강원도·1박2일 선호)을 기반으로 통합 상품을 기획해도 될까요?
답변(튜터):
공통점이 있다면 통합 진행 가능.
다만 MZ 세대(20~40대)는 내부에서도 세부 차이가 크므로 단순 묶음에 주의 필요.
가능하다면 Z세대(20대)만 집중하는 것도 방법.
2. 시니어 광고 집행 방법
질문(팀): 시니어층 타겟 광고 시 메타 광고를 쓰면 실제 노출은 자녀 세대에게 갈 가능성이 있음. 카카오스토리·네이버 밴드 광고도 가능한가요?
답변(튜터):
네이버 밴드, 카카오스토리 모두 디스플레이 광고 지면으로 가능.
단가가 다소 비쌈.
유튜브·인스타도 시니어 이용률 높음 -> 충분히 활용 가능.
당근마켓 광고도 대안이 될 수 있음.
3. 국내 여행 패키지 설정 근거
질문(팀): 국내 여행 중심, 패키지 상품 기획이 타당한지? PDF 보고서(관광 데이터랩) 활용 가능할까?
답변(튜터 & 멘토):
정제된 PDF 보고서만으로는 근거 부족.
반드시 로우데이터를 직접 가공·분석해 연결고리를 보여야 설득력 생김.
PDF는 가설 보강 자료로 참고 가능하나, 공공기관 데이터 위주 활용 권장.
패키지 상품이 왜 필요한지, 사람들이 실제 국내 패키지를 얼마나 선호하는지 데이터 근거 확보 필요.
4. 프로젝트 목표 정립
질문(튜터): 프로젝트 목표가 불명확함. 현재는 “내수시장 활성화” -> 추상적임. 실제 목표는 무엇인가?
답변(팀): “여행 이커머스 데이터를 분석해 소비자 유형별 맞춤 패키지 & 광고 전략 제안”이 목표.
튜터 피드백:
최종 목표는 무엇인지 봐야 함.
현재 제시된 “국내 여행 활성화”는 여행사 비즈니스 목적과 직접 연결이 약함.
데이터 분석–상품 기획–매출 증가까지 자연스럽게 이어지도록 보완 필요.
5. 패키지 상품 정의
질문(팀): 우리가 말하는 ‘패키지’는 해외 단체여행 형태가 아니라, 추천 루트를 짜주는 ‘코스 안내형 패키지’. 이런 정의도 괜찮을까?
답변(튜터):
가능하나 패키지 개념을 명확하게 정의해야 함.
현재 기록만 보면 ‘단체 패키지’로 오해될 수 있음 -> 보고서/발표에서 분명히 설명 필요.
6. 여가 활동 데이터 활용
질문(팀): 세대별 특징을 파악하려고 여가 활동 데이터를 넣었는데 활용해도 될까요?
답변(튜터):
가능하나, 여가 활동의 비중이 영상 시청 등 개인 활동 위주라 패키지 여행과 연결성이 낮아 보임.
맛집 탐방, 산책 등 여행과 결합 가능한 활동 중심으로 세부 분석 권장.
연령별 차이를 구분해서 보면 더 인사이트가 생길 것.
정리하면,
목표 명확화: “국내 여행 활성화” -> “맞춤형 여행 패키지 판매 증대”로 구체화 필요.
데이터 보강: PDF·보고서만 의존하지 말고 로우데이터 분석 필수.
세대 구분: MZ 전체보다는 세분화(Z세대 집중 등) 검토.
광고 매체: 네이버 밴드·카카오스토리 가능, 유튜브·인스타·당근도 대안.
패키지 정의: ‘단체 패키지’와 차별화된 ‘추천 루트형 패키지’로 명확히 규정 필요.
여가 데이터: 여행과 연결 가능한 활동(맛집, 산책 등) 중심으로 활용.
반영할 내용 및 변경 사항
전체 기획 내용 재점검 필요.
추가 근거 자료 데이터 필요.
남은 과제 및 추가 계획
피드백 기반 수정 및 보완
광고 소재 기획 및 광고 집행
광고 성과 데이터 분석 및 최종 보고서 작성