Task : 가설 설정하기
진행 과정
거짓일 경우
큐에르🩷
시혀느
영으느🩷
유지느🩷
이녕으🩷
결과
[1] 숙소 유형(Room Type) 관련 가설
•
가설 1. 우수 숙소는 ‘Entire home/apt’ 비율이 높다 (인영, 유지느, 큐에르)
◦
프라이버시 보장으로 만족도와 리뷰 수가 높을 가능성
◦
Shared room은 사생활·소음 문제로 평점이 낮을 수 있음
◦
→ 리뷰 수 상위 숙소와 하위 숙소의 room_type 비율 비교
◦
→ 외곽 비인기 숙소에 공유실이 많은지도 확인
•
가설 2. Entire home이 Private보다 가격과 이용률이 높다 (큐에르, 시현)
◦
룸 타입별 평균 가격, 월별 리뷰 수 비교
◦
도심과 외곽 지역별로 선호 room_type이 다른지도 확인
[2] 최소 숙박일(Minimum Nights) 관련 가설
•
가설 3. 우수 숙소일수록 minimum_nights가 짧다 (인영, 큐에르, 시현)
◦
짧은 숙박일 → 더 많은 고객 경험 → 리뷰 ↑
◦
리뷰 수 많은 숙소의 평균 minimum_nights 확인
◦
외곽 숙소에서 minimum_nights가 긴 경우 수요 유입에 장애일 수 있음
•
가설 4. minimum_nights가 길수록 방문 수가 줄어든다 (큐에르)
◦
상위/하위 minimum_nights 숙소군 나눠 리뷰 수 비교
[3] 지역(Location: 도심 vs 외곽) 관련 가설
•
가설 5. 도심 숙소는 가격이 높고 리뷰도 많다 (시현, 유지느, 영은)
◦
위도/경도로 도심·외곽 나눈 뒤 → 지역별 가격/리뷰 수 비교
◦
지역별 숙소 밀집도와 만족도 연결
•
가설 6. 외곽 지역일수록 리뷰 수가 적다 (영은)
◦
→ 외곽 숙소의 마케팅 약점 파악에 유용
•
가설 7. 도심은 Entire, 외곽은 Private 선호 비중이 다르다 (영은)
◦
→ 지역과 숙소 유형 간 선호 교차분석
[4] 가격(Price) 관련 가설
•
가설 8. 우수 숙소는 중간 가격대(가성비) 숙소다 (인영, 큐에르, 영은)
◦
너무 싸거나 비싼 숙소는 오히려 리뷰 적음
◦
가격대 구간별 리뷰 수 평균 비교
•
가설 9. Private은 저가, Entire는 고가일수록 리뷰가 많다 (영은)
◦
room_type별 가격대 & 리뷰 수의 상관관계 분석
[5] 리뷰/예약(Review & Availability) 관련 가설
•
가설 10. 예약 가능한 일수(availability_365)가 많을수록 리뷰 수 ↑ (인영, 시현)
◦
예약 가능한 날짜 = 리뷰 받을 기회가 많음 → 간접적 운영의지 지표
•
가설 11. 예약 가능한 일수가 적고 리뷰가 많은 숙소는 만족도가 높을 수 있다 (시현)
◦
반대로 예약일이 적은데도 리뷰 많은 숙소 = 진성 고객 인기 숙소?
[6] 호스트 관련 가설
•
가설 12. 호스트가 보유한 숙소 수 ↑ → 리뷰 수 ↑ (큐에르, 시현, 영은)
◦
host_id 기준 그룹핑 → 숙소 수와 리뷰 수 비교
•
가설 13. 전문 호스트(숙소 수 많음)는 도심에 몰려 있다 (영은)
◦
숙소 수 10개 이상인 호스트 → 도심 vs 외곽 비율
•
가설 14. 숙소 수가 많을수록 숙소당 리뷰 수는 적다 (영은)
◦
→ 전문업자라고 해서 품질이 우수한 것은 아님!
1. 공통된 가설 요약: 팀 전체가 동의한 핵심 패턴
방타입은 숙소의 인기도와 밀접한 관련이 있다
•
Entire home/apt는 리뷰 수가 많고, 만족도도 높다는 전제
•
Shared room은 리뷰 수 적고 평점도 낮을 것이라 예측
•
검증 방식:
◦
room_type vs number_of_reviews, reviews_per_month
◦
우수 숙소 기준(리뷰 수 상위 25%)과 room_type 비교
최소 숙박일 수는 인기도(전환율)에 영향을 준다
•
최소 숙박일이 짧을수록 예약 유연성 ↑ → 리뷰 수 ↑
•
외곽일수록 최소 숙박일이 길다 → 진입장벽 ↑
•
검증 방식:
◦
minimum_nights vs number_of_reviews, 숙소 위치
◦
인기/비인기 숙소 그룹의 minimum_nights 평균 비교
숙소 위치(도심/외곽)는 숙소 인기도와 유형에 영향 준다
•
도심: Entire 위주, 고가, 단기 숙박
•
외곽: Private 위주, 저가, 장기 체류
•
검증 방식:
◦
neighbourhood_group + room_type + price + number_of_reviews
◦
위도/경도 중심성 고려 가능
호스트 규모(숙소 수)는 숙소 품질과 일관성에 영향 준다
•
전문 호스트(10개 이상)는 도심에 집중, 리뷰 수 많음
•
단, 전문 호스트라고 해서 무조건 리뷰가 많은 것은 아님
•
검증 방식:
◦
calculated_host_listings_count, number_of_reviews
◦
숙소당 평균 리뷰 수
가격은 너무 높거나 낮으면 비선호 가능성이 있다
•
중간 가격대(100~200)에서 리뷰 수가 가장 많을 수 있음
•
저가 → shared, 중가 → private, 고가 → entire
•
검증 방식:
◦
log(price) 변환 → Q1~Q3 = 중간가격
◦
price_bin vs number_of_reviews
2. 유용한 개별 가설 요약
조원 | 가설 | 요약 |
큐에르 | 공유실은 평점이 낮다 | room_type vs 평점 분석 필요 |
시현 | 예약 가능일수 ↓ + 리뷰 많음 → 만족도 ↑ | 간접 전환율 추정: availability_365, number_of_reviews |
이녕 | 우수 숙소는 예약 가능일수가 많다 | 기회량 자체가 인기도에 영향 가능 |
유지 | “인기도 정의”부터 명확히 설정 | reviews_per_month, 최근 리뷰 활용 → 표본 구분 |
시현 | 고가 + 도심 숙소 = 단기 여행자 | minimum_nights, price, neighbourhood_group 교차 |
큐에르 | 숙소 밀집 지역일수록 리뷰↑ | 지역별 숙소 수 대비 리뷰 비율 보기 |
추천 분석 흐름
1.
인기도 기준 설정
•
예: 리뷰 수 상위 25% = 우수 숙소
2.
우수 vs 비우수 숙소 비교 분석
•
Room Type
•
Minimum Nights
•
Price (로그변환 + 구간화)
•
Availability
•
Host Scale
3.
위치별 분석
•
도심/외곽 비교: Room Type, Price, Minimum Nights
4.
전문 호스트 vs 일반 호스트 비교
최종 페르소나 방향 예시
유형 | 특징 | 활용 방안 |
도심 단기 여행객 | 1~2일 체류, Entire 선호, 고가 숙소 이용 | 당일예약, 빠른 체크인/아웃 지원 |
외곽 장기 거주형 | 7일 이상, 저가 Private, 최소 숙박일 영향 큼 | 장기 할인, 외곽 숙소 리뷰 보강 |
소규모 호스트 이용자 | 진정성, 리뷰 높은 소규모 숙소 선호 | "개인 호스트 인증", 스토리 큐레이션 제공 |
.png&blockId=21b2dc3e-f514-818b-b72b-f9aade6351bf)
