[핵심 목표]
비인기 숙소/수익이 잘 나지 않는 숙소의 수익을 올려 전체적인 수익 증대
가설 설정
시혀느
가설 설정 이유
인기도 등의 기준 설정 완료
→ 우수 숙소 패턴 분석 가능하다고 판단
→ 두 그룹 간의 비교 필요성을 느낌
컬럼: 가격 & 룸타입 & 지역으로는 조합하여 분석 경험 O
→ 데이터의 구체적 이해를 위해 다른 컬럼에 대한 비교 분석 필요성을 느낌
우수 숙소와 그렇지 않은 숙소의 비교
가설 설정 1 : 우수 숙소는 비인기 숙소에 비해 ‘월별 예상 매출’이 높을 것이다.
•
expected_monthly_revenue 활용
•
우수 숙소와 비인기 숙소의 비교 필요성 느낌!
•
예외상황이 있는지 확인하고 싶음!
두 집단을 추가로 비교 분석할 수 있는 컬럼
•
숙소 위치 (지역, 세부 지역, 도심/외곽)
•
공간 유형
•
요구되는 최소 숙박 일수
•
전체 리뷰 수, 평균 한달 리뷰 수, 최근 리뷰 날짜
•
호스트 리스팅 개수
•
예약 가능 일수
•
숙소 운영 일수
컬럼별 비교
가설 설정 2 : ‘숙소 운영 일수’가 길수록 ‘호스트가 운영하는 숙소의 개수’는 많을 것이다.
•
operating_months & calculated_host_listings_count 활용
유지느
가설 1
가설 2
영으느
1박 요금이 낮지만 리뷰 수가 많은 숙소가 전체 수익이 더 높을 것이다.
•
분석이유 : 수익을 잘 내는 숙소의 유형이 무엇인지 궁금함
•
"리뷰가 많고 가격이 낮은 숙소가 수익이 높은가?"
vs.
"가격은 높지만 운영이 잘 된 일부 고가 숙소가 더 수익성이 높은가?"
•
리뷰 수가 적더라도 가격이 높은 고가 숙소는, 단위 숙소 당 수익은 더 높을 수 있다.
•
•
분석의 핵심 개념 : 총 수익 = 1박 가격 × 예약 수 (리뷰 수로 추정)
→ 수익은 price × (number_of_reviews / 리뷰 남기는 비율)
→ 보통 리뷰율은 10%로 가정
•
1.
estimated_revenue = price * number_of_reviews / 0.1
2.
가격 기준 상/하위 25% 그룹 만들기
3.
리뷰 수 기준 상/하위 25% 그룹 만들기
전체 수익 중 대부분은 숙소를 10개 이상 보유한 전문업자(host)가 차지할 것이며,
•
이들은 주로 도심에 숙소를 집중 보유하고 있다.
•
전문업자들이 보유한 숙소는 대부분 private room일 것이다.
큐에르
가설 설정
이녕으
: 호스트 입장
•
숙소명에 관광지 키워드가 들어갈수록 예약이 더 많이 될 것 이닭!
◦
숙소 예약 시 관광지 근처에 머무는 사람이 많을 것으로 예상했기 때문입니 닭
◦
분석 방향
1.
관광지 키워드 리스트 정하기 (뉴욕 기준)
2.
숙소 이름(name) 컬럼에 키워드가 들어있는지 여부를 True/False 파생 컬럼으로 만들기
3.
인기도 상위 25% (우수 숙소) 와 키워드 포함 여부 간의 연관성 확인
4.
비교 시각화 (barplot)
: 게스트 입장
•
숙소명에 호스트 이름이 들어간 숙소가 신뢰를 줄 것이닭 <예약이 더 많을 것이 닭>
◦
안나의 집, 헤일리의 집, 비버의 집처럼 호스트가 게스트와 소통하고 숙소에 신경을 더 쓸 것 같은 느낌이 들었기 때문입니 닭
◦
분석 방향
1.
'호스트 이름 포함 여부' 파생 컬럼 만들기
2.
호스트 이름 포함 그룹'과 '미포함 그룹' 비교하기
3.
인기도 상위 25% (우수 숙소) 와 키워드 포함 여부 간의 연관성 확인
4.
비교 시각화 (barplot)
가설 분석 결과 공유
인사이트 도출
.png&blockId=21b2dc3e-f514-818b-b72b-f9aade6351bf)

