////////
Search
Duplicate

가설 설정

Tags
Archive
ETA
2025/07/11
Main Task
Sub Task
담당자
메모
상태
Done
생성 일시
2025/07/11 00:34
우선 순위
Medium
진행률 %
[핵심 목표]
비인기 숙소/수익이 잘 나지 않는 숙소의 수익을 올려 전체적인 수익 증대
가설 설정

시혀느

가설 설정 이유
 우수 그룹 패턴 분석
인기도 등의 기준 설정 완료
→ 우수 숙소 패턴 분석 가능하다고 판단
→ 두 그룹 간의 비교 필요성을 느낌
 여러 컬럼 분석
컬럼: 가격 & 룸타입 & 지역으로는 조합하여 분석 경험 O
→ 데이터의 구체적 이해를 위해 다른 컬럼에 대한 비교 분석 필요성을 느낌

 우수 숙소와 그렇지 않은 숙소의 비교

가설 설정 1 : 우수 숙소는 비인기 숙소에 비해 ‘월별 예상 매출’이 높을 것이다.

expected_monthly_revenue 활용
우수 숙소와 비인기 숙소의 비교 필요성 느낌!
예외상황이 있는지 확인하고 싶음!
두 집단을 추가로 비교 분석할 수 있는 컬럼
숙소 위치 (지역, 세부 지역, 도심/외곽)
공간 유형
요구되는 최소 숙박 일수
전체 리뷰 수, 평균 한달 리뷰 수, 최근 리뷰 날짜
호스트 리스팅 개수
예약 가능 일수
숙소 운영 일수

 컬럼별 비교

가설 설정 2 : ‘숙소 운영 일수’가 길수록 ‘호스트가 운영하는 숙소의 개수’는 많을 것이다.

operating_months & calculated_host_listings_count 활용

유지느

가설 1
가설 2

영으느

1박 요금이 낮지만 리뷰 수가 많은 숙소가 전체 수익이 더 높을 것이다.

분석이유 : 수익을 잘 내는 숙소의 유형이 무엇인지 궁금함
"리뷰가 많고 가격이 낮은 숙소가 수익이 높은가?"
vs.
"가격은 높지만 운영이 잘 된 일부 고가 숙소가 더 수익성이 높은가?"
회전률 기반 대중형 숙소

리뷰 수가 적더라도 가격이 높은 고가 숙소는, 단위 숙소 당 수익은 더 높을 수 있다.

단가 기반 프리미엄 전략
분석의 핵심 개념 : 총 수익 = 1박 가격 × 예약 수 (리뷰 수로 추정)
→ 수익은 price × (number_of_reviews / 리뷰 남기는 비율)
→ 보통 리뷰율은 10%로 가정
검증 방법 추천
1.
estimated_revenue = price * number_of_reviews / 0.1
2.
가격 기준 상/하위 25% 그룹 만들기
3.
리뷰 수 기준 상/하위 25% 그룹 만들기

전체 수익 중 대부분은 숙소를 10개 이상 보유한 전문업자(host)가 차지할 것이며,

이들은 주로 도심에 숙소를 집중 보유하고 있다.
전문업자들이 보유한 숙소는 대부분 private room일 것이다.

큐에르

가설 설정

이녕으

: 호스트 입장

숙소명에 관광지 키워드가 들어갈수록 예약이 더 많이 될 것 이닭!
숙소 예약 시 관광지 근처에 머무는 사람이 많을 것으로 예상했기 때문입니 닭
분석 방향
1.
관광지 키워드 리스트 정하기 (뉴욕 기준)
2.
숙소 이름(name) 컬럼에 키워드가 들어있는지 여부를 True/False 파생 컬럼으로 만들기
3.
인기도 상위 25% (우수 숙소) 와 키워드 포함 여부 간의 연관성 확인
4.
비교 시각화 (barplot)

: 게스트 입장

숙소명에 호스트 이름이 들어간 숙소가 신뢰를 줄 것이닭 <예약이 더 많을 것이 닭>
안나의 집, 헤일리의 집, 비버의 집처럼 호스트가 게스트와 소통하고 숙소에 신경을 더 쓸 것 같은 느낌이 들었기 때문입니 닭
분석 방향
1.
'호스트 이름 포함 여부' 파생 컬럼 만들기
2.
호스트 이름 포함 그룹'과 '미포함 그룹' 비교하기
3.
인기도 상위 25% (우수 숙소) 와 키워드 포함 여부 간의 연관성 확인
4.
비교 시각화 (barplot)
가설 분석 결과 공유
인사이트 도출