////////
Search
Duplicate
🌜

튜터님 설득

Tags
Archive
ETA
Main Task
Sub Task
담당자
메모
상태
Done
생성 일시
2025/07/25 06:52
우선 순위
진행률 %
<원본 df[’name’] 예시>
설명…

의도 : 여행객들이 자주 반응하는 키워드가 있는지, 있다면 그 키워드를 활용해서 예약일수 증가에 기여할 수 있는지! 이 부분을 실험해보고 싶어서 진행하게 되었습니다

가설 설정
귀무가설(H0): 형용사 키워드를 사용한 숙소와 사용하지 않은 숙소 간 예약일수 평균에 차이가 없다.
대립가설(H0): 형용사 키워드를 사용한 숙소는 사용하지 않은 숙소보다 예약일수가 더 길다.
<프로세스>
방법 1 : 형용사 키워드 분리/키워드 유무에 따른 t-test(예약일수 평균)
방법 2: - 실제 호스트 기반 군집화 진행(’name’ 컬럼 활용)
- 키워드 & 예약률 유효성 검증(회귀 계수, 평균 예약 일수, 분류 모델 활용)
방법1
키워드 분리 & t 검정
키워드 분리 & t검정(room_type 없이 전체)
이를 바탕으로 특정 키워드에 따라 점유율에 차이를 보임을 알 수 있고, t-검정을 통과한 키워드를 바탕으로 전략 제시
방법2
실제 호스트 기반 군집화 진행(’name’ 컬럼 활용)
결론
<통계적 결론>
58~9% 정도의 상/하위 분류 정확도를 가지고 있으며, 하위 예측이 비교적 준수한 상황
회귀 계수를 통해 특정 키워드의 영향력을 표현해 볼 수는 있음
군집 내 top keywords 와 상위 예측 키워드가 일치하는 경우가 존재(실사용 키워드와 상위 예약률 기여 키워드의 일치)
: 키워드만으로 상/하위 예약률을 분류하고 많은 영향력을 끼친다고 할 수는 없음. 하지만, 하나의 피처가 절대적인 영향력을 미치는 경우는 드물다고 생각(가격 제외)
<전략적 결론>
: 군집 과 상위 예측에 공통적으로 등장하는 키워드를 조합함으로써 호스트에게 마케팅 전략을 제시해볼 수 있다.
상위 키워드 추천
키워드 필터링 추천 검색 기능(최대 3개 제한)

우수 숙박 업소 선정 및 마케팅 전략(랭킹)