1. 고객 세그먼트별 매출 특징
- 연령대 별 매출 구하기
fig 1. 연령대 별 평균 매출
fig 2. 연령대 별 총 매출
1) 연령대별 평균, 총 매출 그래프
•
그래프 경향성
◦
연령대별 총매출
▪
총매출은 20대가 약 8,996 SEK으로 가장 높고, 30대 4,636 SEK, 40대 3,480 SEK, 50대 3,975 SEK 순으로 이어짐.
▪
10대는 325 SEK 수준이라 거래 수 대비 매출 규모는 작음.
▪
60대 이후는 973(60대) → 168(70대) → 14(80대) → 1(90대) SEK로 매출도 급격히 줄어듦.
→ 매출 규모 역시 20~50대가 대부분을 차지하며, 20대가 압도적인 매출 기여층임.
◦
연령대별 평균 매출
▪
총매출은 20대 구간이 가장 높고, 그 다음이 30, 40, 50대 순으로 이어지며 60대 이후부터는 매출 규모가 급격히 감소하는 형태를 보임.
▪
고령대 (7~90대)는 거래건수가 적기에, 하나로 묶어서 진행해도 될 것으로 보임
▪
70대 이상 구간은 거래 건수가 매우 적어 총매출 수준도 낮고, 8~90대는 거의 미미한 수준으로 관찰됨.
▪
총 매출은 20·30대가 크지만, 거래 1건당 평균 지출액은 고연령층(특히 50~80대)이 조금 더 높다.
◦
10대를 제외하면 연령이 높아질수록 거래 1건당 평균 지출이 완만하게 증가하는 우상향 패턴을 보임.
◦
80·90대는 표본 수가 너무 적어서(417건, 39건) 평균이 튀는 경향이 있어 참고용 수준으로 보는 것이 적절함.
•
인사이트
•
매출 규모 기준 핵심 타깃층
◦
전체 매출에서 20~50대가 절대 다수의 매출과 거래를 담당하는 핵심 고객군임.
◦
외부 리포트에서도 패션·이커머스 시장에서 16~24세·밀레니얼(20–30대 초반)이 온라인 패션 소비를 주도한다는 결과가 많음. 예를 들어, 한 리포트에서는 16–24세 Gen Z가 온라인 패션 소비자의 약 30%를 차지하지만 소득이 낮아 객단가는 상대적으로 낮다고 하고, 45세 이상은 비중은 높지만 구매 빈도는 낮다고 설명함.(ref E-commerce Germany News)
◦
우리 데이터에서도 거래 수와 총매출은 20대가 1위, 30·40·50대가 그 뒤를 받치는 구조라서, 이들을 중심으로 한 프로모션·추천 알고리즘 최적화가 필요함.
•
연령이 높을수록 객단가는 조금씩 올라가는 구조
◦
20대 평균 0.0271 SEK → 50대 0.0292 SEK → 60·70대는 0.030대 수준으로 소폭 상승함.
◦
외부 조사에서도 연령이 높을수록 소득과 구매력은 높지만, 구매 횟수는 줄어드는 경향이 보고됨. 젊은 층은 자주·소액으로, 중장년층은 덜 자주·고가 제품을 구매하는 패턴이라는 설명과 유사한 결과임.
•
어떤 전략이 필요한가?
◦
20~30대: “거래량 중심” 고빈도·저단가 세그먼트 → 신상품 푸시, 모바일·SNS 기반 프로모션에 주력하는 것이 유효함.
◦
40~60대: “객단가 중심” 저빈도·고단가 세그먼트 → 프리미엄 라인, 세트/코디 제안, 멤버십 할인·포인트 적립 등으로 한 번 구매할 때 더 많이 담게 만드는 전략이 필요함.
- 회원 상태 별 매출 구하기
fig 3. 회원 상태 수 구하기
fig 4. 회원별 매출 구하기
•
그래프 경향성
◦
회원 수 분포
▪
Active 회원 수는 796,063명, Pre-active(신규) 회원은 16,608명 수준으로, 전체의 95% 이상이 Active 회원으로 구성되어 있음.
▪
Pre-active는 분포상 ‘극소수 세그먼트’라서, 멤버십 구조가 이미 활성 고객 중심으로 안정화된 상태임.
◦
매출(총 구매액) 분포
▪
Active 회원 매출은 22,067 SEK, PRE-CREATE는 503.8 SEK로, 매출 비중 역시 거의 전부가 Active 회원에서 발생함.
•
인사이트
◦
H&M 매출의 중심은 ‘기존 고객’임
▪
회원 수와 매출 모두에서 Active가 압도적 비중을 차지하고 있으므로, 현재 H&M 매출 구조는 신규 유입보다 기존 멤버 유지·활성화에 더 크게 의존하는 구조임.
▪
실제로 패션/리테일 업계에서도 로열티 프로그램 회원이 전체 매출의 대부분을 차지하는 경향이 있음. 예를 들어 Sephora는 로열티 회원 매출 비중이 약 80%에 달하고, H&M 역시 2021년 기준 멤버십이 전년 대비 71% 성장하며 1억 2천만 명 이상이 가입한 것으로 보고됨임.erscommerce.com
◦
비즈니스 관점 전략 – ‘기존 회원 유지 + 신규 회원 온보딩’ 투트랙이 필요함.
▪
기존 회원(ACTIVE)은 이미 매출의 대부분을 차지하므로,
•
포인트/쿠폰 설계, 커스터마이징 추천, 재구매 주기 맞춘 리마인드/프로모션
등을 통해 이탈을 줄이고 객단가·구매 빈도(재구매율)를 조금씩 끌어올리는 방향이 중요함.
▪
동시에 Pre-Active(신규) 구간은
•
회원 가입 후 첫 1~2회 구매를 유도하는 웰컴 프로모션(첫 구매 할인, 무료 배송, 추가 포인트)
•
가입 후 일정 기간 내 미구매 고객에게 리마인드 메시지/앱 푸시
같은 온보딩 캠페인으로 신규 → Active 전환율을 올리는 것이 핵심 과제가 됨.
- 고객별 평균적인 재구매 주기 구하기
fig 5. 고객별 평균적인 재구매 주기
table 1. 고객별 평균적인 재구매 주기 표
•
그래프 경향셩
◦
전체 178,296명 중 약 34.2%가 ~1month, 59.2%가 2month 이내 75.4%가 3month에 재구매하는 분포를 보이며, 재구매 주기가 길어질수록 고객 수가 가파르게 감소하는 우하향 구조임.
◦
3~7month 구간이 약 22.0% 정도의 완만한 꼬리를 형성하고, 7month 이상은 전체의 2.6% 수준에 불과해 사실상 장기 휴면·이탈 직전 고객 군으로 볼 수 있음.
•
인사이트
◦
H&M 고객의 핵심 매출·활성 구간은 처음 3개월 이내로, 이 기간에 재구매를 유도하기 위한 쿠폰·룩북 추천·신상품 알림 등 후속 액션을 집중해야 할 필요가 있음.
◦
3~6month 구간은 아직 완전히 이탈하지 않았지만 구매 속도가 떨어진 구간(약 22%)으로, 시즌 변경/신상 출시 타이밍에 맞춘 리마인드 캠페인 대상으로 정의할 수 있음.
2. 상품군 별 트렌드는 무엇인가?
- 상품군별 매출 TOP 10 구하기 + TOP 10 에서 각 상품군별 인기색상 구하기
fig 6. 상품군별 매출 top 10
•
그래프 경향성
◦
Garment Upper body와 Garment Lower body가 압도적인 매출을 기록하며, 그 뒤를 Garment Full body가 따르는 의류(상의·하의·원피스) 중심 구조를 보임. 상위 3개 상품군 이후에는 Swimwear → Underwear → Shoes → Accessories… 순으로 완만하게 감소하는 분포를 보이며, 후반부 상품군(양말, 잠옷, Unknown)은 매출 비중이 매우 낮음.
•
인사이트
◦
H&M의 매출은 기본 착장에 해당하는 상·하의 및 원피스에 강하게 집중되어 있어 고객이 가장 많이 소비하는 핵심 카테고리는 일상용 의류임.
◦
따라서 이 영역에서 신상품 기획, 재고 확보, 가격·프로모션 전략을 우선적으로 설계하는 것이 전체 매출에 가장 큰 영향을 줄 것으로 해석됨.
◦
Swimwear, Underwear, Shoes, Accessories 등은 단일 매출 규모는 작지만, 코디/세트 구매를 통해 상·하의와 자연스럽게 묶을 수 있는 카테고리임.
◦
상위 의류군과의 크로스셀·번들 프로모션을 강화하면 객단가(한 번 구매 시 쓰는 금액)를 끌어올릴 여지가 있는 보조 성장 영역으로 볼 수 있음.
•
그래프 경향성
◦
모든 상품군에서 Black 색상이 매출 1위를 차지하고, 다른 색상 대비 2배 이상 격차를 보이는 경우가 많음.
◦
대부분의 상품군에서 White / Blue / Grey / Beige가 공통적으로 상위 5위 안에 포함되며, 기본 컬러 팔레트를 형성하고 있음.
◦
수영복·언더웨어·원피스처럼 연출성이 강한 카테고리에서만 Red / Pink / Orange와 같은 포인트 컬러가 상위권에 일부 분포함.
◦
Socks & Tights, Shoes, Accessories처럼 실용·보조 역할이 강한 카테고리는 Black 중심의 단일 쏠림 현상이 특히 두드러짐.
•
인사이트
◦
블랙은 모든 상품군에서 1위 컬러임.
▪
상의·하의·원피스·수영복·언더웨어·신발·양말까지 전 카테고리에서 블랙이 최대 매출을 기록함.
▪
패션 리테일에서 블랙이 “가장 선호되는 베이식 컬러”라는 연구 결과와도 일치함.
→ 전략: 재고·매대·프로모션 기획 시, 블랙 재고를 최우선 확보하고, 가격/할인 전략도 블랙 중심으로 설계할 필요가 있음.
◦
화이트, 블루, 그레이, 베이지가 그 다음 매출을 책임지는 역할을 함.
▪
상의/하의/원피스 대부분에서 White·Blue·Beige·Grey가 2~5위를 차지.
▪
그렇기에 베이식 컬러를 중심으로 코디 호환성이 높은 기본 아이템들을 제안하는 콘텐츠를 제작하면 구매 유도가 가능할 것으로 보임.
◦
신발/양말/액세서리 등 잡화류는 블랙 및 메탈 계열의 비중이 특히 높아, 의류는 색을 바꾸더라도 잡화는 베이식 톤으로 통일하려는 소비 패턴이 존재함. 이에 맞춰 “올블랙 잡화 세트”, “블랙&메탈 악세서리로 마무리” 같은 세트 구성 전략이 유효할 것임.
- 상품군별 재구매율 파악하기
fig 8. 상품군별 재구매율
•
그래프 경향셩
◦
전체적으로 의류 카테고리(상·하의, 풀바디, 수영복, 언더웨어)의 재구매율이 다른 상품군 대비 확실하게 높게 나타남. 상의(Garment Upper body)가 34.38%로 가장 높고, 하의(Garment Lower body, 26.05%), 수영복(22.14%), 풀바디(20.73%), 언더웨어(17.32%) 순으로 이어짐임.
◦
반대로 가방(Bags), Furniture, Items, Underwear/nightwear는 재구매율이 1% 이하이거나 0%로, 재구매가 거의 발생하지 않는 비핵심 카테고리임.
◦
Garment and Shoe care는 재구매율이 **33.33%**로 매우 높게 나오지만, 고객 수(customers_cnt)가 3명 수준이라 표본이 극도로 작음 → 통계적으로는 신뢰하기 어려운 값임.
◦
액세서리(10.66%), 신발(10.38%), 양말/타이츠(7.61%), 나이트웨어(6.00%), 코스메틱(4.35%) 등은 의류 대비 재구매율이 완만하게 낮은 중·저재구매 영역에 위치함임.
•
인사이트 (정리)
◦
상의·하의·언더웨어·수영복은 “핵심 리텐션 상품군”임.
▪
이 카테고리는 재구매율이 17~34% 수준으로, 다른 상품군 대비 고객이 반복 구매를 많이 하는 영역임.
▪
패션 업계에서 기본 의류(상의/하의/언더웨어)는 계절 변화, 유행, 수명(마모) 등의 이유로 정기적인 교체 수요가 발생한다고 알려져 있는데, 현재 데이터에서도 같은 패턴이 확인됨임.
▪
따라서 H&M 입장에서는 쿠폰·포인트·룩북 추천·세트 할인 등 리텐션 캠페인을 이 상품군에 우선적으로 집중하는 것이 매출/재구매 극대화에 유리함임.
◦
수영복·풀바디는 “시즌성 + 브랜드 선호”가 강한 충성 카테고리일 가능성이 높음.
▪
수영복(22.14%), 풀바디(20.73%)는 일반적으로 구매 주기가 길 수 있음에도 재구매율이 꽤 높은 편임.
▪
이는 일부 고객이 여름 시즌마다 H&M에서 반복 구매를 하거나, 특정 핏/디자인에 대한 만족도로 인해 동일 브랜드 재구매를 하는 패턴으로 해석 가능함임.
▪
캠페인 측면에서는 여름 시즌 사전 프로모션, 신상품 알림, 세트 구성(수영복+비치웨어) 등을 통해 “시즌 반복 구매”를 더 끌어낼 수 있음임.
◦
재구매율 지표를 기반으로 상품군별 KPI와 마케팅 역할을 분리할 필요가 있음.
▪
상의·하의·언더웨어·수영복·풀바디 → “ 재방문 유도” 담당 핵심 카테고리임.
▪
액세서리·신발·양말/타이츠·나이트웨어·코스메틱 → 장바구니 단가 증대·코디 완성도 상승을 위한 보조 카테고리임.
▪
가방·Furniture·Items → 재구매 KPI보다 1회성 매출/브랜드 이미지·캠페인용 카테고리로 포지셔닝하는 것이 합리적임.
▪
이런 식으로 상품군별 역할과 목표(KPI)를 분리하면, 이후 세그먼트별·채널별 전략 설계 시 “어디에 리텐션 예산을 더 써야 하는지”가 명확해짐임.
3. 연령대별 채널(온, 오프라인) 사용 현황 + 연령대별 매출 상위 10개 상품군 구하기
- 연령대별 채널 사용 현황
fig 9. 채널별 거래 횟수
fig 10. 연령대별, 채널 별 거래수
•
그래프 경향셩
•
전체 채널 사용 현황
◦
온라인 거래가 오프라인 대비 약 2.3배 많음 → H&M 데이터에서는 이미 온라인 채널 중심 쇼핑 패턴이 형성되어 있음.
•
연령대별 채널 이용 패턴
◦
연령대별로 보면 20~50대는 “온라인 압도적 우세” 패턴, 60대는 온‧오프라인 균형, 70대 이후는 전체 규모가 작아서 보수적으로 해석할 필요가 있음.
◦
고령층은 전체 거래량이 매우 적고, 70대는 온라인 비중이 높지만 80대 이후부터는 표본이 적어서 채널 간 차이는 통계적으로 크게 의미 있지 않을 가능성이 높음.
•
인사이트
◦
H&M 고객 기반은 ‘20~30대’와 ‘40~50대’에 집중되어 있음
▪
20·30대에서 전체 온라인 거래의 상당수가 발생하고, 오프라인보다 2~3배 이상 높은 비중을 보이는 점을 고려하면, 주요 매출 성장 동력은 온라인 채널의 MZ세대임.
▪
글로벌 리테일 리포트에서도 20·30대가 모바일/온라인 패션 구매 비중이 높고, 가격 비교/리뷰 기반 쇼핑을 선호한다는 결과가 많음(예: McKinsey & Company, 2023, “The State of Fashion”). 이는 H&M 데이터에서 관찰되는 패턴과 일치함.
◦
40·50대 역시 온라인 전환이 상당히 진행된 ‘성숙 시장’임
▪
40·50대에서도 온라인 거래가 오프라인의 약 2배 수준으로 높게 나타남 → 단순히 MZ세대만 온라인을 쓰는 것이 아니라, 중장년층도 이미 온라인 쇼핑이 기본 채널이 된 상황임.
▪
여러 연구에서 40·50대는 가격 민감도보다는 편의성과 배송/반품 경험을 중시하는 경향이 보고되며, H&M 입장에서는 이 연령대를 대상으로 온라인 편의성(배송, 반품, 사이즈 추천 등)을 강화하는 전략이 효과적일 가능성이 높음.
◦
온라인 채널:
▪
20~40대: 메인 타깃 → 개인화 추천, 앱 푸시, 한정판/콜라보 마케팅 등 공격적 디지털 캠페인 강화 필요함.
▪
50대: 편의성·신뢰 중심 메시지(정확한 사이즈 정보, 후기, 간편반품)를 강조하여 충성도 강화 전략이 필요함.
◦
오프라인 채널:
▪
10대·20대: 체험/피팅·SNS 연계 이벤트 등 브랜드 경험 강화용 허브로 활용하는 게 적합함.
▪
60대 이상: 직원 응대, 오프라인에서 회원 가입 유도 등을 통해 온라인으로의 브릿지 역할을 할 수 있음.
- 연령대별 매출 상위 10개 상품군 구하기
•
그래프 경향셩
◦
연령대·채널 상관없이 공통 패턴
▪
모든 연령대, 온·오프라인 공통 TOP3
1.
Garment Upper body (상의)
2.
Garment Lower body (하의)
3.
Garment Full body (원피스/점프수트류)
▪
그 뒤를 Swimwear, Underwear, Shoes, Accessories 등이 비슷한 순서로 따라가고,
Nightwear, Socks & Tights, Unknown 등은 항상 매출 비중이 매우 작음.
◦
채널 별 비교
▪
같은 연령대 기준, 항상 온라인 매출이 오프라인보다 2배 안팎으로 크게 형성됨.
▪
2~30대는 특히 온라인 매출이 더 크고, 4~50대에서도 2~30대 만큼은 아니지만, 비슷한 경향을 보임
▪
데이터 상으로 모든 연령대에서 온라인 채널이 핵심 매출 채널이고, 특히 2~30대에서 온라인 의존도가 가장 높아 보임
•
인사이트
◦
전 연령 공통으로 일상으로 상의, 하의, 원피스에 자원 집중 필요
▪
매출 상위 10개 상품군을 연령, 채널별로 다 나눔에도 불구하고 핵심은 바로 이 세 카테고리임
▪
상품 기획, 재고, 프로모션 등 예산의 우선순위를 위 3개의 카테고리에 두는 것이 매출에 큰 효율을 보일 것이라 예상
▪
나머지 카테고리는 시즌성, 이벤트성으로 포지셔닝 하는 것이 좋아 보임
◦
채널 전략 : 온라인 중심, 오프라인은 경험 역할
▪
동일한 상품 구조에서 온라인 매출이 항상 더 크다는 것은 이미 온라인 구매에 익숙한 상태
▪
따라서 신규 컬렉션, 프로모션은 온라인 공개를 우선으로 하고,
▪
오프라인은 피팅, 픽업 등 경험 강화 채널로 설계하는 방향을 제시하고자함.
4. 개인 추가적인 문제 정의 제시
문제 정의 분석_1_3 연령대 별 구매 전환율 비율 구하기
여기서는 df_full 보다는 transactions, customers 파일을 각각 사용해서 봐야 할 것 같다.
df_full은 거래가 한번이라도 있는 고객, 거래 데이터가 존재하기때문임
문제 정의 분석_1_4 연령대별 구매 주기 구하기 통한 vip 고객 유지 전략 제시
df_full 이용해서 가능해보임.
문제 정의 분석 1_2에서 응용하면 해결 가능할 문제 정의로 판단됨.










