Skip to main content

S4. 라이프스타일 페르소나 매칭 + 클러스터링

페르소나 매칭과 RFM 클러스터링을 하나의 화면으로 통합. 소셜 페르소나 (인스타·올영) 결합으로 강화.

1. URL 경로

  • /personas

2. 사용자 스토리

P2 (인사이트) — 회원 5만명을 5종 라이프스타일 페르소나로 자동 분류 + 의미 있는 6~8 클러스터로 묶고 싶다.

3. 입력 UI

  • 페르소나 매칭 탭: 회원 단건/일괄 매칭
  • 클러스터링 탭: KMeans 클러스터 분석
  • 페르소나 정의 카드 (5종): 키즈맘 · 골드미스 · 1인가구 · 시니어 · 트렌드세터

4. 데이터 믹스

데이터출처활용
RFM 피처NeptuneKMeans 입력
카테고리 친화도Neptune (Customer × Category 빈도)KMeans 입력
채널 비중NeptuneKMeans 입력
소셜 페르소나인스타·올영 키워드 → SocialSignalLLM 라벨링 보강

5. 처리 파이프라인 (페르소나 매칭)

1. 회원 1-hop 데이터 (openCypher)
2. 피처 벡터: 카테고리 비중·가격대·시간대·채널 비중
3. 페르소나별 가중치 점수
4. 1·2순위 + 신뢰도 (entropy)

6. 처리 파이프라인 (클러스터링)

1. 피처 추출: RFM + 카테고리 친화도 + 채널 비중 + 소셜 활동
2. 표준화 (z-score)
3. KMeans 6 (또는 elbow)
4. 클러스터별 평균 + 소셜 키워드 → Sonnet 4.6 라벨링
5. 라벨 예: "프리미엄 Beauty 충성층", "할인 민감 1인가구", "주말 가족 쇼핑객"

7. 출력 UI

  • 페르소나 카드 (마스킹 ID + 1·2순위 + 신뢰도 바)
  • 클러스터 카드 (라벨, 회원 수, 핵심 특징, 대표 SKU 5)
  • 2D 산점도 (PCA)
  • 페르소나 → 클러스터 Sankey

8. 가드레일

  • 페르소나 라벨 회원 본인 비노출 (내부 분석 전용)
  • "민감 추정" (임신·질병) 금지
  • 표본 너무 작은 클러스터(<30명) 별도 표시
  • LLM 라벨에 차별·편견 어휘 금지

9. 데모 시나리오

  1. 단건 매칭 → "1순위 키즈맘 0.62 / 2순위 1인가구 0.18"
  2. 5만명 일괄 클러스터링 → 6 클러스터 자동 라벨
  3. "이 클러스터에 캠페인 발송 시뮬" → S5 연계