S4. 라이프스타일 페르소나 매칭 + 클러스터링
페르소나 매칭과 RFM 클러스터링을 하나의 화면으로 통합. 소셜 페르소나 (인스타·올영) 결합으로 강화.
1. URL 경로
/personas
2. 사용자 스토리
P2 (인사이트) — 회원 5만명을 5종 라이프스타일 페르소나로 자동 분류 + 의미 있는 6~8 클러스터로 묶고 싶다.
3. 입력 UI
- 페르소나 매칭 탭: 회원 단건/일괄 매칭
- 클러스터링 탭: KMeans 클러스터 분석
- 페르소나 정의 카드 (5종): 키즈맘 · 골드미스 · 1인가구 · 시니어 · 트렌드세터
4. 데이터 믹스
| 데이터 | 출처 | 활용 |
|---|---|---|
| RFM 피처 | Neptune | KMeans 입력 |
| 카테고리 친화도 | Neptune (Customer × Category 빈도) | KMeans 입력 |
| 채널 비중 | Neptune | KMeans 입력 |
| 소셜 페르소나 | 인스타·올영 키워드 → SocialSignal | LLM 라벨링 보강 |
5. 처리 파이프라인 (페르소나 매칭)
1. 회원 1-hop 데이터 (openCypher)
2. 피처 벡 터: 카테고리 비중·가격대·시간대·채널 비중
3. 페르소나별 가중치 점수
4. 1·2순위 + 신뢰도 (entropy)
6. 처리 파이프라인 (클러스터링)
1. 피처 추출: RFM + 카테고리 친화도 + 채널 비중 + 소셜 활동
2. 표준화 (z-score)
3. KMeans 6 (또는 elbow)
4. 클러스터별 평균 + 소셜 키워드 → Sonnet 4.6 라벨링
5. 라벨 예: "프리미엄 Beauty 충성층", "할인 민감 1인가구", "주말 가족 쇼핑객"
7. 출력 UI
- 페르소나 카드 (마스킹 ID + 1·2순위 + 신뢰도 바)
- 클러스터 카드 (라벨, 회원 수, 핵심 특징, 대표 SKU 5)
- 2D 산점도 (PCA)
- 페르소나 → 클러스터 Sankey
8. 가드레일
- 페르소나 라벨 회원 본인 비노출 (내부 분석 전용)
- "민감 추정" (임신·질병) 금지
- 표본 너무 작은 클러스터(<30명) 별도 표시
- LLM 라벨에 차별·편견 어휘 금지
9. 데모 시나리오
- 단건 매칭 → "1순위 키즈맘 0.62 / 2순위 1인가구 0.18"
- 5만명 일괄 클러스터링 → 6 클러스터 자동 라벨
- "이 클러스터에 캠페인 발송 시뮬" → S5 연계