데이터 분석/ADP 자격증 공부

[ADP 필기] 연관분석

나르시스트 2026. 4. 5. 18:09

*연관분석

– 장바구니 분석 or 서열 분석
– 조건과 반응의 형태 (if-then)

  • 지지도 = P(A∩B)
  • 신뢰도 = P(A∩B) / P(A) = 지지도 / P(A)
  • 향상도 = P(B|A) / P(B) = P(A∩B) / P(A)·P(B) = 신뢰도 / P(B)
    (A 구매 X, B 구매 O) → (A 구매 O, B 구매 O) – 관련 없으면 향상도 1

*연관분석 예시

  • 전체 100개의 거래 중 ‘우유’와 ‘빵’이 함께 구매된 거래가 20회
    지지도(우유,빵) = 20 / 100 = 0.2
  • ‘우유’가 구매된 30건의 거래 중 ‘우유’와 ‘빵’이 함께 구매된 거래가 20회
    신뢰도(우유⇒빵) = 20 / 30 ​≈ 0.67
  • 전체 거래 중 ‘빵’이 구매된 건수가 40회
    향상도(우유⇒빵) = 0.67 / (40/100) = 0.67 / 0.4 = 1.675

→ ‘우유’와 ‘빵’ 사이에는 긍정적인 연관관계가 있으며, 이 두 아이템은 함께 판매 촉진 전략을 세울 수 있는 좋은 후보임을 알 수 있음

*최소지지도 결정 → 넘는 품목 분류(5%) → 2개 품목 집합 생성

  • 장점: 결과 이해 쉬움, 강력한 비목적성 분석기법, 간단한 자료 구조, 계산 간단
    → 품목 많으면 계산 ↑
  • (1세대) Apriori – 최소지지도 이상 빈발 항목 집합
  • (2세대) FP_Growth – FP_Tree 분할정복 (품목 수 ↓) – 빠름
  • (3세대) FPV