*연관분석
– 장바구니 분석 or 서열 분석
– 조건과 반응의 형태 (if-then)
- 지지도 = P(A∩B)
- 신뢰도 = P(A∩B) / P(A) = 지지도 / P(A)
- 향상도 = P(B|A) / P(B) = P(A∩B) / P(A)·P(B) = 신뢰도 / P(B)
(A 구매 X, B 구매 O) → (A 구매 O, B 구매 O) – 관련 없으면 향상도 1
*연관분석 예시
- 전체 100개의 거래 중 ‘우유’와 ‘빵’이 함께 구매된 거래가 20회
지지도(우유,빵) = 20 / 100 = 0.2 - ‘우유’가 구매된 30건의 거래 중 ‘우유’와 ‘빵’이 함께 구매된 거래가 20회
신뢰도(우유⇒빵) = 20 / 30 ≈ 0.67 - 전체 거래 중 ‘빵’이 구매된 건수가 40회
향상도(우유⇒빵) = 0.67 / (40/100) = 0.67 / 0.4 = 1.675
→ ‘우유’와 ‘빵’ 사이에는 긍정적인 연관관계가 있으며, 이 두 아이템은 함께 판매 촉진 전략을 세울 수 있는 좋은 후보임을 알 수 있음
*최소지지도 결정 → 넘는 품목 분류(5%) → 2개 품목 집합 생성
- 장점: 결과 이해 쉬움, 강력한 비목적성 분석기법, 간단한 자료 구조, 계산 간단
→ 품목 많으면 계산 ↑
- (1세대) Apriori – 최소지지도 이상 빈발 항목 집합
- (2세대) FP_Growth – FP_Tree 분할정복 (품목 수 ↓) – 빠름
- (3세대) FPV
'데이터 분석 > ADP 자격증 공부' 카테고리의 다른 글
| (파이썬 한권으로 끝내기) 상관계수, 선형 회귀분석, 다중 회귀, 다중공선성, 변수선택법(전진선택법, 후진제거법, 단계선택법) (0) | 2026.04.05 |
|---|---|
| [ADP 필기] 비정형 데이터마이닝 – 텍스트마이닝, 사회연결망 분석 (0) | 2026.04.05 |
| [ADP 필기] 군집분석 (0) | 2026.04.05 |
| [ADP 필기] 인공신경망 분석 (0) | 2026.04.05 |
| (파이썬 한권으로 끝내기) 통계분석 – T검정(t-test), 분산분석(ANOVA), 교차분석(카이제곱 검정) (0) | 2026.04.05 |