Hyun's Wonderwall

[SPSS] 군집분석을 활용한 카드 고객 분류, 연관규칙 분석을 활용한 화장품 구매 패턴 분석, 다중회귀분석을 활용한 중고차 가격 예측 본문

Subjects

[SPSS] 군집분석을 활용한 카드 고객 분류, 연관규칙 분석을 활용한 화장품 구매 패턴 분석, 다중회귀분석을 활용한 중고차 가격 예측

Hyun_! 2024. 12. 1. 19:00

SPSS Modeler 데이터 마이닝 솔루션

대용량 데이터로부터 유용한 정보를 쉽고 정확하게 찾아내기 위한 데이터 마이닝 소프트웨어.

데이터 로딩, 변환, 정제, 모델링, 그래프, 결과 출력까지 전 과정 수행 가능

 

SPSS Modeler 특징

  • 다양한 데이터 접근 (DB에서 직접 추출 가능)
  • 유연한 데이터 핸들링
  • 시각화 기능 (도표, 그래프 등)
  • 다변화 작업 용이 (History 형태의 스트림으로 직관적)
  • Bulk Loading: 대용량 데이터를 빠르게 DB로 출력 가능
  • 다양한 모델링 분석기법 (다양한 분석 알고리즘 보유, 자동 모델링 기능 등)
  • 강력한 추가 모듈과 R이용 확장 기능 추가 (텍스트 분석, 소셜네트워크 분석, 개체 분석 등 고급 분석 기법 추가)

UI 구성

- Stream Canvas

- Nodes Palettes (소스: 데이터 불러오기, 레코드 작업: 레코드 처리, 필드 작업: 변수들 컬럼들, 그래프: 시각화, 모델링: 알고리즘)

- 출력: 분석 결과 보여줌

 

모형 구축 과정

1. 데이터의 연결

2. 데이터의 탐색

3. 데이터의 조작

4. 모델링

 

"유형" 노드에서 "역할"을 "목표"로 선택하면 독립변수로 선택된다.

 


01. 군집분석을 활용한 카드 고객 분류

  • 목적: 카드 고객 정보를 활용하여 고객들을 유사한 그룹으로 묶어 보고, 분류된 군집에 따라 어떤 마케팅 전략을 수행할지 생각해 본다.
  • 데이터: 신용 카드 고객 5,000명에 대한 인구통계학적 정보, 고객과 은행과의 관계 정보, 과거 대출 캠페인에 대한 고객들의 반응 정보 포함.
  • 변수 설명
변수 설명
ID 고객 아이디
Gender 성별
HouseOwn 자택 소유 여부
Experience 직장 경력 기간
Income 연간 수입
ZIPCode 우편번호
Family 가족 구성원 수
CCAvg 산용카드 평균 사용 금액 (월)
Education 교육 정도 1=대학교, 2=대학원, 3=Ph.D
Mortgage 주택 담보 대출 정도
Personal Loan 지난번 고객이 개인융자를 받았는가?
Securities Account 유가 증권 계정을 가지고 있는가?
CD Account 양도성 예금증서를 가지고 있는가?
Online 고객이 인터넷 뱅킹을 사용하는가?

 

종속 변수 없음. 고객에 대한 일반적인 정보.

묶는 기준: 독립변수. 이런 이런 관점에서 비슷한 애들끼리 모였으면 좋겠다 라고 독립변수를 선정.

만약 이 데이터를 다 집어넣게 되면 모든 데이터의 관점에서 제일 가까운 사람들을 묶어주게 됨.

독립변수 선정을 통해 목적이 반영됨. 전혀 관계가 없는 건 선택하지 x.

어떤 것이 가까운 사람끼리 묶였으면 좋겠는지 군집화를 해보라.

 

진행 절차

1. 데이터 분석

2. 독립변수로 할 변수 결정

3. 모형구축방법론 선택해 군집해보기

4. 의미가 있는 군집으로 나왔는지 점검

5. 군집 특성 이름 붙여보기 (라벨링)

그 군집에 맞는 마케팅 플랜 할 수 있는 것인지 보기.

 

 

내가 선택한 독립변수: Age, Experience, CCAvg, Personal Loan

 

K-평균

 

결과

 


02. 연관규칙 분석을 활용한 화장품 구매 패턴 분석

  • 목적: 화장품 구매와 관련된 연관 규칙을 도출하여 매장의 상품 진열 순서나 패키지 상품의 구성, 또한 교차판매 전략수립에 활용하고자 한다.
  • 데이터: 화장품 거래 1,000건
  • 변수 설명:
변수 설명
Pmethod 지불방법 (C: 신용카드, M: 현금)
Membership 멤버십 여부
Income 수입
Bag 가방
blush 볼 터치
Nail Polish 매니큐어
Brushes 브러쉬
Concealer 컨실러
Eyebrow Pencils 아이브로우 펜슬
Bronser  브론저
Lip liner  립 라이너
Mascara 마스카라
Eye shadow 아이 쉐도우
Foundation  파운데이션
Lip Gloss  립 글로스
Lipstick  립스틱

 

지불방법, 멤버십, 수입 같은 건 상품 분석할 땐 쓰지 않아야.

1: 샀다, 0: 안샀다

어떤 상품 구매에 있어서 연관 관계가 있는가?

 

association rule 기법, 장바구니 분석을 돌릴 때는 대상 변수가 범주형이거나 명목형이어야 한다. 연속형이 되면 그 연속형 실수 값 하나하나를 다 케이스로 봐서 의미없는 룰이 나옴.

 

범주형이거나 최소한 명목형이어야. 이것을 가지고 연관관계를 분석.

이를 통해 교차판매 프로모션. 판매 촉진 전략을 수립해볼 수 있게 됨.

 

"컨실러를 사면 아이라이너를 산다"/"아이라이너를 사면 컨실러를 산다" 양쪽방향 변수 (입, 출력 다 가능)

 

control parameter: support, confidence, lift

레벨을 잡아놓아야

 

아래 사진과 같이 역할을 설정하였고

 

사진과 같은 결과를 얻었다.


03. 다중회귀분석을 활용한 중고차 가격 예측