일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 체크인미팅
- 생활코딩
- 인디게임
- EC2
- 위키북스
- 게임개발동아리
- 자바개발자
- 백엔드
- 프로그래밍
- 티스토리챌린지
- 백엔드개발자
- 스프링부트
- UNICON
- 도커
- 개발공부
- 오블완
- 온라인테스트
- 라피신
- 스프링
- UNIDEV
- CICD
- 전국대학생게임개발동아리연합회
- 프리티어
- RDS
- 42서울
- AWS
- Developer
- 인프라
- 배포
- UNICON2023
- Today
- Total
Hyun's Wonderwall
[SPSS] 군집분석을 활용한 카드 고객 분류, 연관규칙 분석을 활용한 화장품 구매 패턴 분석, 다중회귀분석을 활용한 중고차 가격 예측 본문
[SPSS] 군집분석을 활용한 카드 고객 분류, 연관규칙 분석을 활용한 화장품 구매 패턴 분석, 다중회귀분석을 활용한 중고차 가격 예측
Hyun_! 2024. 12. 1. 19:00SPSS Modeler 데이터 마이닝 솔루션
대용량 데이터로부터 유용한 정보를 쉽고 정확하게 찾아내기 위한 데이터 마이닝 소프트웨어.
데이터 로딩, 변환, 정제, 모델링, 그래프, 결과 출력까지 전 과정 수행 가능
SPSS Modeler 특징
- 다양한 데이터 접근 (DB에서 직접 추출 가능)
- 유연한 데이터 핸들링
- 시각화 기능 (도표, 그래프 등)
- 다변화 작업 용이 (History 형태의 스트림으로 직관적)
- Bulk Loading: 대용량 데이터를 빠르게 DB로 출력 가능
- 다양한 모델링 분석기법 (다양한 분석 알고리즘 보유, 자동 모델링 기능 등)
- 강력한 추가 모듈과 R이용 확장 기능 추가 (텍스트 분석, 소셜네트워크 분석, 개체 분석 등 고급 분석 기법 추가)
UI 구성
- Stream Canvas
- Nodes Palettes (소스: 데이터 불러오기, 레코드 작업: 레코드 처리, 필드 작업: 변수들 컬럼들, 그래프: 시각화, 모델링: 알고리즘)
- 출력: 분석 결과 보여줌
모형 구축 과정
1. 데이터의 연결
2. 데이터의 탐색
3. 데이터의 조작
4. 모델링
"유형" 노드에서 "역할"을 "목표"로 선택하면 독립변수로 선택된다.
01. 군집분석을 활용한 카드 고객 분류
- 목적: 카드 고객 정보를 활용하여 고객들을 유사한 그룹으로 묶어 보고, 분류된 군집에 따라 어떤 마케팅 전략을 수행할지 생각해 본다.
- 데이터: 신용 카드 고객 5,000명에 대한 인구통계학적 정보, 고객과 은행과의 관계 정보, 과거 대출 캠페인에 대한 고객들의 반응 정보 포함.
- 변수 설명
변수 | 설명 |
ID | 고객 아이디 |
Gender | 성별 |
HouseOwn | 자택 소유 여부 |
Experience | 직장 경력 기간 |
Income | 연간 수입 |
ZIPCode | 우편번호 |
Family | 가족 구성원 수 |
CCAvg | 산용카드 평균 사용 금액 (월) |
Education | 교육 정도 1=대학교, 2=대학원, 3=Ph.D |
Mortgage | 주택 담보 대출 정도 |
Personal Loan | 지난번 고객이 개인융자를 받았는가? |
Securities Account | 유가 증권 계정을 가지고 있는가? |
CD Account | 양도성 예금증서를 가지고 있는가? |
Online | 고객이 인터넷 뱅킹을 사용하는가? |
종속 변수 없음. 고객에 대한 일반적인 정보.
묶는 기준: 독립변수. 이런 이런 관점에서 비슷한 애들끼리 모였으면 좋겠다 라고 독립변수를 선정.
만약 이 데이터를 다 집어넣게 되면 모든 데이터의 관점에서 제일 가까운 사람들을 묶어주게 됨.
독립변수 선정을 통해 목적이 반영됨. 전혀 관계가 없는 건 선택하지 x.
어떤 것이 가까운 사람끼리 묶였으면 좋겠는지 군집화를 해보라.
진행 절차
1. 데이터 분석
2. 독립변수로 할 변수 결정
3. 모형구축방법론 선택해 군집해보기
4. 의미가 있는 군집으로 나왔는지 점검
5. 군집 특성 이름 붙여보기 (라벨링)
그 군집에 맞는 마케팅 플랜 할 수 있는 것인지 보기.
내가 선택한 독립변수: Age, Experience, CCAvg, Personal Loan
K-평균
결과
02. 연관규칙 분석을 활용한 화장품 구매 패턴 분석
- 목적: 화장품 구매와 관련된 연관 규칙을 도출하여 매장의 상품 진열 순서나 패키지 상품의 구성, 또한 교차판매 전략수립에 활용하고자 한다.
- 데이터: 화장품 거래 1,000건
- 변수 설명:
변수 | 설명 |
Pmethod | 지불방법 (C: 신용카드, M: 현금) |
Membership | 멤버십 여부 |
Income | 수입 |
Bag | 가방 |
blush | 볼 터치 |
Nail Polish | 매니큐어 |
Brushes | 브러쉬 |
Concealer | 컨실러 |
Eyebrow Pencils | 아이브로우 펜슬 |
Bronser | 브론저 |
Lip liner | 립 라이너 |
Mascara | 마스카라 |
Eye shadow | 아이 쉐도우 |
Foundation | 파운데이션 |
Lip Gloss | 립 글로스 |
Lipstick | 립스틱 |
지불방법, 멤버십, 수입 같은 건 상품 분석할 땐 쓰지 않아야.
1: 샀다, 0: 안샀다
어떤 상품 구매에 있어서 연관 관계가 있는가?
association rule 기법, 장바구니 분석을 돌릴 때는 대상 변수가 범주형이거나 명목형이어야 한다. 연속형이 되면 그 연속형 실수 값 하나하나를 다 케이스로 봐서 의미없는 룰이 나옴.
범주형이거나 최소한 명목형이어야. 이것을 가지고 연관관계를 분석.
이를 통해 교차판매 프로모션. 판매 촉진 전략을 수립해볼 수 있게 됨.
"컨실러를 사면 아이라이너를 산다"/"아이라이너를 사면 컨실러를 산다" 양쪽방향 변수 (입, 출력 다 가능)
control parameter: support, confidence, lift
레벨을 잡아놓아야
아래 사진과 같이 역할을 설정하였고
사진과 같은 결과를 얻었다.
03. 다중회귀분석을 활용한 중고차 가격 예측