반응형
반응형

연관규칙분석(Association Rule Analysys)이란 그냥 나열되어 있는 원본 데이터들에 대해서 데이터들간의 연관관계를 탐색하는 무방향성 데이터마이닝 기법중에 하나이다.

보통 마트의 고객들이 구매한 상품간의 연관관계를 찾을 때 많이 사용되는 분석기법이라서 '장바구니 분석' 이라고도 한다.  예를 들어.. 남성 고객이 마트에 가서 구매한 품목을 보니깐 맥주와 기저귀를 같이 구매하는 경우가 많이 나타나면 마트 진열대에 맥주와 기저귀를 같이 배치하는 한다던지 (매장진열), 또 라면을 살때 스윙칩을 같이 사는 형태가 많이 발견된다면 이 두 상품을 합친 패키지 상품을 개발한다던지..(GS25의 오모리김치찌게맛 스윙칩) 여성 고객은 편의점에서 주로 우유와 커피라서 편의점에 들어가면 진열대 가장 잘 보이는 곳에 우유와 커피 제품을 진열하는 것을 볼수 있는데 이런 것들이 모두 연관규칙분석을 통해 효과적인 매장 진열, 패키지상품의 개발, 교차판매 전략수립에 많이 이용된다.

 

연관규칙의 특징

특징 설명
장바구니 분석 구매 내역 분석을 통해 동시에 구매될 가능성이 있는 상품의 연관관계를 찾는다.
또는 A제품을 구매 후 B제품을 구매할 가능성이 높은 경우 해당 제품들을 나란히
진열을 하는 경우.
자율학습기법
(Unsupervised Learning)
자율학습의 반대말인 지도학습을 먼저 설명하면 지도학습(supervised Learning)이란 이미 목표변수, 목표값이 정해진 상태에서 데이터를 분석하는 것을 말하며, 자율학습이란 목표변수, 결과값을 모르는 상태에서 데이터를 분석해서 데이터간의 관계를 분석해서 결과값을 도출해내는 분석기법이다. 자율학습기법에 대표적인 것이 바로 연관규칙분석이다.  
   1) 자율학습기법 (Unsupervised Learning)
        - 연관규칙분석
        - 군집분석 :  수많은 데이터들을 2개그룹, 3개그룹 등으로 분류
   2) 지도분석기법 (Supervised Learning)
        - 신경망 분석
        - 의사결정나무 분석
        - 사례기반
        - 로지스틱 회귀분석
탐색적 기법 조건반응(if then else)으로 표현되므로 이해가 쉬윔
 - 만일 A가 일어난다면 B가 일어난다. 
 - 상품 A를 구매하면 상품 B도 구매를 한다.
 - 어떤 Item 집합의 존재가 다른 Item 집합의 존재를 암시
즉 함께 구매하는 상품의 조합이나 패턴을 파악
목적변수 미존재 목적변수(Target Variable) 없이 특성의 조합으로 규칙을 표현하며, 특정한 변수가 아닌 모든 변수 또는 특성에 대하여 예측
규칙간의 독립성 규칙들 간에는 서로 영향을 주지 않기 때문에 하나의 고객이 여러 개의
규칙에 해당 될 수 있음


연관규칙 도출과정

Apyori - 연관규칙분석(Association Rule Analysys)

Apyori is a simple implementation of Apriori algorithm with Python 2.7 and 3.3 - 3.5, provided as APIs and as commandline interfaces.

https://github.com/ymoch/apyori

Installation

Choose one from the following.

  • Install with pip pip install apyori.
  • Put apyori.py into your project.
  • Run python setup.py install.

 

https://anaconda.org/auto/apriori   

 

 

연관규칙 측정기준

< 출처 : 정보관리기술사 118회 모임 - 두드림 >

 

연관규칙의 결과 유형

결과유형 설명
Useful Result 분석결과가 마케팅 측면에서 유용한, 쓸만한 결과가 나옴.
예) 맥주와 기저귀 상품과의 구매관계
Trivial Result 어떤 새로운 분석결과가 아닌 기존 마케팅 정책에 의해 연관성이 높게 나온 경우
먼가 새롭게 발견된 구매패턴이 아니고 기존 마케팅 활동 결과로서 예상이 되는
결과를 말함.
예) 정비계약을 맺은 고객이 많은 설비를 구매하더라..  -> 이는 정비계약에 의해
     자연스럽게 따라오는 설비 구매 형태일뿐
Inexplicable Result
(설명할수 없는 결과)
의미를 발견하기 위해 많은 고민이 필요한 경우
예) 새로 철물점을 개업하면 화장시 문고리가 많이 팔림.. -> 연관관계가 있는건지
     고민이 필요함..



활용분야

분야 내용
교차판매 (Cross Selling)
묶음판매 (Bundling)
A제품을 구매한 고객이 B제품을 추가로 구매할 수 있도록 유도하는 전략에 사용
예) 맥주와 기저귀, 양복과 넥타이
상품진열 고객의 구매패터을 고려하여 매대상품을 진열
예) 편의점에 제일 잘보이는 곳에 우유와 커피를 나란히 진열
부정탐지 (Fraud Detection) 신용카드나 보험금 수령 패턴을 분석하여 도난카드나 보험사기 행위를 적발
Catalog Design 상품의 배치문제, 패키지 상품의 구성, 쿠폰발행, 카탈로그의 구성, 신상품의카테고리 설정 등에 활용 가능
첨부 우편물 우편물 내용과 첨부파일과이 관계분석


연관규칙의 주의점


1. 연관규칙분석은 원인과 결과 즉 인과관계를 찾는 게 아니라는 것이다. 맥주가 원인이고 기저귀가 결과라는
   뜻이 아니라 , 맥주와 기저귀가 같이 조합을 이룬다는 뜻이다..
2. 연관규칙 즉 자율탐색기법(Unsupervised Learning) 은 목표변수(Target Variable) 이 없다.. 이 말이  
   무슨 말이냐면.. 연관규칙 분석에 의해 나온 결과값에 대해서 맞다, 안맞다 를 판단하는게 아니라는
   뜻이다. 예를 들어 맥주를 산 고객은 기저귀를 같이 구매를 한다 라고 결과가 나왔지만 이 것이
   정답이 아닐수도.. 즉 맥주를 산 고객이 무조건 기저귀를 사는 것은 아니라는 뜻이다.

 

반응형
반응형

프로젝트 가상공간에 들어가서

> conda install -c anaconda networks

 

https://pypi.org/project/networkx/

 

networkx

Python package for creating and manipulating graphs and networks

pypi.org

Installers  - https://anaconda.org/anaconda/networkx

conda install 

  •  linux-ppc64le  v2.2
  •  linux-64  v2.2
  •  win-32  v2.2
  •    noarch  v2.6.3
  •  osx-64  v2.2
  •  linux-32  v2.2
  •  win-64  v2.2
To install this package with conda run:
conda install -c anaconda networkx
반응형
반응형

악마가 될 직원은 뽑지마라

How Leaders Create a High Performance Culture | Ian McClean | Talks at Google

https://www.youtube.com/watch?v=auojtsHPIM8 

The 7 Do's and Don'ts that form an effective leader's operating system! In this talk you will hear from business leader, consultant, facilitator, coach and writer Ian McClean, on how leaders create a winning, dynamic high-performance culture. Founder of Flow Group, Ian has worked with international leaders and organisations to improve their performance for over 25 years. Today he focuses on the neuroscience behind Greenline Communications & the importance of separating intention from impact and how to save time through better interactions. Moderated by Karoline O'Sullivan.

 

효과적인 리더의 운영 체제를 구성하는 7가지 해야 할 일과 하지 말아야 할 일! 

이 강연에서는 비즈니스 리더, 컨설턴트, 촉진자, 코치 및 작가 Ian McClean으로부터 리더가 성공적이고 역동적인 고성능 문화를 만드는 방법에 대해 듣게 될 것입니다. 

Flow Group의 설립자인 Ian은 25년 넘게 국제 지도자 및 조직과 협력하여 성과를 개선해 왔습니다. 

오늘날 그는 Greenline Communications의 이면에 있는 신경 과학, 의도와 영향을 분리하는 것의 중요성, 더 나은 상호 작용을 통해 시간을 절약하는 방법에 중점을 둡니다. 

Karoline O'Sullivan이 중재했습니다.

 


반면 또 다른 빅테크인 구글은 선량한 인재를 뽑는 방식으로 이러한 딜레마를 피하려고 해요. 구글은 작년 기준으로 전 세계에 139995명에 달하는 직원들을 두고 있는데요. 채용 절차가 까다롭기로 정평이... 특히 직원수가 2만명에 불과할 때도 채용 담당자만 1000명이 넘었다는 도시 전설이 있고요.

 

일반적인 기업은 적당한 인재를 뽑아서 엄청난 고과를 주고 관리를 하지만, 구글은 반대로 채용에 온 신경을 쓰는 조직이에요. 한때 한 명을 뽑는데 평균 150~500시간을 들인다는 소문도 있었고요. 이를 통해 구글이 얻는 것은? 조직 문화를 망칠 직원이 들어오는 것을 방지하는 것이죠. 크게 세가지 원칙이 있대요.

 

·         시키지 않아도 자발적으로 한다

·         지적인 겸손함을 발휘한다

·         그럼에도, 머무려는 사람은 차단한다

 

구글의 선발은 크게 자기반성(Self-reflection)→일자리 찾기→이력서 작성→온라인 제출→인터뷰→선발인데요. 특히 자기반성 부분부터 숨이 턱! 첫문장을 읽어보면? "혹시, 열정을 내고 싶지 않은 일을 잘한적이 있나요? 사실 흥미롭지 않은 일에 성과를 내기는 어렵거든요. 아래 몇가지 중 스스로에 물어보세요."

 

·         혼자하는 것이 성과가 좋나요? 팀으로 하는 것이 성과가 좋나요?

·         문제를 직접 해결하는 것이 좋나요? 팀워크로 얻는 성과가 많나요?

·         함께 일한 최고의 팀을 설명해 보세요.

 

이력서를 통과해도 빡센 것은 마찬가지. 인터뷰 절차? 전화 인터뷰 30~60분씩 두차례. 현장 면접 약 5명과 각각 45분씩 진행. 이 절차를 통과하면 고용위원회에서 적합한 일을 찾아보고, C레벨의 리뷰를 받고 드디어 채용! 이런 과정을 거치다 보니, 실제로 이곳에서 만난 구글러들의 성품은 매우매우 훌륭했어요.

반응형
반응형

일을 더 잘하게 합시다. - reWork withgoogle.com

 

구글에서는 설문을 통해 리더들이 9가지 원칙을 점검하는지 스스로를 되묻게 한대요. 한번씩 읽어볼만 해요.

 

1.     직원들이 성과를 낼 수 있도록 "실행 가능한" 피드백을 주세요.

2.     팀원을 인간답게 배려해주세요.

3.     세세하게 관리하지 마세요.

4.     관점이 달라도 존중해 주세요.

5.     결과를 달성하도록 해주세요

6.     정보사항을 제대로 공유해 주세요

7.     더 나아가, 팀원들의 경력이 쌓일수 있도록 멘토링해주세요

8.     목표치 명확하게 전달해 주세요.

9.    이제 당신은 훌륭한 리더입니다.

 

https://rework.withgoogle.com/

 

re:Work

Let's Make Work Better. Research, ideas, and practices from Google and others, to put people first.

rework.withgoogle.com

일을 더 잘하게 합시다.

re:Work는 사람을 최우선으로 생각하는 데 도움이 되는 Google 및 기타 업체의 사례, 연구 및 아이디어 모음입니다.

re:Work with Google에 대해 자세히 알아보세요. 

 

About re:Work

Let's Make Work Better. Research, ideas, and practices from Google and others, to put people first.

rework.withgoogle.com

시작하다

re:Work는 직장에서 영향력을 미칠 수 있는 방법을 중심으로 구성되어 있습니다. 각 주제에는 특정 과제를 해결하기 위한 도구와 통찰력이 포함되어 있습니다.

  • 목표 설정목표를 설정하여 노력을 조정하고, 목표를 전달하고, 프로세스를 측정합니다.
  • 고용직무 설명, 구조화된 인터뷰, 고용 위원회 등을 통해 더 나은 고용 결정을 내립니다.
  • 혁신혁신을 위한 기술을 구축하고 이를 직장의 일부로 만드는 방법을 배우십시오.
  • 학습 및 개발학습을 모든 사람의 업무의 일부로 만들어 직원이 성장하고 발전할 수 있도록 역량을 강화하십시오.
  • 관리자무엇이 훌륭한 관리자인지 파악하고 피드백과 개발 기회를 제공하십시오.
  • 사람 분석과학과 데이터를 사용하여 정보에 입각한 객관적인 결정을 내립니다.
  • 팀 효율성과 심리적 안전을 촉진하는 방법을 검토합니다.
  • 편향되지 않음모든 사람을 교육하고, 측정하고, 책임을 지도록 함으로써 무의식적 편견의 영향을 줄입니다.

 

반응형
반응형

 

Mlxtend (machine learning extensions) is a Python library of useful tools for the day-to-day data science tasks.

 

https://github.com/rasbt/mlxtend 

 

GitHub - rasbt/mlxtend: A library of extension and helper modules for Python's data analysis and machine learning libraries.

A library of extension and helper modules for Python's data analysis and machine learning libraries. - GitHub - rasbt/mlxtend: A library of extension and helper modules for Python's data an...

github.com

Installing mlxtend

PyPI

To install mlxtend, just execute

pip install mlxtend  

Alternatively, you could download the package manually from the Python Package Index https://pypi.python.org/pypi/mlxtend, unzip it, navigate into the package, and use the command:

python setup.py install

Conda

If you use conda, to install mlxtend just execute

conda install -c conda-forge mlxtend 

반응형
반응형

pandas documentation - python

 

https://pandas.pydata.org/docs/index.html

 

pandas documentation — pandas 1.4.1 documentation

The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key concepts.

pandas.pydata.org

 

반응형

+ Recent posts