목록추천시스템 (8)
Note

1. 알고리즘의 원리 자주 구매하는 아이템 셋의 하위 아이템 셋 또한 자주 구매될 것이다. 즉, 이를 통해 자주 구매되지 않은 아이템 셋은 하위 아이템셋 또한 자주 구매되지 않는다를 통해 규칙의 수를 줄이는 방법이다. 2. 알고리즘 진행 순서 ( * mlxtend는 !pip install mlxtend를 통해 설치해야 한다. ) 필요한 라이브러리를 임포트하고 데이터 셋을 생성한다. TransactionEncoder()를 통해 spars matrix 형태로 변경해준다. 항목집단에서 최소 지지도 0.5 이상인 값들만 뽑아준다. 추가로 association_rule을 사용해서 특정 성능 이상의 값들만 출력할 수 있다. 아래는 아이템 셋에서 향상도를 바탕으로 최소 값이 1 이상인 상품 셋을 보여준다. ( Oni..

1. 연관분석 연관분석이란 말 그대로 데이터 안에서 어떠한 연관을 가지고 있는지 찾아내는 것이다. 크게 두 가지로 정의할 수 있습니다. 첫 번째, 얼마나 같이 구매되는가? 두 번째, 한 아이템을 구매하는 사람이 특정 아이템을 구매하는가? 이와 같은 규칙을 찾아내는 것이 연관분석이며, 장바구니 분석이라고도 한다. 2. 연관분석 평가 지표 support (지지도) 항목 A의 전체 거래 건수 중에 모두를 포함하는 거래 건수의 비율. = 항목 A를 모두 포함하는 거래 수 / 전체 거래수 confidence (신뢰도) 항목 A를 포함하는 거래 중에서 B도 포함하는 거래 비율. = A와 B를 모두 포함하는 거래 수 / A가 포함된 거래 수 (조건부 확률) 신뢰도가 높을수록 유용한 규칙일 가능성이 높다. lift (..
1. 추천 시스템이란? 사용자의 과거 행동 데이터나 다른 데이터를 바탕으로 사용자에게 필요한 정보나 제품 등을 추천해주는 시스템이다. 이를 개인 사용자 맞춤형 추천과 서비스를 제공하는 것을 개인화라고 한다. 2. 추천 시스템 알고리즘 1) 협업 필터링 (CF, Collaborative Filtering) 구매한 제품에 대해 각 소비자에게 평가를 받고 평가 패턴이 비슷한 소비자를 집단화하고 그 집단에 속한 소비자들의 취향을 활용하는 기술. 단점으로는 소비자 평가 관련 데이터를 수집하기 어려울 수 있다. 2) 내용 기반 필터링 (CB, Content Based) 제품의 내용을 분석해서 추천하는 기술. 텍스트 정보가 많은 제품을 분석하여 비슷한 키워드에 해당하는 것을 추천할 때 많이 사용되는 기술이다. 3) ..