'ABCD/Data mining' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록ABCD/Data mining (6)

Worth spreading

Basic Collaborative-Filtering

MovieLens 데이터셋을 이용해 가장 기본적인 Collaborative Filtering을 Jupyter notebook으로 작성해보았습니다.다양한 의견 환영합니다. Github 바로가기

ABCD/Data mining 2018. 7. 21. 15:37

Feynman's restaurant problem

Multi armed bandit 위키피디아 글을 보던 중 external link에서 'feynman'을 발견했다. 굉장히 좋아하는 사람이라 반가웠지만 추천시스템글에 왜 물리학자가 링크되지? 라고 생각했다.어쨌거나 링크를 클릭해 들어가봤다. Feynman's restaurant problem이라는 제목의 글이었다.내용은 다음과 같다. 1970년 어느날 리처드 파인만과 랠프 레이턴이 자주 가던 식당에서 메뉴를 고르고 있었다. 메뉴를 고르던 중 둘은 가장 맛있었던 메뉴를 시키는 것과 새로운 메뉴를 시도해 보는 것 중 어떤 것이 더 나은지에 대한 이야기가 나누었고 이 문제를 수학적으로 분석했다. 파인만이 타계한 이후 2002년 마이클 고트립(Michael Gottlieb)이라는 물리학자는 랠프 레이턴에게 이..

ABCD/Data mining 2018. 6. 26. 12:26

Pagerank(페이지랭크)

Mining of Massive Datasets의 Link analysis 챕터에서 배운 내용 Pagerank는 웹페이지의 중요도를 구하기 위한 기법으로 어떤 page의 pagerank값은 그 page가 얼마나 중요한 page인지를 나타낸다)* Web page의 개수를 N개로 가정1. 행과 열의 개수가 모두 N인 행렬을 만든다.2. 만약 page j가 page i로 가는 링크를 갖고 있다면 행렬 M(i,j)는 1/c 값을 갖는다. (c는 page j의 outlink 개수) 이러한 행렬 M은 한 열의 값을 모두 합친 값이 1이 되므로 'column stochastic matrix'라고 부른다.3. 이제 pagerank를 저장할 벡터 r을 만든다. 모든 page는 각각의 pagerank값을 가지므로 r은 길..

ABCD/Data mining 2018. 6. 16. 21:14

Matrix Factorization _ Part3

이 글은 Nicolas hug씨의Understanding mtrix factorization for recommendation (part 3)을 한글로 번역한 글입니다. 오역이나 잘못 설명된 부분을 발견하신 분은 댓글로 알려주시면 감사하겠습니다. SVD for recommendation 지난 시간까지 잘 따라왔다면 SVD가 무엇인지, 그리고 SVD가 점수(rating)를 어떤 식으로 모델링 할 수 있는지에 대한 이해가 됐을 거라 생각한다. 그렇다면 이제 가장 중요한 이야기를 할 때다. SVD를 추천시스템에 어떻게 적용할지에 대해 이야기해보자. SVD로 점수를 예측하는 방법이라고도 할 수 있겠다. 맨 처음에 얘기했던 우리의 sparse matrix R을 다시 떠올려보자 우리의 목표는 여기서 '?'로 표시되..

ABCD/Data mining 2018. 6. 3. 22:28

Matrix Factorization _ Part 2

이 글은 Nicolas hug씨의Understanding mtrix factorization for recommendation (part 2)을 한글로 번역한 글입니다. 오역이나 잘못 설명된 부분을 발견하신 분은 댓글로 알려주시면 감사하겠습니다. SVD of a (dense) rating matrix Part2를 시작하기 전 지난시간 했던 것들을 짧게 복습해보자. 1) 행렬 R에 대한 PCA를 통해 typical user의 정보를 얻을 수 있다. 이 typical user는 original user와 같은 크기의 벡터이다. (creepy/typical guy 예제와 같은 맥락) 그리고 typical user가 벡터이기 때문에 우리는 typical user들을 열(column)으로 갖는 행렬을 정의할 수 ..

ABCD/Data mining 2018. 6. 2. 18:44

Matrix Factorization _ Part 1

이 글은 Nicolas hug씨의Understanding mtrix factorization for recommendation (part 1)을 한글로 번역한 글입니다. 오역이나 잘못 설명된 부분을 발견하신 분은 댓글로 알려주시면 감사하겠습니다. * rating은 점수, 점수를 주는 행위 두 가지 뜻으로 사용했으며 점수예측, rating prediction 등 단어를 섞어 썼으나 같은 뜻을 의미합니다. * factorizing도 인수분해라는 어엿한 한국말이 있지만 그 느낌을 더 살기 위해 영문을 그대로 사용했습니다. 10여년 전, Netflix는 영화점수예측(predicting movie rating) 알고리즘 공모전 'Netflix prize'를 개최했다. 3년간 많은 연구진이 참여했고 그 중 matr..

ABCD/Data mining 2018. 6. 2. 12:48

Prev 1 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Worth spreading

목록ABCD/Data mining (6)

Worth spreading

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역