본문 바로가기
정보통신기술/개발 방법론·PM

PageRank 1 (개요)

by plog 2010. 12. 17.

PageRank란?

월드 와이드 웹과 같은 하이퍼링크 구조를 가지는 문서에 상대적 중요도에 따라 가중치를 부여하는 방법이다. 
이 알고리즘은 서로간에 인용과 참조로 연결된 임의의 묶음에 적용할 수 있다.페이지랭크는 스탠퍼드 대학교에 재학 중이던 래리 페이지와 세르게이 브린이 새로운 검색 엔진에 대한 연구 기획의 일부로 개발되었다. 

이 기획은 1995년 시작되어, 1998년 구글이라 불리는 시범 서비스로 발전하였다. 페이지와 브린은 페이지랭크에 기반한 검색 기술을 바탕으로 구글 사를 설립하였다.

PageRank 개요

1)

페이지별 hyperlink의 카운터를 계산하여 공식에 대입하여 랭킹을 구한다.
공식에 대입후 가장 큰 score가  상위 랭킹에 위치한다.

2)

얼마나 많은 페이지가 자신을 hyperlink를 걸고 있는지 계산한다.

3)

양질의 페이지가 자신을 hyperlink를 걸고 있는지 계산한다.

4)

자신을 hyperlink하는 페이지가, 또 다른 페이지들을 hyperlink하고 있는지 계산한다.

5)

d: damping factor
D: 페이지의 갯수

6)

power iteration 



'정보통신기술 > 개발 방법론·PM' 카테고리의 다른 글

개발자에게 꼭 필요한 정신자세  (0) 2011.03.04
PageRank 2 (예제)  (0) 2010.12.17
웹 크롤러 (crawler)  (0) 2010.11.19
Software artifact란  (1) 2010.06.02
Code Inspection Tool - PMD 사용법  (0) 2010.05.31

댓글