1 / 21

Google のページランク

S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. Google のページランク. 基本的な仕組は数学的 グラフの行列による表現 隣接行列(推移行列、遷移行列) 固有値と固有ベクトル. 行列の上と左の W, S, C, G は注釈 であり行列に含まれない. S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. 隣接行列を転置する. 隣接行列       を 転置 する リンクを「出す」側から「受ける」側へ. 1. 1. 1. 1/3. 1/3. S 学部. C 学科. 1/3. W 大学.

teagan-rich
Download Presentation

Google のページランク

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. S学部 C学科 W大学 G研究室 WEBページのリンクの関係 Googleのページランク • 基本的な仕組は数学的グラフの行列による表現隣接行列(推移行列、遷移行列)固有値と固有ベクトル 行列の上と左のW, S, C, Gは注釈であり行列に含まれない

  2. S学部 C学科 W大学 G研究室 WEBページのリンクの関係 隣接行列を転置する • 隣接行列       を転置するリンクを「出す」側から「受ける」側へ

  3. 1 1 1/3 1/3 S学部 C学科 1/3 W大学 G研究室 WEBページのリンクの関係 隣接行列から推移確率行列へ • 列(column)の総和が1または0になるように調整ページの評価値をリンク先に渡す

  4. 推移確率行列の固有値と固有ベクトル • 固有値λと固有ベクトルr • 行列 M を掛ける(乗算)ということは、グラフの辺に沿って(確率的に)推移するということである • 固有ベクトルの各要素は M を掛けても定数倍しか変化しない。(安定している)固有ベクトルの各要素がランクになる(ただし要素の和が1となるように正規化する)

  5. 2/9 S学部 C学科 1/3 1 1 1/3 1/3 W大学 G研究室 1/3 1/3 固有ベクトルの具体例 • GNUOctaveを使って計算する。固有値λ=1が最大の固有値であり、固有ベクトルは下の左のようになる。 • これを正規化したページランクは上の右である。 ページランクを記入した図 1/9

  6. S学部 C学科 W大学 G研究室 Googleにおける工夫 • サイズの大きな疎(sparse)行列の固有ベクトルの計算 • ユーザがランダムにページを渡り歩くと仮定

  7. S学部 C学科 W大学 G研究室 Googleにおけるページランク • 次の行列の固有ベクトルを求めて、要素の和が1になるように正規化する。

  8. より深く調べるために • 本資料の例題は簡単にするために4つのサイトに閉じていた。現実のPageRankは早稲田大学(8/10)、理工学部(6/10)、CS学科(5/10)、後藤研(4/10)。 • 次の資料が参考になるhttp://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html本資料は上記を参考にした。ただしOctaveのスクリプトは若干改良した。 • Googleの創始者による論文も入手できる。Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', 1998,http://www-db.stanford.edu/~backrub/pageranksub.ps Taher H. Haveliwala, 'Efficient Computation of PageRank', Stanford Technical Report, 1999,http://dbpubs.stanford.edu:8090/pub/1999-31

  9. 特集:情報数学の演習問題 • 2005年度の定期試験問題の解答を解説します。2006年度の諸君の勉強の参考にして下さい。 • 次の事実に注意してください。2004年度の金曜日(前半)の担当は上田和紀教授、2005年度から担当を交代して後藤滋樹です。 • 本日の授業では3題を解説します。残り2題は来週以降に解説する予定。

  10. 問1.集合 A={ 2, 3, 4, 5 }, 集合 B={ 1, 3, 5, 7 }とするとき、次の(1-1)~(1-6)の集合を外延的に表現せよ。 • ヒント: 記号の意味を覚えておく必要がある

  11. 問1.解答 • ヒント: 各集合の要素の数を考えてみる

  12. 問2.自然数の集合 N は無限集合である。このとき集合 N 2が可算無限集合 (enumerable set, countable set) であることを示せ。 • ヒント: N 2という表記法を誤解しないように

  13. 問2.解答         は自然数の集合の直積である。     の要素<x,y>に自然数 を対応づける関数は全単射である。よって  と         とは対等で同じ濃度をもつ。 集合  が可算無限集合であるから   も可算 無限集合である。

  14. 問3.次の(3-1)~(3-3)で定義する各々の二項関係は、(a)反対称律、(r)反射律、(s)対称律、(t)推移律のどれを満たすか? (3-1)~(3-3)の各々について、満たす性質すべてを記号(a, r, s, t)で答えよ。

  15. 問3. (3-1) A は2次元平面上のすべての点の集合で、関係 R は「点 x は点 y よりも原点より遠くない」と定義される。 (3-2) Aは2次元平面上のすべての直線の集合で、関係 Rは「直線 xと直線 yが平行である」と定義される。 (3-3) 有限集合 A={0, 1, 2, 3, 4} の上でRは R={<0,0>,<1,1,>,<2,2>,<3,3>,<4,4>}というグラフで定義される。

  16. 問3.解答 (3-1) r, t (3-2) r, s, t (3-3) a, r, s, t

  17. レポートの提出方法(2006年度 後藤担当) • レポート用紙を下記のURLからプリントする http://www.goto.info.waseda.ac.jp/~goto/infomath.html1班 (奇数班), と2班 (偶数班) で用紙が異なる • 提出場所は、60号館2階のCS学科事務所前のBOXBOX番号は掲示による • 締切厳守のこと提出期間は、2006年5月22日(月)~26日(金)の間

  18. 問1 集合の要素 • 次の集合に属するすべての要素を列挙せよ。 例: [1-1] (または  P (P (fg))) [1-2] ヒント: [1-2]では+の左と右の集合の要素の数を、まず数えてみる。      これは有限集合である。

  19. 問2 関数 • 次の集合に属する要素を具体的に一つ挙げよ。 N{0,1}×{2,3} ヒント: まず集合 {0, 1}×{2, 3} の要素を具体的に書いてみる。

  20. 問3 集合の濃度(可算集合) • 自然数の集合 N={0,1,2,…}の直積 N2=N×Nから N への関数 f(x,y)={(x+y)2+3x+y}÷2 を考える。(3-1) f(0,0), f(0,1), f(1,0) ,f(0,2), f(1,1), f(2,0)の値を計算せよ。(3-2) N2は可算集合であることを説明せよ。

  21. p q s r 問4 二項関係の反射推移的閉包 • 集合A = {p, q, r, s}上の二項関係R = {<p, q>, <q, r>, <r, s>, <r,r>}の反射推移閉包(すなわち R * )を求めよ. ヒント

More Related