導航:首頁 > 源碼編譯 > Google更新應用排名演算法

Google更新應用排名演算法

發布時間:2024-08-14 01:43:15

『壹』 Google和百度SEO有哪些區別

網路seo與谷歌seo總結如下18條,具體如下:
1: 網路與谷歌優化區別—內鏈規則
SEO博客 www.dfsseo.com

網路非常看重網站的首頁,網路的權重按首頁到內頁依次降權,所以網路要好的排名就從首頁抓起。而谷歌不一樣,谷歌不太關心網站的深度問題,這樣
就導致在谷歌有些網站的二級或者更低級的頁面有比較好的排名的原因。另外,網路對做好內部的鏈接也非常重視,一個好的內部鏈接,既有利於網路蜘蛛爬行,又
利於用戶的體驗。總之,網路對網站的內部比較重視點,而谷歌對網站的外部鏈接質量比較重視點。

Google基本不考慮鏈接的深度問題,他所考慮的是符合檢索者,所以很多低一級的目錄頁面很容易得到好的排名。而網路對待鏈接深度有一定的等級制度,首頁權重最高,內頁則會下降一個等級。

2、網路與谷歌優化區別—新站頁面收錄時間

網路對新站的收錄往往比谷歌要慢,一個新站谷歌往往在1到2天內就收錄,網路也許需要更長的時間,在內頁的收錄上谷歌收錄速度快而且很快放出
來,而網路即使很快收錄了首頁,但是對新站內頁的收錄特別慢,即使是收錄了放出來也很慢,這就是很多新網站的站長經常會問,為什麼網站被網路收錄了,但是
發表的文章網路總是沒有收錄而谷歌早就收錄了。

說了那麼多,很多人可能會認為網路優化和谷歌優化會有很的區別,其實不然,網路優化和谷歌優化本質是一樣的,只是有些細節不同而已。不要迷信谷歌優化和網路優化的不同,一個真正的SEO高手往往在谷歌優化和網路優化都能做得不錯,

網路喜歡從一個網站的鏈接找到另外一個網站,我現在做站一般都不去提交,而是找幾個蜘蛛經常去的站加幾個鏈接,交換友情鏈接,開個新浪博客,基本上只要收錄很快網站也會收錄。然後慢慢的更新,慢慢的收錄。通過鏈接來讓搜索引擎收錄是個不錯的選擇。

google喜歡看你一個網站的更新度與內容,如果內容重復就會變成了補充資料。更新這個環節,其實不管對什麼搜索引擎都是一個很重要的因素。誰也不喜歡一潭死水的站,因為對互聯網貢獻不大,搜索引擎當然不會重視。我們經常說的互聯網精神就是共享,貢獻。

從新站收錄的時間來講,google快於網路,網路對於新站不會立刻收錄,甚至相當長的時間內都不會收錄,只有通過網路的考驗期後,網路才會大量收錄該站點內容,這需要很長一段時間,這點通常都讓站長們感到焦急。

一般情況下谷歌的收錄要比網路快,只要在谷歌登陸入口提交網址或者是在一些比較活躍網站做一些外鏈,很快便會被谷歌收錄;網路對於新站不會立刻
收錄,甚至相當長的時間都不收錄,新網站通過網路的考核期後,網路才開始收錄你的網站,這個考核期對於很多站長來說是比較難熬的,考核期的時間有時候確實
讓人琢磨不透,有的網站甚至一個多月兩個月才開始收錄,也有的網站兩三天就收錄了,如果說是一些高質量的網站收錄快,質量較差的網站收錄慢也能理解,可是
據我了解一些非法的網站、質量很差的網站也有很多很快就被收錄了,這就讓人有些琢磨不透了。我的這個博客上線第二天谷歌就收錄了,第二十天才被網路收錄。
谷歌和網路對與新站的收錄上規則是明顯不一樣的,谷歌一般是一開始不管你網站內容的質量就開始大量的收錄,然後再慢慢的審核篩選和刪除,這也是一些網站為
什麼剛收錄的時候收錄的頁面還挺多的,可是過一段時間以後收錄的頁面就變少的原因。而網路一般是先通過一段時間對你網站內容的審核,才開始收錄你的網站,
可能大蜘蛛很早就抓取你的網頁了,可是要過好長時間才釋放出來。

3、網路與谷歌優化區別—排名優化規則

google比網路慢,因為對於新站google有一個沙盒效應,新站優化的再好,六個月之內也可能沒有很好的排名!不過沙盒是可以避免的,這
就需要SEO人員去好好規劃和設置了!因為google排名本身就比網路慢!優化不可一下子過多,要循序漸進,不能操之過急。網路可能當你收錄後就可能排
名很靠前,而Google不會這樣,當然各搜索引擎排名也有其自身不確定的因素.需要各站長們自己在seo實踐中進行總結。

網路關鍵詞排名經常大起大落,經常是優化到一段時間,所有的關鍵詞會同時提升,流量也會突然暴漲,對於新站的關鍵詞排名,網路要快於谷歌,一般
是被收錄後,關鍵詞密度高的往往很快獲得很好的排名,但是不久排名就會下降,而且只要網站被懲罰,網路上的排名可能在一夜之間全部消失,而谷歌則不是這
樣,谷歌對新站考核期比較長,新站要想在谷歌中有好的排名,需要一步一步的去優化,也就是谷歌對網站的排名處理總是循序漸進的過程,在幾個月的時間內平穩
的增長,即使網站作弊,只要不是很嚴重關鍵詞排名也不會一夜之間全部消失。

以下是總結的網路和google的排名規則:

網路的排名規則:

<1>、網路喜歡收錄title里為單個關鍵字的網頁,並且排名很靠前。

<2>、網路喜歡收錄靜態的以關鍵字命名的目錄或者html文件。排名當然也很靠前。

<3>、網路喜歡給title關鍵字列表裡面的,列表內容含有的title關鍵字多的頁面排名靠前。

<4>、網路喜歡把頂級域名首頁title里的關鍵字排名靠前,並且不論是alexa是多少,都有挺靠前的排名。(要求當然是頂級域名的,而且是首頁文件,超級熱門的關鍵字除外。)

<5>、網路喜歡從其他優秀網站自動收錄你的網站,比如我在網路空間發表的文章裡面含有自己網站的地址,那麼網路會自動收錄的。而且速度比較快。

<6>、建議大家使用的meta標簽:

google的排名規則:

<1>、google喜歡把網站地址含有關鍵字的網站排名靠前。

<2>、google喜歡收錄網站地圖。

<3>、google網站管理員工具。相信有很多站長都知道這個工具但很少聽人介紹他的加速功能,沒錯!他能加速google對你
網站的收錄使你的網站被他收錄得更多,就是在你登陸google網站管理員工具以後點擊管理你的站點,裡面有個工具菜單,打開他你可以看到設定檢索速率
,你根據他的提示把速率提升到較快就可以了。

4、網路與谷歌優化區別—外鏈權重

谷歌重視的是鏈接的相關性,網路不僅重視相關性,而且還考慮連接的廣泛度。所以新站需要投放大量的高質外鏈來增加網站的權重。不管怎樣,只要是
高質量的站點,網路和Google都會喜歡的。網路非常在意外鏈的數量,但同樣重視質量,但是谷歌比網路更加看重外鏈的質量。綜合這一點來看谷歌給內文鏈
接權重比較高,便網路給首頁外鏈權重比較高。所以說,我們做網站優化時,我們應該既要做好外鏈的數量,更要做好外鏈的質量。這樣都做好了,網路和谷歌才能
同步發展。

在對待外鏈上,谷歌對外鏈很重視,查看谷歌排在前幾十位的網頁外部鏈接,你就會發現比較一致的趨勢,排在前面的通常比排在後面的外部鏈接質量
高,數量也多,哪怕你的網站比較垃圾,但是如果擁有大量高質量相關的外鏈,你的網站也可以得到比較好的排名;但是在網路,如果你網站太垃圾的話,高質量的
外鏈對你的幫助是沒有谷歌那麼大的。不管怎麼說只要是高權重、高質量的外鏈,網路和谷歌都會喜歡,對提升你網站的權重和排名都是有幫助的,只是幫助的大小
上有些區別。

在對待外鏈上,網路不僅僅要鏈接的相關度,也要鏈接的廣泛度;而谷歌更多考慮的是鏈接的相關性和時序性,谷歌比網路更加看重外鏈,哪怕你的網站
比較垃圾,但是如果擁有大量高質量相關的外鏈,你的網站也可以得到比較好的排名;但是在網路,如果你網站的太垃圾的話,高質量的外鏈對你的幫助是沒有谷歌
那麼大的。不管怎麼說只要是高權重、高質量的外鏈,網路和谷歌都會喜歡,對提升你網站的權重和排名都是有幫助的,只是幫助的大小上有些區別;如果能把網站
質量提高、內容做好,再加上高質量的外鏈,不管是在網路和谷歌都能取得好的排名的。

5、網路與谷歌優化區別—內容喜好偏重

網路偏重於游戲,娛樂,音樂,休閑生活等類,就像一個小夥子,如網路很喜歡的貓撲。google偏重於技術類,
google像一個技術前輩,喜歡原創,也喜歡有技術含量的東西。其中有很多判斷原創的因素,其中就有網頁的反向鏈接,收錄的時間,PR值的高低等等,很
多因素加在一起決定了你的網站的排名和權重。

6、網路與谷歌優化區別—分詞方法與演算法

網路和谷歌SEO優化的分詞方法有區別,網路是中國,谷歌更傾向於英文,所以說在分詞的時候,網路和谷歌大有不同。網路谷歌分詞技術的很大不
同,只能說網路更懂中文。所有我們不要選一些容易讓搜索引擎分錯的關鍵詞,不然吃虧的是自己。
谷歌不知道分詞的時候要用描文本鏈接來提示它,這個描文本無論站內的站外的都可以。我們可能都有這樣的體驗,我們網站的主關鍵詞明明已經排到網路的第一
頁,而在谷歌卻排在第二頁或是第三頁,為什麼呢?經過研究發現就是因為網路和谷歌的分詞方法不同而造成的,所以說我們一定做好關鍵詞的描文本鏈接來提示。

自身的演算法方面:網路沒有一個標準的演算法,可能有多套演算法,因此排名也不穩定,一直會變動,而谷歌的演算法基本上可以說是定下來了,這就給新站更有了機會去
提高排名,而網路給新站都是沒有排名的。分詞技術的不同,經常導致一些排名結果的不一樣。所以說,當你SEO選擇關鍵詞,或者是給網站起名字,寫MATA
代碼等工作的時候,千萬記住了。一定要弄一個網路跟谷歌都不會分錯的詞。這樣對於你的
SEO結果來說。無論是網路,還是谷歌都可以獲得很好的排名,這就不少人在網路SEO的時候,最後谷歌的排名也上去了的一些原因吧。

7、網路與谷歌優化區別—頁面收錄

網路和谷歌SEO優化的頁面收錄有區別,這個收錄的區別主要是谷歌對圖片站可以很寬容,即使文字內容不多也會收錄,但是對於網路而言就不是這樣
了,網路很難識別圖片,當蜘蛛爬進我們的頁面的時候就有些摸不到頭腦了,網路蜘蛛識別圖片的能力比較差,所以說網路要先觀察一個周期沒發現異常才會放出
來,收錄的數量也沒有谷歌多。而谷歌比網路更能接受圖片站。綜合這一點來看,我們做網站優化的時候就應該針對網路和谷歌收錄內容的區別來優化網站,內容圖
片和文字的一定都要做好。

8、網路與谷歌優化區別—外鏈錨文本

網路和谷歌SEO優化的外鏈錨文本有區別,而這個區別主要表現在:網路和谷歌都比較看重錨文本外鏈,兩者相對而言谷歌比網路更加註重外鏈錨文
本。例如拿一個人的權威必做網站的權重,別人對這個人的評價必做描文本,網路更注重這個人的權威,而谷歌更注重老百姓對他的評價,即用戶體驗度。兩者重視
的方向不同,所以就會出現不同的收錄情況。但對於我們做站長的而言,我們要做的就是既要注重外鏈錨文本的數量,同樣注重外鏈錨文本的質量,這樣一來,網路
和谷歌我們就做好同步的優化。

9、網路與谷歌優化區別—網站內容更新頻率:

網路對網站更新比較看重,持續有規律的增加內容往往可以有效的提高在網路的排名,谷歌似乎對網站內容的更新沒有網路那麼敏感,有些網站幾年不更新內容,但是排名往往沒有下降。

網路喜歡一直更新內容的網站,這就是為什麼那麼多站長都會堅持著重新自己的文章的原因,而谷歌,不太看重,有些網站不經常更新,排名也可以穩定,若網路這樣的話,排名可能很就掉了幾名。
10、網路與谷歌優化區別—網站頁面權重:

網路似乎很多網站的權重主要都集中在首頁,二三級頁面似乎比首頁要低一個等級,所以二三級頁面的關鍵字排名靠前的比較少,而谷歌對所有
的頁面一視同仁,不管是首頁還是內頁,在搜索結果頁面上,谷歌較多的返回網站內頁,而要想在網路上獲得比較好的排名,經常需要靠首頁,當然很多大網站內頁
在網路的排名也是不錯的。

11、網路與谷歌優化區別—對於網站內容頁

在對待網站的內容頁的關鍵字排名上谷歌和網路應該說也是有一些比較大的區別的,個人覺得谷歌比網路考慮更多的是搜索結果要更加符合搜索者的需
求,所以很多二三級頁面在谷歌也能得到一個比較好的排名;然而在網路似乎很多網站的權重主要都集中在首頁,二三級頁面似乎比首頁要低一個等級,所以二三級
頁面的關鍵字排名靠前的比較少。

12、網路與谷歌優化區別—對待原創與轉載

網路對於轉載的文章,如果是在權重比較高的網站,搜索文章的時候往往會把權重高的放在前面,而原始的博客比較靠後,而谷歌不一樣,谷歌比較重視
原創的網站,只有轉載的文章都帶有原創文章的地址,搜索文章的時候,排在前面的就是原創的網站。這也是一部份人說谷歌搜索比較准確的原因。

網路喜歡抓取一個內容頁的第一部分內容,當然title的重要性仍是不言而喻的。我們在添加文章或者網站信息的時候,對第一段的文字要適當的加工一下。

大家自己注意把握。網路目前好像還是天天小更新,一周基本上有個大點的更新,大家摸索到他的脾氣後會更好的做站。

google還是喜歡抓取描述這一部分內容。比較喜歡嚴謹點的東西。描述的寫法就是把核心的關鍵詞寫進去,但是寫的時候要不留一點痕跡。一般而言,通順符合一般說話的語言是比較好了,不能太長。

13、網路與谷歌優化區別—懲罰規則:

網路相對於谷歌較多的為人工干預,而谷歌基本上不參與人工干預。網路比谷歌看重你網站的代碼title,MATA,H1
H2等等,網路也比較喜歡title裡面只有當頁的關鍵字的網站,這樣有可能得到比較好的排名。另外,網路對於國內的一些熱點詞語比較敏感,比如說當前的
溫州動車事件,如果你的網站出現,網路就更有可能去你的網站觀顧。

網路比較喜歡從高權重的網站里收錄你的網站,比如說我在一高權重的網站發表了文章,文章裡面有我們的網址,這樣我們的網站就比較快被收錄,這種高權重網站,我覺得網路空間為首選,畢竟也是網路自己的產品。

網路如果把你的一個站突然降權了,相信這是一個調整,會在二天內調整回來,權重可能有一些小降!因為搜索引擎的演算法是不斷改變的,你只能是摸索,適應。

以上八點就是關於網路和谷歌SEO優化時的區別,我們做為站長的掌握了網路和谷歌的區別,那麼我們才能找到更好的針對網路和谷歌的找到優化方
法,只有這樣,我們才能百戰百勝,俗話說的好,知已知彼方能戰無不勝,就是這個道理。網路和谷歌我們需要利用好,才能有利於我們網站的發展,互聯網依賴於
搜索引擎,而搜索引擎同樣依賴於互聯網的網站。

14、網路與谷歌優化區別—公正公開

網路不公平,不公正,不公開,有很大的漏洞可以鑽;

谷歌公平,公正,公開,很容易優化,對新站很友好,但是給新站每天帶來的流量很少很少,少到可以忽略不計

15、網路與谷歌優化區別—操作難易度

做SEO的朋友都知道Google優化簡單,網路優化難琢磨,呵呵,

因為Google按照標准來就行了,但是網路不行,所以說SEO就是一個研究與試驗的過程。

15、網路與谷歌優化區別—優化風格

網路靠內在修為,這也是老生常談的話題了。的確如此,網路非常看重你網站的代碼title,MATA,H1
H2等等。當然還有你的內部鏈接數量,你內部鏈接的質量。還有你網站的內容,我經常,網路跟谷歌是不同的MM泡他們需要不同的手段[網路是時尚MM,那麼
Google就是時尚女性]
。網路對於一些新潮敏感的詞彙,給與的抓取權重是非常高的。比如現今的殘奧會,如果你的網站有這個內容,那麼網路的蜘蛛爬行速度是非常快的。GOOGLE

的蜘蛛爬行還是靠你外部鏈接的數量決定的。所以來說。GOOGLE更注重你網站的外部鏈接。你的網站外部鏈接越優秀,谷歌就會認為你的網站越好。如果你有
一篇原創的文章,被大量的轉載,然後轉載的鏈接都有一條地址,指向你的原文。那麼谷歌就會認為。哦,這個是你的內容,很好大家都喜歡,NICE。然後他就
會經常回訪你的網站。

其實如果你針對GOOGLE優化來說,最好放棄自己網站上的description,keywords,這些內容乾脆什麼都不寫,讓谷歌自己去認。這樣的
優點就是,相同的頁面,可以符合更多的關鍵詞。遠遠比你寫在代碼裡面要多的多,如果你在keywords裡面寫入很多的關鍵詞的話,谷歌會認為你這樣不
好,可是當你的頁面的確有很多關鍵詞,而且代碼裡面沒固定寫什麼關鍵詞的話。谷歌就會自己進行匹配。。所以。他自己作的事。你說他自己認為好不好。

網路更注重的就是網站的用戶體驗度,也就是我們所說的網站要保持更新,保持原創,如果某個網站的回頭率比較搞的話,用戶停留的時間比較長,內容比較多的話網路的排名肯定會更好!

而GG更注重網站的外鏈,這一點我絕對有體會,我曾經用了兩個小時的時間手動發鏈接把一個幾乎沒有任何文字的網站的一個關鍵從第三頁弄到首頁的底三位(當然關鍵詞不是很熱!),也就是說要想自己網站要想在GG上有個好的排名,外鏈是很重要的!

但網路就不行了!他講究的是用戶的體驗度的問題講究的是網站的質量,這也就是很多的網站公司為什麼不承諾把網站做個網路的首頁,而承諾做在GG
的首頁,以為他們無法改變網站的體驗度的問題!他們不可能每天都去更新別人的網站(網路公司每個seoer同時有幾十個網站),他們只能來拚命的加網站的
外鏈!我的良心比較好一點,我不用群發!

16、網路與谷歌優化區別—優化重視點:

我們常常講「內容為王,外鏈為皇」,就seo實際而言,網路注重的是「王」,而GG注重的是「皇」。從這也就看出來了,為什麼網路會霸佔中國的市場,而GG在中國只能在門外!這也就是為什麼國人們如此喜歡網路了!

說明一點:我所說的網路注重網站的內容,沒有說網路不需要外鏈!GG注重外鏈,如果是熱門的關鍵詞的話,還是要內容的!

網路優化:網路更傾向於網站內部的因數,包括原創內容、網站結構、關鍵字布局、內部鏈接等,當然外部鏈接也很重要但網路對其不是很感冒。

google優化:外部鏈接就是王牌,就算你的網站有點垃圾,但擁有大量高質量的內容相關的外部鏈接,google排名也不錯。

網路優化:網路對內容的豐富、關鍵字密度、html代碼規范、RSS很敏感,對外部鏈接重視程度不如google。

『貳』 為什麼我的網站在google很快就有了排名,而百度卻一直沒有,百度和google的SEO有什麼區別

對於不同搜索引擎的優化,原理是相通的,基本方法也大同小異,只是在一些細節有不同罷了。不同搜索引擎的未來趨勢是越來越相似,SEO人員應該更多地考慮搜索引擎的相似之處。只要抓住SEO的根本原理,做好基礎優化,一般來說所有的搜索引擎排名都會不錯,不同的搜索引擎上細微差別造成不同的排名是正常的,但對一個優秀的網站來說,不會有太大的區別。

在收錄方面,Google很容收錄新的網站,一個新網站上線後,如果有幾個相對不錯的外鏈,Google就會很快收錄新網站,網站上內容就是轉載的文章不是原創,影響也不會太大。但是GOOGLE有沙盒效應,收錄容易,想獲得好的排名就比較難了。網路正好相反,新網站讓網路收錄是一個難題,要需要比較長的考核期。但是一旦被收錄,比較容易獲得排名和流量。網站在開始的時候原創性對於網路來說比較重要。

網路對首頁比較看重,對內頁相對要次要,而GOOGLE對所有頁面一視同仁,不管是首頁還內頁,在搜索結果時,Google返回的內頁想對要多。而要在網路獲得好的排名,而是需要首頁,因此可能會影響網站架構及不同關鍵詞在網站上的分布處理。

Google對外鏈接很重視,對頁面內容則沒有這么敏感。經常看到排在第一頁的頁面中,關鍵詞在頁面上出現一次的也沒有,有的出現十次的也有。但是還是建議大家把關鍵詞密度控制在2%到8%之間。Google對於關鍵詞在頁面上出現在的次數、位置、看不出明顯、有規律的偏好。而查看排在前幾十位的頁面的外部鏈接,排在前面的通常比排在後面的外部鏈接質量高,數量也多。

網路對外部鏈接的依賴性相對要小,對頁面的相關性卻比較敏感,主要體現在,在網頁的正確位置出現關鍵詞有助於排名,但對關鍵詞顯得堆積時更容易引來懲罰。相對於GOOGLE不會因為關鍵字出現多次給予好的排名,也不會因為關鍵詞出現次數給予懲罰。

網路排名經常大起大落,而GOOGLE對網站的排名總是漸近式的,在幾個月的時間內平穩增長。網路上的排名可能在一夜之間全部消失。網路對網站更新比較看重,持續有規律增加內容往往可以有效地提高在網路的排名。GOOGLE對更新沒有這么敏感,當然持續更新肯定是好事。總的來說。本質上各搜索引擎沒有區別,只要大家做好基本優化工作就可以了。
希望能夠幫助你!

『叄』 百度和Google的搜索演算法,技術有何差異

我們直接分析博百優在網路和谷歌首頁排名情況,就可以知道,網路與谷歌的排名演算法有較大的出入,不過隨著時間的推移,這種差異會越來越小,畢竟搜索引擎排名的核心思想都是差不多的,都是給用戶提供最實用的信息。
一、分析谷歌與網路的細節異同
1、從這次比賽看來,谷歌對新站有特別照顧機會,前期會獲得不錯的排名,不過,慢慢的又會降下來,網路雖然對新站也有特別照顧機會,不過和老網站比起來,這些機會幾乎看不到了。
2、網路的老站權重繼承
很明顯,這次比賽,大部分人都是通過修改標題形式參賽,所以在短時間內都在網路獲得不錯的排名,這都利益於老站權重的繼承,看誰原站的權重高,在前期就排的最前面,谷歌似乎這種情況不太明顯,改了標題後,就會從新對你考察,考察你的相關內容是否豐富,是否相關性很強,在決定你的排名情況,而不考慮以前權重有多高。
3、雖然網路和谷歌對外鏈的數量和質量影響網站權重的重要因素,但谷歌更注重外鏈的質量上,如果你的站外鏈質量非常多,一般都能獲得不錯的排名。
4、對原創文章的分析上,谷歌分析水平比網路更高,對原創質量要求更高,偽原創分辯能力更強。這一點不得不承認谷歌技術的先進。
5、谷歌對主域名排名更具有優先權,博百優官方網子論壇,雖然外鏈和內容上都遠遠超過其它參賽站點,但在谷歌前幾頁都找不到博百優官方網子論壇,期重要原因是谷歌對主域名具有更高的權重。
二、分析以下幾個重要因素的異同
1、原創方面
網路和谷歌對原創都非常看重,內容為王,這是永久的真理,不過谷歌對原創文章質量分析能力更強。
2、外鏈方面
無論是網路和谷歌,外鏈絕對是影響排名的重要因素,質量比數量更重要,但谷歌更看重高質量的外鏈,對排名的作用會更大一些。
3、內容相關性方面
無論哪個搜索引擎,內容與主題越相關,排名肯定更有優勢,,但放在一起對比,發現,谷歌對內容高度相關的站點,更具有排名優先權。而網路可能還會去考察其它因素。
4、快照方面
這一點二者都一樣,快照越新,相應權重會越高一些,但要在其它重要因素的前提下才能發揮作用。這個分析並不是很權威,有些可能和大家所想的有出入,不過沒關系,這個分析是初版,以後會總結和分析出更完美版,請關注!

『肆』 了解google用來對網頁進行排序的pagerank演算法,明確哪些因素會影響網頁的pager

一、網頁排名和谷歌演算法的誕生
在谷歌誕生之前那段時間,流行的網頁排名演算法都很類似,它們都使用了一個非常簡單的思想:越是重要的網頁,訪問量就會越大,許多大公司就通過統計網頁的訪問量來進行網頁排名。但是這種排名演算法有兩個很顯著的問題:
1、因為只能夠抽樣統計,所以統計數據不一定準確,而且訪問量的波動會比較大,想要得到准確的統計需要大量的時間和人力,還只能維持很短的有效時間。
2、訪問量並不一定能體現網頁的「重要程度」,可能一些比較早接觸互聯網的網民還記得,那時有很多人推出了專門「刷訪問量」的服務。
那有沒有更好的方法,不統計訪問量就能夠為網頁的重要度排序呢?
就是在這種情況下,1996年初,谷歌公司的創始人,當時還是美國斯坦福大學研究生的佩奇和布林開始了對網頁排序問題的研究。
在1999年,一篇以佩奇為第一作者的論文發表了,論文中介紹了一種叫做PageRank的演算法(具體演算法可查看馬海祥博客《pr值是什麼》的相關介紹),這種演算法的主要思想是:越「重要」的網頁,頁面上的鏈接質量也越高,同時越容易被其它「重要」的網頁鏈接。
於是,演算法完全利用網頁之間互相鏈接的關系來計算網頁的重要程度,將網頁排序徹底變成一個數學問題,終於擺脫了訪問量統計的框框。
二、模擬PageRank演算法的運行過程
在詳細講述這個演算法之前,不妨讓我們用一個游戲,先來簡單模擬一下PageRank演算法的運行過程,以便讀者更好地理解。
三兄弟分30顆豌豆,起初每人10顆,他們每次都要把手裡的豌豆全部平均分給自己喜歡的人,下圖表示了三兄弟各自擁有的初始豌豆數量,以及相互喜歡的關系(箭頭方向表示喜歡,例如老二喜歡老大,老大喜歡老二和老三)。

第一次分配後,我們會得到結果如下:

就這樣,讓游戲一直進行下去,直到他們手中的豌豆數不再變化為止。
那麼這個游戲到底是否可以結束呢,如果可以,最終的結果又是什麼樣的?
在此我們用電腦模擬了這個過程,得出的結果是:老大和老二的盤子里各有12顆豌豆,而老三的盤子里有6顆豌豆,這時候無論游戲怎麼進行下去,盤子里的豌豆數量都不會再變化。
看到這里,讀者可能會問:這個游戲和網頁排序有什麼關系?
實際上,PageRank會給每個網頁一個數值,這個數值越高,就說明這個網頁越「重要」。
而剛剛的游戲中,如果把豌豆的數量看作這個數值(可以不是整數),把孩子們看作網頁,那麼游戲的過程就是PageRank的演算法,而游戲結束時豌豆的分配,就是網頁的PageRank值。
三、PageRank演算法的數學模型
不同於之前的訪問量統計,PageRank求解了這樣一個問題:一個人在網路上瀏覽網頁,每看過一個網頁之後就會隨機點擊網頁上的鏈接訪問新的網頁。
如果當前這個人瀏覽的網頁x已經確定,那麼網頁x上每個鏈接被點擊的概率也是確定的,可以用向量Nx表示。
在這種條件下,這個人點擊了無限多次鏈接後,恰好停留在每個網頁上的概率分別是多少?
在這個模型中,我們用向量Ri來表示點擊了i次鏈接之後可能停留在每個網頁上的概率(則為一開始就打開了每個網頁的概率,後面我們將證明的取值對最終結果沒有影響)。很顯然R i的L1範式為1 ,這也是PageRank演算法本身的要求。
仍以上面的游戲為例,整個瀏覽過程的一開始,我們有:

其中,A表示每一次點擊鏈接概率的矩陣,A的第i列第j行的含義是如果當前訪問的網頁是網頁i,那麼下一次點擊鏈接跳轉到網頁j的概率為 。
這樣設計矩陣A的好處是,通過矩陣A和向量相乘,即可得出點擊一次鏈接後每個網頁可能的停留概率向量。例如,令,可以得到點擊一次鏈接後停留在每個網頁的概率:

之後一直迭代下去,有:

對於上面的例子,迭代結果如下圖:

由上圖我們可以看到,每個網頁停留的概率在振盪之後趨於穩定。
在這種穩定狀態下,我們可以知道,無論如何迭代,都有,這樣我們就獲得了一個方程:

而整個迭代的過程,就是在尋求方程R = AR的解,而無論是多少,迭代無限多次之後,一定會取得令R = AR成立的R值,整個求解R的過程,就如同一個人在一張地圖上的不同位置之間隨機地行走一樣,所以被稱為「隨機行走模型」。
隨機行走模型有一個顯著的特點,那就是每一次迭代的結果只與前一次有關,與更早的結果完全無關,這種過程又被稱為馬爾可夫過程(Markov Process)或馬爾可夫鏈(Markov Chain)。
馬爾可夫過程的數學定義是:如果對於一個隨機變數序列, 其中X n表示時間n的狀態及轉移概率P,有:

即只受的影響,則此過程成為馬爾可夫過程。其中稱作「一步轉移概率」,而兩步、三步轉移概率則可以通過一步轉移概率的積分求得。
當狀態空間有限時,轉移概率可以用用一個矩陣A來表示,稱作轉移矩陣(transition matrix),此時轉移概率的積分即為矩陣的冪,k步轉移概率可以用表示,這也是隨機行走模型中的情況,而對於一個正的(每個元素都為正的)轉移矩陣A ,可以證明一定有:

這就完整解釋了為什麼的取值對最終結果沒有影響。
四、修正「懸掛網頁」帶來的不良影響
但是這里有一個問題:即便的取值對最終結果沒有影響,用R作為網頁排序的依據是否真的合理?
在馬海祥看來,這個其實並不合理,因為當一個網頁只有鏈入鏈接沒有鏈出鏈接的時候,這個網頁就會像一個「黑洞」一樣,將同一個連通子圖中其它網頁流向它的PageRank慢慢「吞掉」(因為演算法中虛擬的用戶一旦進入那樣的網頁,就會由於沒有對外鏈接而永遠停留在那裡),這種網頁我們稱之為「懸掛網頁」(Dangling Link)。
這種「黑洞」效應是如此顯著,以至於在一個連通性良好的互聯網上,哪怕只有一個「懸掛網頁」,也足以使整個互聯網的網頁排序失效,可謂是「一粒老鼠屎壞了一鍋粥」。
為了解決這個問題,佩奇和布林進行了修正,他們意識到,當用戶訪問到「懸掛網頁」時,都不可能也不應該就停留在了這個頁面,而是會自行訪問其它網頁。
雖然對每個用戶來說,自行訪問的網頁與各人的興趣有關,但馬海祥覺得從平均意義上來講,佩奇和布林假定用戶將會在整個互聯網上隨機選取一個網頁進行訪問。
所以他們給PageRank演算法加入了一個新的向量E,它的作用是,按照其中所描述的比例來向全部網頁分配懸掛網頁每一次「吞掉」的PageRank。
這樣,相當於為懸掛網頁添加了鏈向網路上全部網頁的鏈接,避免了懸掛鏈接的出現。
以上就是谷歌背後最重要的PageRank演算法奧秘,與以往那種憑借關鍵詞出現次數所作的排序不同,這種由所有網頁的相互鏈接所確定的排序是不那麼容易做假的,因為做假者再是把自己的網頁吹得天花亂墜,如果沒有真正吸引人的內容,別人不鏈接它,一切就還是枉然。
而且「佩奇排序」還有一個重要特點,那就是它只與互聯網的結構有關,而與用戶具體搜索的東西無關,這意味著排序計算可以單獨進行,而無需在用戶鍵入搜索指令後才臨時進行,谷歌搜索的速度之所以快捷,在很大程度上得益於此。
馬海祥博客點評:
最後,我要強調的一點是,雖然PageRank是Google搜索結果排序的重要依據,並以此發家,不過它並不是全部依據,實際上,Google發展到現在,已同時用了數百種不同的演算法來確定最終顯示給用戶的搜索結果順序。

閱讀全文

與Google更新應用排名演算法相關的資料

熱點內容
怎麼在dos窗口打開python 瀏覽:588
怎麼通過網頁取伺服器ip 瀏覽:789
android系統發展前景 瀏覽:852
了8解壓密碼 瀏覽:633
單片機的定時器資源是計數器 瀏覽:628
黃鑽石的圖標是什麼app 瀏覽:774
mac白色文件夾問號 瀏覽:720
怎麼申請郵箱的伺服器 瀏覽:13
c項目兩個工程怎麼編譯 瀏覽:645
知乎app有什麼作用 瀏覽:451
單片機帶的比較器 瀏覽:391
程序員都是精英 瀏覽:19
10種編程語言 瀏覽:749
綿陽學駕駛手機上下什麼app 瀏覽:129
python如何模擬網頁操作 瀏覽:40
單片機多文件編譯方法 瀏覽:839
不動產壓縮時間 瀏覽:571
租房管理平台源碼 瀏覽:65
復樂園pdf 瀏覽:457
程序員找到公交車 瀏覽:698