導航:首頁 > 源碼編譯 > reddit演算法

reddit演算法

發布時間:2024-01-11 05:24:29

① 從豆瓣電影評分演算法說起

在PingWest看到一篇《豆瓣電影打分規則竟如此簡單粗暴…》,作者寫這篇文章是因為豆瓣創始人阿北最近寫了一篇博文《豆瓣電影評分八問》,阿北博文是為了回應一些外界對豆瓣電影評分的質疑,然後作者看到這篇博文後,覺得豆瓣電影的評分演算法有點low,就寫了這樣一篇吐槽文章。

那麼這個很low的演算法究竟是什麼樣子的呢?此處引用阿北原文。

簡單說就是計算每部電影評論的算數平均值,並按此值來排名。

對這個演算法持懷疑態度,因為如果按照這神手個演算法的話,假設一部小眾文藝片有10個用戶給了全五星,和一部經典老片比如《十二怒漢》相比,小眾文藝片排名比《十二怒漢》還要高,不過這在豆瓣電影TOP250裡面不太可能。阿北可能只是為了文章寫作方便或是保密起見,把演算法故意說簡單了,因為假如豆瓣公布了詳細的演算法,那電影發行方的水軍們十分有可能針對這個演算法制定出有效的刷分策略的。可憐我還真信了。

下面是阿北當年在知乎上的 回答 。

順著PingWest這篇文章給的鏈接,我又去阮一峰博客看了他在2012年寫的《基於用戶投票的排名演算法》系列文章,以及這些文章里的參考文章,發現排名演算法很好玩很有趣,非常有收獲,推薦閱讀。

看完這些文章,我就想知道知乎的評論排名演算法是怎麼樣的,於是去知乎找到他們產品經理 @黃濤的回答 ,知乎在2014年底更新的演算法使用的正是Reddit在2009年引入的評論排名演算法,也就是阮一峰老師在系列文章第5篇中介紹的「威爾遜區間」演算法。在用這個演算法之前,知乎用的是直接利用好評減去差評的結果來給評論排序,這種演算法的缺點我就不介紹了,可以查看參考資料[1]。

「威爾悉磨遜區間」演算法的數學基礎是數學家Edwin B. Wilson在1927年提出的威爾遜區間修正公式,後來芝加哥工程師Evan Miller在2009年寫了一篇 博客 ,認為該修正公式睜瞎斗可以用來做排名。

這個演算法的核心思想是這樣的:

因為常見的置信區間計算公式「正態區間」不能很好的照顧小樣本數量的准確性,而威爾遜提出的修正公式能很好地修正小樣本數量的准確性問題,所以大家採用「威爾遜區間」演算法較多,像Reddit、Yelp、Digg,還有知乎。

不過這種演算法也有缺點,缺點就是對於那些得票少的新評論很難獲得出頭之日,因為得票少,置信區間就會寬,排名位置就會低,得到的關注也就會更少。

前面阿北的回答裡面提到了IMDB,IMDB是亞馬遜旗下的一個類似豆瓣的電影排名網站,他們在處理TOP250電影排名問題時採用了「貝葉斯平均」演算法來解決,這個演算法的核心思想是既然新興產品的評分數量很少,那我就為你人工補償一定的投票。關於這種演算法在阮一峰老師系列文章第6篇中有介紹。

更多參考資料:

閱讀全文

與reddit演算法相關的資料

熱點內容
android公網ip 瀏覽:611
要塞1地圖放哪個文件夾 瀏覽:848
凡科建站怎麼弄伺服器 瀏覽:939
蘋果手機怎麼設置app播放 瀏覽:202
下載網站源碼用什麼瀏覽器 瀏覽:241
六線譜pdf 瀏覽:156
linuxmysqlsock 瀏覽:239
人教版數學pdf下載 瀏覽:460
文檔安全加密系統 瀏覽:491
數控銑床編程簡單數字 瀏覽:788
編程電纜如何重啟 瀏覽:121
myqq命令行發消息 瀏覽:365
日產逍客怎麼使用app升窗 瀏覽:503
安卓系統怎麼快速刪除微信內容 瀏覽:653
csharppython 瀏覽:409
程序員脖子按摩儀 瀏覽:562
小米桌面文件夾亂碼怎麼回事 瀏覽:858
點歌台app怎麼連接 瀏覽:318
大學電腦編程學什麼好 瀏覽:348
上哪裡取消應用加密 瀏覽:172