导航:首页 > 源码编译 > 算法豆瓣

算法豆瓣

发布时间:2022-02-15 00:57:07

① 豆瓣的评分都是手动算出来的吧

首先要说,豆瓣的评分不是手动计算的。豆瓣的评分应该用了不只一个算法,而不是通过累加打分星数乘以百分比来算。

阿北在《豆瓣电影的分数和排序是怎么算出来的?》中是这样回答的:

豆瓣250里排序是综合分数和人数产生的,这个和IMDB总的想法类似。
每一部电影的分数,确实主要是平均分数,但不简简单单是。因为偶然要和影托或者其他非正常个人意见PK,算法考虑了很多因素,包括时间和打分者自身的情况。细节不便公开,而且经常在细调。原则是尽算法范畴的所有能力去接近和还原普通观众最原汁原味的平均观影意见。
有一个因素从来没有考虑过,就是商业合作。只要我在豆瓣,商业合作和分数不会有任何关系。

陈皓也在他的博文《腾讯,竞争力 和 用户体验》中提到:
对于豆瓣来说,豆瓣的每个用户都有个权威值,这个值通过用户的在线时间,发贴数量,访问次数,有没有高质量的文章,有没有参加社区活动,等等等因素,得出一个权威值。刚注册的用户权威值为0,如果有了一些负面的东西还有可能是负数,有些被社区所推崇的牛人级的用户的权威可能高达几千几万。这样,当水军和五毛们对一本书或是一个电影投票的时候,就算是数量大,但基本上没有什么作用。这就是为什么豆瓣里有的电影有70%的人投了三分或四分,但那个电影还是在快5分的样子。这就是为了维护社区的权威和质量的体现。淘宝的好评差评也是一样,但是如果可以被水军去冲的话,那就很没有意思了。看看大众点评网里的那些评论,很多都完全失去了权威。因为他们没有vote的机制。

② 豆瓣电影的评分标准是什么有何算法

豆瓣的注册用户看完一部电影,心情好的话会来打个一到五星的分(有时候心情不好也会来)。比方说一部电影有42万用户打分。我们的程序把这42万个一到五星换算成零到十分,加起来除以42万,就得到了豆瓣评分。

这个评分会自动出现在豆瓣各处,中间没有审核,平时也没有编辑盯着看。每过若干分钟,程序会自动重跑一遍,把最新打分的人的意见包括进来。

那42万用户里可能包括资深电影评论家,可能包括你、你的亲戚、你的小学同学、早晨卖你油条的那个人,也可能包括阿北我个人。但每个人都是一票。这个是“大众评审团”应该的含义:不是说团里的人全都大众,而是说和大众一样一人一票。

豆瓣的工作人员偶然收到“我明明给这个片子打了五星,为什么评分一点没变”的投诉的时候,除了心里嘀咕一下“哎,你拿这些红人/独生子女/八零后/九零后/零零后/数学不好的人怎么办”以外,会(或者应该)这样耐心解释:评分实际是变了,只是在小数点后四位,被四舍五入掉了。

但如果有几千个人和你一样都打五星的时候,分数就会变。

“一人一票”唯一的例外,是豆瓣的程序判断是“非正常打分”的帐号。这些打分会被排除在外。具体下面会说到。

豆瓣电影评分的主旨和原则,是“尽力还原普通观影大众对一部电影的平均看法”。这个主旨过去十年没变过,将来也不想变。

它并不是专家、影视从业人员或者资深人士对电影的看法,虽然这些看法会被豆瓣算在“普通观影大众”之内。所以有次听到“豆瓣电影评分不专业”的说法的时候,我的反应这是在说“大众不专业”,应该怪语文才是。个人认为汇总专家意见会是另一个很有价值的服务,但这个确实不是豆瓣评分的宗旨。


豆瓣简介

豆瓣(douban)是一家社区网站。网站由杨勃(网名“阿北”)[3]创立于2005年3月6日。该网站以书影音起家,提供关于书籍、电影、音乐等作品的信息,无论描述还是评论都由用户提供,是中国Web 2.0网站中具有特色的一个网站。

网站还提供书影音推荐、线下同城活动、小组话题交流等多种服务功能,它更像一个集品味系统(读书、电影、音乐)、表达系统(我读、我看、我听)和交流系统(同城、小组、友邻)于一体的创新网络服务,一直致力于帮助都市人群发现生活中有用的事物。2012年,豆瓣阅读上线,开始进入网上电子书版权领域。

(2)算法豆瓣扩展阅读:

豆瓣其他产品

1.豆瓣FM

豆瓣FM是你专属的个性化音乐收听工具,打开就能收听,可以用“红心”、“垃圾桶”或者“跳过” 告诉豆瓣FM你的喜好。豆瓣FM将根据你的操作和反馈,从海量曲库中自动发现并播出符合你音乐口味的歌曲,提供公共、私人和红心三种收听方式。在红心兆赫离线也能收听。

2.豆瓣读书- 豆瓣读书自2005年上线,已成为国内信息最全、用户数量最大且最为活跃的读书网站。我们专注于为用户提供全面、且精细化的读书服务,同时不断探索新的产品模式。到2012年豆瓣读书每个月有超过800万的来访用户,过亿的访问次数。


3.豆瓣阅读

豆瓣阅读是豆瓣读书2012年推出的数字阅读服务,支持 Web、iPhone、iPad、Android、Kindle等桌面和移动设备,自2012年5月7日作品商店上线以来,商店作品达600余部,用户评论3000余篇,有50万用户购买过付费或者免费作品。

豆瓣阅读的现有内容涵盖了小说、历史、科技、艺术与设计、生活等多种门类,定位为短篇作品和图书于一体的综合平台。


4.豆瓣音乐

豆瓣音乐是中国最大的音乐分享、评论、音乐人推广社区,拥有最完整的全球音乐信息库、最权威的用户音乐评论,和最具创造力的独立音乐人资源。汇集90多万音乐条目,包括小凡say、幼稚园杀手、MC光光、呆宝静等21000多位独立音乐人入驻,2011年全年平均每5分钟诞生一首原创音乐,覆盖粉丝超千万。

5.豆瓣同城

豆瓣同城是国内最大的线下活动信息发布平台,包括音乐/演出、话剧、展览、电影、讲座/沙龙、戏剧/曲艺、生活/聚会、体育、旅行、公益……专注于一线城市业余生活方式。

6.豆瓣小组

豆瓣小组于2005年上线,定位于“对同一个话题感兴趣的人的聚集地”,至今已有30多万个小组被用户创建,月独立用户超过5500万。内容包括娱乐、美容、时尚、旅行等生活的方方面面。用户在这里发布内容,同时也通过互动或浏览,发现更多感兴趣的内容。


③ 推荐一些关于算法的书籍

1、数据结构与算法分析:C语言描述(适合入门)

这本书相对于算法导论要简单一些,更适合入门。算法导论其实有比较强的理论性,看起来比较吃力。

《数据结构与算法分析:C语言描述》内容简介:书中详细介绍了当前流行的论题和新的变化,讨论了算法设计技巧,并在研究算法的性能、效率以及对运行时间分析的基础上考查了一些高级数据结构,从历史的角度和近年的进展对数据结构的活跃领域进行了简要的概括。由于《数据结构与算法分析:C语言描述(原书第2版)》选材新颖,方法实用,题例丰富,取舍得当。《数据结构与算法分析:C语言描述》的目的是培养学生良好的程序设计技巧和熟练的算法分析能力,使得他们能够开发出高效率的程序。从服务于实践又锻炼学生实际能力出发,书中提供了大部算法的C程序和伪码例程。

2、算法设计与分析基础(适合入门)

作者基于丰富的教学经验,开发了一套对算法进行分类的新方法。这套方法站在通用问题求解策略的高度,能对现有的大多数算法都能进行准确分类,从而使本书的读者能够沿着一条清晰的、一致的、连贯的思路来探索算法设计与分析这一迷人领域。本书作为第2版,相对第1版增加了新的习题,还增加了“迭代改进”一章,使得原来的分类方法更加完善。

3.0、算法引论:一种创造性方法(适合入门)

和普通的算法书不同,这本书从创造性的角度出发——如果说算法导论讲的是有哪些算法,那么算法引论讲的就是如何创造算法。结合前面的算法设计与分析基础,这本书把能解决的算法问题数量扩大了一个数量级。

3.1 算法竞赛 | 信息学奥赛一本通(算竞入门)

AlphaWA同学推荐的入门书籍,网上没有PDF版本,自己去淘宝买喽。

3.2 算法竞赛 | 算法竞赛进阶指南(算竞进阶)

④ 关于编程,练习算法的书籍,高手进

不知道你所说的对编程比较深入是什么概念,关于你的这个问题别人也问过,我之前已经回答过一遍了,请看这里:

http://..com/question/508446844.html?oldq=1

再次转帖一下,这里贴的书每一本都很靠谱,即使你学到博士毕业了还是值得一读再读。具体买这些书,请到豆瓣网上去找链接,如果买不到了,淘宝上有复印本。
计算机世界的经典着作犹如浩瀚的海洋,了不起的编程书籍还有很多。

Kernighan的《程序设计实践》是让你全面了解编程该做些什么的经典着作,尽管这书非常地薄。

cormen的《算法导论》和Skiena 《算法设计手册》是比《数据结构与算法分析》更大部头的巨着,内容极为丰富。

Bentley的《编程珠玑》(1,2卷)将带你领略算法的力量。

侯捷的《STL源码剖析》,深入讲解C++标准库的实现细节,让你真正见识顶尖高手的杰作。

stevens 的《unix环境高级编程》《unix网络编程》是程序员的进阶宝典,应当一读再读,因为你最终会明白,你的程序是运行在操作系统上的,是需要和网络交互的,你需要了解他们,和他们友好相处。

C++之父Bjarne Stroustrup的三本大作:《 C++程序设计语言 》、《C++程序设计原理与实践 》、《C++语言的设计和演化 》是C++语言的最权威的指南,同时也是经典编程着作。

Bryant的《深入理解计算机系统》都是能告诉你计算机底层做了什么工作,让你更好地理解计算机,更好地利用CPU的天书。

关于软件开发方面的经典着作有《程序员修炼之道》《代码大全》《重构》《设计模式》,在任何一个编程论坛的推荐表里,这些都是程序员必看图书。

还有一本书叫《计算机程序的构造和解释》,神一样的着作,它可以颠覆你的编程思维。

当然,计算机算法的顶尖之作要算knuth的《计算机程序设计艺术》(1-4卷),其内容极深极广极难,那真是如浩瀚之海洋,叹为观止了。

所谓术业有专攻,每个领域都有其经典的着作,这就要根据你个人的兴趣去进一步探究了。例如程序设计语言与编译器、操作系统内核、硬件设计、人工智能与机器学习、自然语言处理、信息论与信号处理、网络编程、机器人等等。

⑤ 网易云音乐的私人FM和豆瓣FM的推荐算法,哪个更好

后者,“带用户发现一首好歌带来的喜悦远远大于自己搜索所得”,走的是电台的路线,这比播放器就多了一份惊喜。推荐算法可不是网易云音乐的重点,只不过是附属功能而已。想的方向有偏差,就音乐领域而言,根据用户画像推荐只能是大方向,比如各个年龄层的不同偏好。前期最关键的应该是根据歌曲之间的关联度进行推荐,比如喜欢李健的歌,那就给你多推荐相似歌手的音乐。后期的推荐这个比重也会占很重要的位置,这样一来就成了谁家的音乐数据库更全更好了。推荐是匹配的活,不仅要考虑人,也要考虑音乐、商品,这是双方相互磨合的过程。

⑥ 豆瓣FM 的推荐算法是怎样的

豆瓣FM的推荐算法没有停止,反而是在不断演进当中,伴随着它成长的用户,会慢慢发现越来越多的惊喜与满意。豆瓣FM是中国互联网实践个性化服务的一个很好的土壤,其中糅合了包括算法、ui/ue、数据清洗与整合、音频分析技术、用户行为分析、编辑与运营、后台架构等等大量的因素,即便是推荐算法也只是算法技术中的一部分。单论推荐算法,就最简单的算法,也会极大地受到其它因素的影响,比如单曲推荐功能、新版的上线,对于算法的学习与积累都会起到极大的正面作用。

⑦ 如何为豆瓣设计一种公平的电影评分算法

第五名:《无间道》9.0分

《无间道》整片叙述两位身份复杂的男人之间的故事,他们分别为黑帮和警界各自派到对方阵营的卧底。两人命运是如此相似,反应、机智也势均力敌、相差不远。就在如此诡谲多变的气氛下,彼此互相拿生命去作为赌注,誓死揪出对方,不是你死,就是我亡。片中两位影帝饰演的两位主角,各自在随时需要应变的环境与紧凑的剧情下,所展现出的机智,也是并驾齐驱、不分伯仲的。

陈凯歌说他的每一部电影里都会有一个他在精神上完全认同的人,在《霸王别姬》里,这个人就是程蝶衣,他是“疯子”一样的艺术家,一旦走下舞台,走进现实的人群,注定是孤独的,但也因为如此,他的诚实和天真,甚至是嫉妒和偏执都很美,很真实。

不疯魔不成活,程蝶衣是一个戏痴,戏迷,戏疯子,因为沉溺于自己所扮演的角色,他变成了真虞姬,而他的师哥段小楼,只不过是他以为的霸王,人物的悲剧性缘起一出霸王别姬,也缘灭于一出霸王别姬,真虞姬和假霸王,早已注定是一场苍凉的结局。

⑧ 如何在豆瓣上评分

收集豆瓣用户对这部电影的打分,通过豆瓣的一种算法,最终得出分数。

算法属于综合评估,平均分是其中一项而已,但并不是绝对,不然,电影雇佣水军,就可以让电影变成接近满分了,没有意义了,所以豆瓣算法中其中一项涉及到权重。

举个例子

一部电影刚上映,很烂,正常打分可能都是一分,但是发行方雇佣了大量水军打分,直接把分数打到很高,因为这时候豆瓣用户还没有多少人看过电影呢,不过,之后慢慢很多人都看过了电影,知道很烂,尤其很多豆瓣的老用户,这些人权重很高,可能,你一千个水军新号,未必有一个老用户的权重高,他大个一分,就能拉回到一半,随着权重高的人看过电影的越来越多,分数必然就会大幅度下降,直至趋于稳定,最终得出还算科学的得分。

无论多少严谨的算法,都无法做到绝对科学和公平,毕竟,每个人的口味还不一样呢,电影的好坏也没有绝对标准,分数只能说是参考,可能这部片子在你心中五星,在别人心中三星,甚至一星呢。

当然豆瓣的算法也不是成不变的,也会不断微调,尽量做到更完美,让大多数用户满意。

⑨ 豆瓣评分是怎么计算出来的

众所周知,在中国的电影观看者心中,豆瓣电影的评分是很强大的一个参考标准。一些有文艺情怀的青年可以在此闲话国际新浪潮,批判一些超现实主义,而迷妹们可以为自己心中的偶像所,参演的影片点赞,支持……更多的人,可能根本对电影没有太多研究,甚至只凭喜好或者“听别人说”而去观影的同时也会选择在买票之前参考一下豆瓣电影的评分。

可以说,豆瓣电影的评分一度成为大家评价电影质量的标杆,甚至可以影响一部电影的票房高低,那么豆瓣电影的评分标准到底是怎样的呢?

上诉图片是2015 年的时候豆瓣总经理阿北发表的一篇长文中所说的,意思很明确,豆瓣电影的评分就是基于用户打分:把豆瓣用户的打分(一到五星换算为零到十分)加起来,再除以用户数。就是豆瓣电影的评分,这个分数完全来自程序的计算,中间没有编辑审核,每隔几分钟就自动更新一下,以便快速的展现出及时的评分。

可以说,这是一个“简单粗暴”的评分机制。观众的评价将以非常直接的方式反映在电影的分数上,心情好时打的“五星”和心情不好时的“一星”都将被加入到简单的计算公式中,最终变成其他人的参考标准。

但同时,阿北也说到,豆瓣也是有“非正常打分”规避机制的。作为一个拥有一亿多用户的“大众评审团”,每个用户都是“一人一票”制,而且随着打分人数的增加,单人评分对整体评分走向的影响其实是在不断被稀释。因此,评分计算方法很简单,但“刷分”基本上是不可能的。



所以,总体来说,豆瓣的电影评分是参与评分人群的意见“平均值”,虽然有很多的规避以及防范措施,但总体上受评分人个人喜好的影响较大。但我们都知道,豆瓣的用户,更多的是在全国一二线城市,而且受众群体大多数都是人们口中所谓的文艺青年们,所以,对于拥有相对“高端”用户群体的豆瓣,其评分还是偏“小众”的

⑩ 懂算法的人应该知道怎么做人生选择

每年一到要找工作的时候,我就能收到很多人给我发来的邮件,总是问我怎么选择他们的offer,去腾讯还是去豆瓣,去外企还是去国内的企业,去创业还是去考研,来北京还是回老家,该不该去创新工场?该不该去thoughtworks?……等等,等等。今年从7月份到现在,我收到并回复了60多封这样的邮件。我更多帮他们整理思路,帮他们明白自己最想要的是什么。

我深深地发现,对于我国这样从小被父母和老师安排各种事情长大的人,当有一天,父母和老师都跟不上的时候,我们几乎完全不知道怎么去做选择。

几个例子

当我们在面对各种对选择的影响因子的时候,如:城市,公司规模,公司性质,薪水,项目,户口,技术,方向,眼界…… 你总会发现,你会在几个公司中纠结一些东西,举几个例子:

阅读全文

与算法豆瓣相关的资料

热点内容
好脾气的程序员 浏览:661
macppt压缩软件 浏览:131
公众号推广系统源码 浏览:62
程序员作息安排 浏览:621
如何在本地登录服务器 浏览:334
喵吧app怎么使用 浏览:751
家庭服务器如何连wifi 浏览:205
新闻推荐系统源码 浏览:224
php中文星号 浏览:502
服务器4盘是什么意思 浏览:595
如何重启或关闭服务器 浏览:348
pdf文档加水印 浏览:836
机构抢筹指标公式源码 浏览:266
linux脚本awk 浏览:558
程序员怎么跟领导提升 浏览:75
pdf怎么生成目录 浏览:387
如何保护自己的服务器 浏览:69
html5上传图片压缩 浏览:473
支付宝账单文件如何解压 浏览:861
查看内核版本命令 浏览:958