A. 规制数字社会运行的“算法”权力
数字 社会 中的人与人、人与物、物与物之间的关系与活动产生了大量的数据,如何应对信息超载和海量数据的危机,“算法”作为一种技术力量,成为必然选择。以算法推荐、算法分析、算法决策等方式无缝接入 社会 生活、深度参与资源配置、拓展调整 社会 格局,已成为数字 社会 运行的底层逻辑。
“算法推荐”成为 社会 信息传播新范式。“算法”是互联网信息分发的重要工具,围绕“以用户为中心”的价值逻辑,把用户的喜好作为关键因素,通过数据、算法与算力之间的组合动态构建起信息供给与用户需求之间的个性化适配关系。这种精准对位的信息推荐,改变了以往粗放型的信息分发模式,适配了用户的个性化需求,使得用户的主体性得到充分发挥,增强了客户黏性,提升了 社会 信息的流动效率。但是,将“算法”作为信息推荐的模式会过滤掉多元信息,用户将被困于信息茧房中。
“算法分析”改变民众认知与生活逻辑。民众的生产生活在产生数据、记录数据,同时又被算法分析后的数据所改变。一方面,算法分析改变民众的认知逻辑。当前数字 社会 所积累的大数据以及在此之上的算法分析,使得商家可以根据以往市场销售、用户分布、用户兴趣点等对未来销售作出预判,进而有计划的安排生成和市场推广,在未来,用户对于商家来说是可被认知的;对于用户来说,算法分析能够以可视化的方式清晰呈现算法帮助规划的行车路线、交通堵塞点、预计到达时间,未来对于用户来说是可被认知的。民众在这样一些算法分析的形态下形成了预测未来的认知逻辑。另一方面,算法系统强大而高效,它通过不断纳入和完善影响因素来提高算法的准确性,用户慢慢接受并开始享受这种“定制化”生活方式,但同时却产生了“大数据杀熟”“困在算法里的外卖骑手”等算法偏见问题。
“算法决策”支撑政府 社会 治理的向度。算法与大数据被赋予提高治理的透明性、公平性、有效性等使命,一是算法决策辅助政府治理的精度。比如大数据算法辅助精准扶贫,地方政府采用建立人口基数、收入来源、 健康 状况、生产能力等多种要素构成的识别模型,做到贫困人口的精准识别。二是算法决策提升政府治理的效率。在抗击新冠肺炎疫情中,速度是跑赢疫情的关键要素,运用算法高效率排查四类人员,用看得见的数据迅速控制疫情。然而,在政府依托算法进行治理的同时,算法对于个人隐私权保护和安全问题凸显。同时,算法鸿沟也会拉大 社会 距离。
我们正处在一个“算法无处不在的 社会 ”,算法在给我们带来各种福利的同时,相伴而生了信息茧房、算法偏见、算法鸿沟等一系列问题,这是技术风险同时也是治理风险,需要全 社会 多元力量参与共同进行治理 探索 。
主流价值导向“引导”算法。首先,增强主流价值导向在算法推荐中的优先权。增加主流意识形态内容的有效供给,增强主流价值内容在信息分发中的比重,用内容的创新性、多样性对冲用户个性导致的单一性,为用户提供多元的信息环境。其次,用主流价值导向把关算法推荐的信息分发。推动将把关的窗口前移,用“防火”理念建立人工和AI合力进行的前置把关,用主流价值导向引领信息生产和信息把关。最后,借力算法推荐进行主流价值导向的传播。主流媒体、传统媒体可充分发挥自身优质内容的生产能力,借助算法推荐的模式和机制,进行主流价值导向的精准化、个性化、趣味化传播。
B. 北大青鸟java培训:网络算法都应该遵循的原则有哪些
随着互联网的不断发展,现在在网络上发言和造谣的成本也越来越低,而由于算法的存在,这些内容反而更容易得到传播和被阅读的机会,下面浙江北大青鸟http://www.kmbdqn.cn/就一起来了解一下,网络算法都应该遵循的原则有哪些。
1)真相和准确性“造谣一张嘴,辟谣跑断腿。
”“我们是兼职在辟谣,别人是全职在传播伪科学。
”现在大家终于知道了谎言比真相更容易传播。
但资讯推荐算法更关心“相关性”而非信息本身是不是真相。
怎么办?让编辑负责辨别真相,编辑们可以区分出虚构的内容和事实,把他们的意见添加到推荐算法中。
让经过专业训练的新闻从业者来决定什么是质量,什么是真相,什么是准确性。
让他们来监控和改进算法,防止算法被滥用。
2)独立性让编辑来确保推荐算法是为读者服务的,而不是为商业模式,为广告主服务。
现在的推荐算法让那些骗点击的标题党(clickt)内容和广告凸显出来,正常的内容反而被打压,这是现在网络新闻最严重的问题——内容的权重,并不是根据内容是否对读者有益来判断的,而是为商业模型服务的,让人们花更多时间沉浸在垃圾内容中,对这些公司的商业模型更有益。
3)公平和公正性分歧和极端内容更受算法的青睐,也更容易引发读者的对立。
新闻从业者常说,在每个新闻事件至少有两面,记者们的工作是发现和听取多样化的声音。
当编辑和工程师合作来调整算法,呈现多角度不同的观点,才能加深我们对世界的理解和同情心。
如果我们不理解为什么会有不同的意见,就不会真正团结。
4)人性新闻事实必须被认真调查,有理有据,才能保证媒介是用来曝光或庆祝真相的,不是用来伪造事实伤害他人。
这是职业操守,也是人性。
算法不会对谎言泛滥负责任,但记者和编辑是需要对此负责的。
所以编辑和工程师可以合作,一起设计算法,严格限制有害的内容被观看,及时调整推荐给平台上用户的内容。
5)问责制没有什么系统是完美的。
当错误出现,比如假新闻被炒作或者恶俗内容被推送给用户,平台方应该迅速纠正错误和调整算法。
对于一家新闻机构而言,出现错误时一定会做立即做公开的勘误和道歉,以保证机构的声誉和读者的信任。
但是,算法和平台方却从来不会负同样的责任。
C. red的算法优缺点
1993年,Floyd 和Jacobson就提出了RED,当时的主要目的是克服“早期随机丢弃”(Early Random Drop,ERD)网关偏袒突发业务而造成的不公平问题. RED为队列管理增添了两种新机制,其一,不是等队列全满后再丢弃到来的分组,而是利用概率判定机制事先丢掉部分分组来预防可能发生的拥塞;其二,通过平均队列而非即时队列调整分组丢弃概率,由此来尽可能地吸收部分短暂的突发流量。RED算法的性能敏感于设计参数和网络状况,在特定的网络负载状况下依然会导致多个TCP的同步,造成队列震荡,吞吐量降低和时延抖动加剧。RED算法的公平性和稳定性也存在问题。自RED被首次提出来之后,它的参数配置就是一个没有彻底解决的问题。
虽然RED能够有效避免拥塞,但是该算法仍然存在以下主要缺陷:
(1)公平性问题
对于不响应拥塞通知的连接,RED算法无法有效处理,因此这样的连接经常会挤占大量的网络带宽,导致了各种连接不公平地共享带宽。
(2)参数设置问题
RED算法对参数设置很敏感,两个门限值和最大丢包概率的细微变化经常是对网络性能造成很大影响,如果根据具体业务环境选择最合适的参数是RED存在的一个重要问题。另外,一组参数可能会获得较高的吞吐量,但是可能也会造成较高的丢包率和较长的时间延迟。如何配置参数,使得算法在吞吐量、时间延迟和丢包率等各方面均获得较好的性能也有待解决。
(3)网路性能问题
RED算法控制的平均队列长度经常会随着连接数目的增加而不断增大,造成传输时延抖动,引起网络性能不稳定。
D. 名词解释 算法
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。
E. 如何修改集中式互斥算法以保证公平性
互斥算法。集中式算法在分布式系统中获得互斥的最直接方法是仿照单处理机系统的方法,选一个进程为协调者互斥算法,也提高了公平性。
F. rpr的算法srp是什么意思
SPR公平算法,使得每个节点能获得相同的带宽
在RPR中采用了SRP作为带宽分配算法。其基本原理是在算法中设置两个变量FORWARD_RATE和MY_RATE,二者分别表示转发业务的发送速率和本地站点业务的发送速率。当FORWARD_RATE+MY_RATE>LOW_THRESHOLD时,我们就称节点n是拥塞的,这里LOW_THRESHOLD是一个低于链路能力的固定值。当节点n发生拥塞,它就发送一个控制信息给它的上游节点,这个控制信息中包含着它自己站点业务的发送速率MY_RATE[n]。当上游节点i接收到包含MY_RATE[n]值的拥塞控制信息后,它将降低自己的速率控制器值,我们称之为ALLOWED_RATE。如果从节点n接收到拥塞信息的上游节点n-1也是拥塞的,那么它将把节点最近计算的ALLOWED_RATE值和它自己的测量值MY_RATE[n-1]相比较,取较小值送给上游节点。这样,站点的业务速率将不再超过这一流量所经过的下游任一节点所广播的MY_RATE值。如果节点n-1没有拥塞,它将把MY_RATE[n-1]设置为全空的值,以指示没有发生拥塞。接收到全空值的节点将间歇性地增加它们自己的ALLOWED_RATE值。值得注意的是,节点n-1虽然处于拥塞状态,但MY_RATE[n-1]>FORWARD_RATE[n-1]时,节点n-1同样将MY_RATE[n-1]设置为全空值,这是因为,这种情况表示,节点的拥塞状况是由节点n-1发送的业务导致的,而不是由上游节点所发送的业务导致的。
这个算法的基本思想是如果所有的节点以接收到的MY_RATE的最小值来分享瓶颈链路,那么流量的速率将会相等,公平性也由此而来。在没有拥塞的情况下,流量将间歇性地增加它们自己的ALLOWED_RATE,以保证获得最大化的带宽利用率。总的说来SRP具有较好的有效性、简单性和可拓展性,但也存在一些问题。①算法必须设定恰当的算法参数,如控制信息的发送间隔、转发缓存器的容量和低优先级门限的大小等。这些参数的设置将会对网络中处于不同位置的节点,及不同优先级的业务产生影响。②由于SRP只有一个单独的速率控制器,这将会产生如下的一些问题:如队头阻塞问题和不平衡业务情形下的带宽分配不公平问题等。
G. 作业调度算法有什么选择原则
作业调度算法的选择原则有:
1、公平性:对每个用户公平对待且使每个用户满意;
2、平衡使用资源:使同时进入系统的作业在执行时尽可能地利用系统中的不同资源提高资源利用率;
3、极大的流量:缩短作业的平均周转时间提高系统的吞吐能力;
以上这些原则不能兼顾。在设计计算机系统时,应根据系统的设计目标来决定调度原则。不同的计算机系统采用不同的调度原则和调度算法,但都必须遵循一个必要条件,即系统的现有的尚来分配的资源可以满足被选作业的资源要求。
(7)算法公平性是由什么决定的扩展阅读:
作业调度是指按照时间周期(年、月、日、时、分、秒等)对作业进行分割,并根据业务需求、作业长度、存储管理及依赖性关系对作业的执行方式加以调度。主要任务是从作业后备队列中选择作业进入主存运行。作业调度的功能主要有以下几方面:
1、记录各作业在系统中的状态;
2、从后备队列中挑选一部分作业投入运行;
3、从被选中的作业做好执行前的准备工作;
4、在作业执行结束时,做善后处理工作。
进行作业调度有很多作业调度算法,这些作业调度算法要实现的目标是:
1、调度对所有作业都是公平合理的;
2、应使设备有较高的利用率(提供系统利用率);
3、每次运行尽可能多的作业(提高系统吞吐量);
4、较快的相应时间。
H. 确定作业调度算法的原则是什么
①先来先服务算法。原则上按照作业进入输入井的次序调度,如果作业的资源得不到满足,将会推迟调度,它的资源得到满足的时候会优先被调度进来。
优点:具有一定的公平性。
缺点:系统的吞吐率低,平均周转时间长,有大作业到来的时,许多小作业推迟调度。
②计算时间短的作业优先.优先调度计算时间短的作业进行调度,资源不满足的情况下推迟调度。在这种调度算法下,要求用户要对作业的计算时间预先有一个估计,调度以此为依据。
优点:由于被选中的作业计算时间,所以不能尽快地完成并退出系统,降低了作业的平均等待时间,提高了系统的吞吐率。
缺点:大作业会不满意,而且极限情况下使得某些大作业始终得不到调度。
③响应比高者优先算法。该算法考虑了计算时间等待时间,既考虑了计算时间短的作业优先,又考虑了大作业长期等待的问题。所谓响应比是按照以下公式来定义的:
响应比R=等待时间/计算时间
这里的计算时间是估计的作业计算时间,从公式看,计算时间越短,响应比越高;而另一方面,大作业等待时间越长,响应比也会越大。一个作业完成以后,需要重新计算一下在输入井中的各个作业的响应比,最高的将优先调度。
④优先数调度算法。为每一个作业指定一个优先数,优先数高的作业先被调度。对于优先数相等的作业采用先来先服务的策略。优先数的制定原则是:作业的缓急程序,估计的计算时间,作业的等待时间,资源申请情况等因素综合考虑。
⑤均衡调度算法。使用不同资源的进程同时执行,减少作业等待同类设备而耗费的时间,加快作业的执行。
(8)算法公平性是由什么决定的扩展阅读:
在操作系统中调度是指一种资源分配,因而调度算法是指:根据系统的资源分配策略所规定的资源分配算法。对于不同的的系统和系统目标,通常采用不同的调度算法,例如,在批处理系统中,为了照顾为数众多的段作业,应采用短作业优先的调度算法;又如在分时系统中,为了保证系统具有合理的响应时间,应当采用轮转法进行调度。
目前存在的多种调度算法中,有的算法适用于作业调度,有的算法适用于进程调度;但也有些调度算法既可以用于作业调度,也可以用于进程调度。
I. 深入了解区块链的共识机制及算法原理
所谓“共识机制”,是通过特殊节点的投票,在很短的时间内完成对交易的验证和确认;对一笔交易,如果利益不相干的若干个节点能够达成共识,我们就可以认为全网对此也能够达成共识。再通俗一点来讲,如果中国一名微博大V、美国一名虚拟币玩家、一名非洲留学生和一名欧洲旅行者互不相识,但他们都一致认为你是个好人,那么基本上就可以断定你这人还不坏。
要想整个区块链网络节点维持一份相同的数据,同时保证每个参与者的公平性,整个体系的所有参与者必须要有统一的协议,也就是我们这里要将的共识算法。比特币所有的节点都遵循统一的协议规范。协议规范(共识算法)由相关的共识规则组成,这些规则可以分为两个大的核心:工作量证明与最长链机制。所有规则(共识)的最终体现就是比特币的最长链。共识算法的目的就是保证比特币不停地在最长链条上运转,从而保证整个记账系统的一致性和可靠性。
区块链中的用户进行交易时不需要考虑对方的信用、不需要信任对方,也无需一个可信的中介机构或中央机构,只需要依据区块链协议即可实现交易。这种不需要可信第三方中介就可以顺利交易的前提是区块链的共识机制,即在互不了解、信任的市场环境中,参与交易的各节点出于对自身利益考虑,没有任何违规作弊的动机、行为,因此各节点会主动自觉遵守预先设定的规则,来判断每一笔交易的真实性和可靠性,并将检验通过的记录写入到区块链中。各节点的利益各不相同,逻辑上将它们没有合谋欺骗作弊的动机产生,而当网络中有的节点拥有公共信誉时,这一点尤为明显。区块链技术运用基于数学原理的共识算法,在节点之间建立“信任”网络,利用技术手段从而实现一种创新式的信用网络。
目前区款连行业内主流的共识算法机制包含:工作量证明机制、权益证明机制、股份授权证明机制和Pool验证池这四大类。
工作量证明机制即对于工作量的证明,是生成要加入到区块链中的一笔新的交易信息(即新区块)时必须满足的要求。在基于工作量证明机制构建的区块链网络中,节点通过计算随机哈希散列的数值解争夺记账权,求得正确的数值解以生成区块的能力是节点算力的具体表现。工作量证明机制具有完全去中心化的优点,在以工作量证明机制为共识的区块链中,节点可以自由进出。大家所熟知的比特币网络就应用工作量证明机制来生产新的货币。然而,由于工作量证明机制在比特币网络中的应用已经吸引了全球计算机大部分的算力,其他想尝试使用该机制的区块链应用很难获得同样规模的算力来维持自身的安全。同时,基于工作量证明机制的挖矿行为还造成了大量的资源浪费,达成共识所需要的周期也较长,因此该机制并不适合商业应用。
2012年,化名Sunny King的网友推出了Peercoin,该加密电子货币采用工作量证明机制发行新币,采用权益证明机制维护网络安全,这是权益证明机制在加密电子货币中的首次应用。与要求证明人执行一定量的计算工作不同,权益证明要求证明人提供一定数量加密货币的所有权即可。权益证明机制的运作方式是,当创造一个新区块时,矿工需要创建一个“币权”交易,交易会按照预先设定的比例把一些币发送给矿工本身。权益证明机制根据每个节点拥有代币的比例和时间,依据算法等比例地降低节点的挖矿难度,从而加快了寻找随机数的速度。这种共识机制可以缩短达成共识所需的时间,但本质上仍然需要网络中的节点进行挖矿运算。因此,PoS机制并没有从根本上解决PoW机制难以应用于商业领域的问题。
股份授权证明机制是一种新的保障网络安全的共识机制。它在尝试解决传统的PoW机制和PoS机制问题的同时,还能通过实施科技式的民主抵消中心化所带来的负面效应。
股份授权证明机制与董事会投票类似,该机制拥有一个内置的实时股权人投票系统,就像系统随时都在召开一个永不散场的股东大会,所有股东都在这里投票决定公司决策。基于DPoS机制建立的区块链的去中心化依赖于一定数量的代表,而非全体用户。在这样的区块链中,全体节点投票选举出一定数量的节点代表,由他们来代理全体节点确认区块、维持系统有序运行。同时,区块链中的全体节点具有随时罢免和任命代表的权力。如果必要,全体节点可以通过投票让现任节点代表失去代表资格,重新选举新的代表,实现实时的民主。
股份授权证明机制可以大大缩小参与验证和记账节点的数量,从而达到秒级的共识验证。然而,该共识机制仍然不能完美解决区块链在商业中的应用问题,因为该共识机制无法摆脱对于代币的依赖,而在很多商业应用中并不需要代币的存在。
Pool验证池基于传统的分布式一致性技术建立,并辅之以数据验证机制,是目前区块链中广泛使用的一种共识机制。
Pool验证池不需要依赖代币就可以工作,在成熟的分布式一致性算法(Pasox、Raft)基础之上,可以实现秒级共识验证,更适合有多方参与的多中心商业模式。不过,Pool验证池也存在一些不足,例如该共识机制能够实现的分布式程度不如PoW机制等
这里主要讲解区块链工作量证明机制的一些算法原理以及比特币网络是如何证明自己的工作量的,希望大家能够对共识算法有一个基本的认识。
工作量证明系统的主要特征是客户端要做一定难度的工作来得到一个结果,验证方则很容易通过结果来检查客户端是不是做了相应的工作。这种方案的一个核心特征是不对称性:工作对于请求方是适中中的,对于验证方是易于验证的。它与验证码不同,验证码是易于被人类解决而不是易于被计算机解决。
下图所示的为工作量证明流程。
举个例子,给个一个基本的字符创“hello,world!”,我们给出的工作量要求是,可以在这个字符创后面添加一个叫做nonce(随机数)的整数值,对变更后(添加nonce)的字符创进行SHA-256运算,如果得到的结果(一十六进制的形式表示)以“0000”开头的,则验证通过。为了达到这个工作量证明的目标,需要不停地递增nonce值,对得到的字符创进行SHA-256哈希运算。按照这个规则,需要经过4251次运算,才能找到前导为4个0的哈希散列。
通过这个示例我们对工作量证明机制有了一个初步的理解。有人或许认为如果工作量证明只是这样一个过程,那是不是只要记住nonce为4521使计算能通过验证就行了,当然不是了,这只是一个例子。
下面我们将输入简单的变更为”Hello,World!+整数值”,整数值取1~1000,也就是说将输入变成一个1~1000的数组:Hello,World!1;Hello,World!2;...;Hello,World!1000。然后对数组中的每一个输入依次进行上面的工作量证明—找到前导为4个0的哈希散列。
由于哈希值伪随机的特性,根据概率论的相关知识容易计算出,预计要进行2的16次方次数的尝试,才能得到前导为4个0的哈希散列。而统计一下刚刚进行的1000次计算的实际结果会发现,进行计算的平均次数为66958次,十分接近2的16次方(65536)。在这个例子中,数学期望的计算次数实际就是要求的“工作量”,重复进行多次的工作量证明会是一个符合统计学规律的概率事件。
统计输入的字符创与得到对应目标结果实际使用的计算次数如下:
对于比特币网络中的任何节点,如果想生成一个新的区块加入到区块链中,则必须解决出比特币网络出的这道谜题。这道题的关键要素是工作量证明函数、区块及难度值。工作量证明函数是这道题的计算方法,区块是这道题的输入数据,难度值决定了解这道题的所需要的计算量。
比特币网络中使用的工作量证明函数正是上文提及的SHA-256。区块其实就是在工作量证明环节产生的。旷工通过不停地构造区块数据,检验每次计算出的结果是否满足要求的工作量,从而判断该区块是不是符合网络难度。区块头即比特币工作量证明函数的输入数据。
难度值是矿工们挖掘的重要参考指标,它决定了旷工需要经过多少次哈希运算才能产生一个合法的区块。比特币网络大约每10分钟生成一个区块,如果在不同的全网算力条件下,新区块的产生基本都保持这个速度,难度值必须根据全网算力的变化进行调整。总的原则即为无论挖矿能力如何,使得网络始终保持10分钟产生一个新区块。
难度值的调整是在每个完整节点中独立自动发生的。每隔2016个区块,所有节点都会按照统一的格式自动调整难度值,这个公式是由最新产生的2016个区块的花费时长与期望时长(按每10分钟产生一个取款,则期望时长为20160分钟)比较得出来的,根据实际时长一期望时长的比值进行调整。也就是说,如果区块产生的速度比10分钟快,则增加难度值;反正,则降低难度值。用公式来表达如下:
新难度值=旧难度值*(20160分钟/过去2016个区块花费时长)。
工作量证明需要有一个目标值。比特币工作量证明的目标值(Target)的计算公式如下:
目标值=最大目标值/难度值,其中最大目标值为一个恒定值
目标值的大小与难度值成反比,比特币工作量证明的达成就是矿中计算出来的区块哈希值必须小于目标值。
我们也可以将比特币工作量的过程简单的理解成,通过不停变更区块头(即尝试不同nonce值)并将其作为输入,进行SHA-256哈希运算,找出一个有特定格式哈希值的过程(即要求有一定数量的前导0),而要求的前导0个数越多,难度越大。
可以把比特币将这道工作量证明谜题的步骤大致归纳如下:
该过程可以用下图表示:
比特币的工作量证明,就是我们俗称“挖矿”所做的主要工作。理解工作量证明机制,将为我们进一步理解比特币区块链的共识机制奠定基础。