㈠ 分析标准粒子群算法的不足及改进的方法
一个以上的目标,以优化
相对传统的多目标优化方法在解决多目标问题,PSO具有很大的优势。首先,PSO算法和高效的搜索功能,有利于在这个意义上,多目标的最优解;其次,PSO代表了整个解决方案的人口集固有的并行性,同时搜索多个非劣解,所以容易搜索多个Pareto最佳的解决方案;此外,PSO通用的适合处理所有类型的目标函数和约束条件,PSO容易与传统相结合的方法,和然后提出了有效的方法来解决一个具体的问题。 PSO本身,为了更好地解决多目标优化问题,必须解决的问题的全局最优粒子和个人选择的最优粒子。为全局最优粒子的选择,一方面,该算法具有更好的收敛速度,另一方面帕累托边界分散体的溶液中。如果在最佳的单个颗粒的选择,需要较少的计算复杂性,并且是仅由较少数量的比较非
劣解更新。迄今为止,基于PSO的多目标优化,主要有以下
思路:
(1)向量法和加权方法。文献[20]的固定权重法,自适应权重法和向量评估方法的第一次,PSO解决MO问题。然而,对于一个给定的优化问题,权重的方法通常是很难获得一组合适的权重向量评价方法MO的问题是,往往无法得到满意的解决方案。
(2)基于Pareto方法。 [21]帕累托排序机制和PSO相结合,处理的问题,多目标优化,Pareto排序方法来选择一组的精英,和轮盘赌选择全局最优粒子。虽然轮盘赌选择机制,使所有的帕累托个人选择的概率是一样的,但实际上只有少数人的选择的概率就越大,因此不利于保持种群多样性;文献[22]通过引入在PSO帕累托竞争机制,选择全局最优粒子的颗粒知识基础。候选个人随机选自人口比较集进行比较,以确定非劣解,该算法的成功取决于比较集的大小的参数设置。如果这个参数是太小了,选择的过程,从人口的非劣效性个人可能是太小了,如果这个参数是太大,它可能会出现过早收敛。
(3)距离的方法。 [23],被分配的各个的当前的解决方案之间的距离的基础上Pa2reto的解决方案,其适应值,以便选择全局最优粒子。随着距离的方法需要被初始化潜在的解决方案,如果初始电位值太大,不同的解决方案,以适应不同的值并不显着。这将导致在选择压力太小或个别均匀分布,导致在PSO算法收敛速度非常慢。
(4)附近的“。文献[24]提出了动态邻域的选择策略,为优化目标的定义,目标,和其他所有的目标定义的目标附近,然后选择全局最优粒子的动态邻域的策略,但该方法更敏感的目标函数的优化目标选择和附近的排序。
(5)多组法。文献[25]的人口划分成多个子群,以及每个子群PSO算法,通过搜索Pareto最优解的各种子群之间的信息交流。然而,由于需要增加的粒子的数量增加的计算量。
(6)非排名的方法。 [26]使用非主导的排序选择全局最优的粒子。整个人口,粒子的个人最好成绩粒子和它的后代,有利于提供一个适当的选择压力,小生境技术,以增加种群多样性。比较所有粒子的个人最好成绩颗粒在整个人群遗传给后代,但是,由于其本身的性质是不利于人口的多样性,容易形成早熟。此外,文献[27]最大最小策略,博弈论引入PSO解决多MO。最大最小策略,以确定粒子的适应值,可以判断帕累托最优的解决方案,而不需要集群和小生境技术。
2约束优化
在最近几年也取得了一些进展,PSO算法在约束最优化。基于PSO-的约束优化工作分为两种类型:①罚函数法;②设计特定的进化操作或约束修正系数。 [28]采用罚函数法,采用非固定多段映射罚函数将约束的优化问题,然后利用PSO解决问题的转换后,模拟结果表明,该算法相对进化策略和遗传算法的优势,但罚函数的设计过于复杂,不利于解决;文献[29],一个可行的解决方案,保留策略处理约束,即,一方面要更新所有的颗粒的存储区域中到只保留可行的解决方案,在另一方面在初始化阶段的所有的颗粒从一个可行的解决方案的空间值?初始的可行的解决方案空间,然而,是难以确定的很多问题,文献[30 ]提出的多层信息共享策略粒子群与约束原则来处理,根据约束矩阵多层Pareto排序机制的微粒,从而一些微粒,以确定个人的搜索方向的其余。
3离散优化为离散优化解决方案空间是离散点的集合,而不是连续PSO解决离散优化问题,必须予以纠??正的速度和位置更新公式,或变形。基于PSO的离散优化可分为以下三类:
速度(1)的位置变化的概率。 [31]首先提出了离散二进制PSO。二进制粒子的位置编码器,Sigmoid函数,速度约束在[0,1],代表粒子的概率立场;法[32] [31]在文献
提高的地址更换安排。安排更换颗粒,速度是指根据两个粒子的相似性,以确定粒子的位置变化也引入突变操作,以防止陷入局部极小的最优粒子的概率。
(2)重新定义的PSO的操作。 [33]通过重新定义粒子的位置,速度,和他们的加法和减法乘法运算,提出了一种新的离散粒子群,并为解决旅行商问题。虽然该算法是有效的,但它提供了一种新的思维方式求解组合优化问题。
(3)连续PSO离散的情况下。 [34]采用连续PSO,解决分布式计算机任务的分配问题。于实数被转换为一个正整数,和符号的实数部分和小数部分的
分除去。结果表明,在溶液中的质量和速度的方法的算法是优于遗传算法。
4动态优化
在许多实际工程问题,优化环境是不确定的,或动态。因此,优化算法必须有能力与环境的动态变化做出相应的调整,以最佳的解决方案,该算法具有一定的鲁棒性。 [35]首次提出了PSO跟踪动态系统[36]提出了自适应PSO自动跟踪动态系统的变化,种群粒子检测方法和粒子重新初始化PSO系统变化的跟踪能力增强;文献[37]迅速变化的动态环境中,在粒子速度更新公式的变化条目的增加,消除了需要在环境中的变化来检测,可以跟踪环境处理。虽然该研究少得多,但不容质疑的,是一个重要的研究内容。
粒子群算法的MATLAB程序
初始化粒子群;
对于每个粒子
计算他们的身体健康;
如果(健身优于粒子的历史最好值)
历史最好的个人裨锡更新;
如果选择当前粒子群粒子;(当前的最优粒子比历史最好粒子组)
与目前最好的粒子更新PG组;对于每个粒子
更新粒子类型①速度;
更新的位置粒子类型②;
完
虽然还没有达到最大迭代次数,或不符合的最小误差。
㈡ Tent映射及其改进表达式
Tent映射是一种混沌优化算法,具有随机性和遍历性,该映射结构简单,和其他算法配合使用时实现容易。具体结构如式(8.4)所示:
高光谱遥感影像信息提取技术
由式(8.2)知,粒子位置的更新取决于粒子速度的更新,也可进一步通过对粒子速度做Tent映射变换从而间接影响粒子位置更新。本章在高光谱影像的Tent-PSO-SVM分类过程中,根据实现速度的最大与最小值设置的多次实验,将原始Tent映射结构进行了改进处理,如式(8.5)所示:
高光谱遥感影像信息提取技术
㈢ 数学如何将[300,5000]映射到[-1,1]范围内呢
方法有多种,最简单的是一次函数经过点(300,-1)和(5000,1)
㈣ 映射 A={1,2,3,……,100}找一个A*A到A的映射
两个集合,如果按照某种对应法则f,对于集合A中的任何一个元素,在集合B中都有唯一的元素和它对应,那么这样的对应(包括集合A,B以及A到B的对应法则f)叫做集合A到集合B的映射,记作f:A→B
映射的简单算法
如果M集合有m个元素,N集合有n个元素,则从M到N的映射个数就是:n的m次方个映射
集合关于原点的映射??
例如:你把方程的图像(1)弄出来,然后画出与原点对称的图像(2),图像(2)就是图像(1)关于原点对称的映射,图像(2)整个就是图像(1)上所有点关于原点对称的映射点的集合。
我认为,用图像说明比较好懂,图像是数学解题的一大灵魂!当然,不一定所有题都是依靠图像解,因题而定。
“U”,这在数学里叫全集。
如果集合S含有我们所要研究的每个集合的全部元素,这个集合就可以看作一个全集,全集通常用U表示。
顺便给你提及一下补集,即在一个全集中,除开某一部分,剩下来的部分,就叫做在这个全集中关于除开的那个部分的补集,通常用大写“C”表示,可以写成“CuA”,"C"是大写,补集符号;”u“是小写,表示一个全集,是根据题目来定的,看具体是研究哪堆集合;”A“就是要除去的那部分,也是因题而定的,也可以是一团集合。
回答完毕。 以后你要好好复习哦。
㈤ 一个几何区域映射为另一个几何区域,譬如矩形映射为环形。或者映射为几个分散的区域,什么算法可以做到
变量替换 例如极坐标公式将矩形映射为扇形它们面积之间的关系是S矩=雅可比行列式×S扇形 问题的关联是如何找到这种变量间的转换关系即映射 这是算法的问题 很难的 就相当于你能创造新的极坐标公式 还有即使你找到了这种算法但你的目的何在 比如极坐标替换在求面积方面是为了求S矩(但然不是普通的矩形面积 一般是曲线于坐标轴围的面积)这样做的条件是S矩很难直接记算出而于此对应的S扇有很好的可求性 所以你的目的何在 就只是简单的映射没有进一步的目的吗 如若有可能还要找对应的‘雅可比行列式’ 个人建议 如果你是学生最好找一个数学系的老师共同研究
㈥ 粒子群算法的引言
优化问题是工业设计中经常遇到的问题,许多问题最后都可以归结为优化问题. 为了解决各种各样的优化问题,人们提出了许多优化算法,比较着名的有爬山法、遗传算法、神经网络算法等. 一是要求寻找全局最优点,
二是要求有较高的收敛速度. 近年来,一些学者将PSO算法推广到约束优化问题,其关键在于如何处理好约束,即解的可行性。如果约束处理的不好,其优化的结果往往会出现不能够收敛和结果是空集的状况。基于PSO算法的约束优化工作主要分为两类:
(1)罚函数法。罚函数的目的是将约束优化问题转化成无约束优化问题。
(2)将粒子群的搜索范围都限制在条件约束簇内,即在可行解范围内寻优。
根据文献介绍,Parsopoulos等采用罚函数法,利用非固定多段映射函数对约束优化问题进行转化,再利用PSO算法求解转化后问题,仿真结果显示PSO算法相对遗传算法更具有优越性,但其罚函数的设计过于复杂,不利于求解;Hu等采用可行解保留政策处理约束,即一方面更新存储中所有粒子时仅保留可行解,另一方面在初始化阶段所有粒子均从可行解空间取值,然而初始可行解空间对于许多问题是很难确定的;Ray等提出了具有多层信息共享策略的粒子群原理来处理约束,根据约束矩阵采用多层Pareto排序机制来产生优良粒子,进而用一些优良的粒子来决定其余个体的搜索方向。
但是,目前有关运用PSO算法方便实用地处理多约束目标优化问题的理论成果还不多。处理多约束优化问题的方法有很多,但用PSO算法处理此类问题目前技术并不成熟,这里就不介绍了。 粒子群优化算法(PSO)是一种进化计算技术(evolutionary computation),1995 年由Eberhart 博士和kennedy 博士提出,源于对鸟群捕食的行为研究 。该算法最初是受到飞鸟集群活动的规律性启发,进而利用群体智能建立的一个简化模型。粒子群算法在对动物集群活动行为观察基础上,利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得最优解。
PSO同遗传算法类似,是一种基于迭代的优化算法。系统初始化为一组随机解,通过迭代搜寻最优值。但是它没有遗传算法用的交叉(crossover)以及变异(mutation),而是粒子在解空间追随最优的粒子进行搜索。同遗传算法比较,PSO的优势在于简单容易实现并且没有许多参数需要调整。目前已广泛应用于函数优化,神经网络训练,模糊系统控制以及其他遗传算法的应用领域。
㈦ 算法效率与分析
算法效率与分析
数据结构作为程序设计的基础,其对算法效率的影响必然是不可忽视的。本文就如何合理选择数据结构来优化算法这一问题,对选择数据结构的原则和方法进行了一些探讨。首先对数据逻辑结构的重要性进行了分析,提出了选择逻辑结构的两个基本原则;接着又比较了顺序和链式两种存储结构的优点和缺点,并讨论了选择数据存储结构的方法;最后本文从选择数据结构的的另一角度出发,进一步探讨了如何将多种数据结构进行结合的方法。在讨论方法的同时,本文还结合实际,选用了一些较具有代表性的信息学竞赛试题举例进行了分析
【正文】一、引论
“数据结构+算法=程序”,这就说明程序设计的实质就是对确定的问题选择一种合适的数据结构,加上设计一种好的算法。由此可见,数据结构在程序设计中有着十分重要的地位。
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。因为这其中的“关系”,指的是数据元素之间的逻辑关系,因此数据结构又称为数据的逻辑结构。而相对于逻辑结构这个比较抽象的概念,我们将数据结构在计算机中的表示又称为数据的存储结构。
建立问题的数学模型,进而设计问题的算法,直至编出程序并进行调试通过,这就是我们解决信息学问题的一般步骤。我们要建立问题的数学模型,必须首先找出问题中各对象之间的关系,也就是确定所使用的逻辑结构;同时,设计算法和程序实现的过程,必须确定如何实现对各个对象的操作,而操作的方法是决定于数据所采用的存储结构的。因此,数据逻辑结构和存储结构的好坏,将直接影响到程序的效率。
二、选择合理的逻辑结构
在程序设计中,逻辑结构的选用就是要分析题目中的数据元素之间的关系,并根据这些特定关系来选用合适的逻辑结构以实现对问题的数学描述,进一步解决问题。逻辑结构实际上是用数学的方法来描述问题中所涉及的操作对象及对象之间的关系,将操作对象抽象为数学元素,将对象之间的复杂关系用数学语言描述出来。
根据数据元素之间关系的不同特性,通常有以下四种基本逻辑结构:集合、线性结构、树形结构、图状(网状)结构。这四种结构中,除了集合中的数据元素之间只有“同属于一个集合”的关系外,其它三种结构数据元素之间分别为“一对一”、“一对多”、“多对多”的关系。
因此,在选择逻辑结构之前,我们应首先把题目中的操作对象和对象之间的关系分析清楚,然后再根据这些关系的特点来合理的选用逻辑结构。尤其是在某些复杂的问题中,数据之间的关系相当复杂,且选用不同逻辑结构都可以解决这一问题,但选用不同逻辑结构实现的算法效率大不一样。
对于这一类问题,我们应采用怎样的标准对逻辑结构进行选择呢?
下文将探讨选择合理逻辑结构应充分考虑的两个因素。
一、 充分利用“可直接使用”的信息。
首先,我们这里所讲的“信息”,指的是元素与元素之间的关系。
对于待处理的信息,大致可分为“可直接使用”和“不可直接使用”两类。对于“可直接使用”的信息,我们使用时十分方便,只需直接拿来就可以了。而对于“不可直接使用”的这一类,我们也可以通过某些间接的方式,使之成为可以使用的信息,但其中转化的过程显然是比较浪费时间的。
由此可见,我们所需要的是尽量多的“可直接使用”的信息。这样的信息越多,算法的效率就会越高。
对于不同的逻辑结构,其包含的信息是不同的,算法对信息的利用也会出现不同的复杂程度。因此,要使算法能够充分利用“可直接使用”的信息,而避免算法在信息由“不可直接使用”向“可直接使用”的转化过程中浪费过多的时间,我们必然需要采用一种合理的逻辑结构,使其包含更多“可直接使用”的信息。
〖问题一〗 IOI99的《隐藏的码字》。
〖问题描述〗
问题中给出了一些码字和一个文本,要求编程找出文本中包含这些码字的所有项目,并将找出的项目组成一个最优的“答案”,使得答案中各项目所包含的码字长度总和最大。每一个项目包括一个码字,以及该码字在文本中的一个覆盖序列(如’abcadc’就是码字’abac’的一个覆盖序列),并且覆盖序列的长度不超过1000。同时,“答案”要求其中每个项目的覆盖序列互相没有重叠。
〖问题分析〗
对于此题,一种较容易得出的基本算法是:对覆盖序列在文本中的终止位置进行循环,再判断包含了哪些码字,找出所有项目,并最后使用动态规划的方法将项目组成最优的“答案”。
算法的其它方面我们暂且不做考虑,而先对问题所采用的逻辑结构进行选择。
如果我们采用线性的逻辑结构(如循环队列),那么我们在判断是否包含某个码字t时,所用的方法为:初始时用指针p指向终止位置,接着通过p的不断前移,依次找出码字t从尾到头的各个字母。例如码字为“ABDCAB”,而文本图1-1,终止位置为最右边的箭头符号,每个箭头代表依次找到的码字的各个字母。
指针p的移动方向
A B D C A B
C D A C B D C A D C D B A D C C B A D
图1-1
由于题目规定码字的覆盖序列长度不超过1000,所以进行这样的一次是否包含的判断,其复杂度为O(1000)。
由于码字t中相邻两字母在文本中的位置,并非只有相邻(如图1-1中的’D’和’C’)这一种关系,中间还可能间隔了许多的字母(如图1-1中’C’和’A’就间隔了2个字母),而线性结构中拥有的信息,仅仅只存在于相邻的两元素之间。通过这样简单的信息来寻找码字的某一个字母,其效率显然不高。
如果我们建立一个有向图,其中顶点i(即文本的第i位)用52条弧分别连接’a’..’z’,’A’..’Z’这52个字母在i位以前最后出现的位置(如图1-2的连接方式),我们要寻找码字中某个字母的前一个字母,就可以直接利用已连接的边,而不需用枚举的方法。我们也可以把问题看为:从有向图的一个顶点出发,寻找一条长度为length(t)-1的路径,并且路径中经过的顶点,按照码字t中的字母有序。
C D A C B D C A D C D B A D C C B A D
图1-2
通过计算,用图进行记录在空间上完全可以承受(记录1000个点×52条弧×4字节的长整型=200k左右)。在时间上,由于可以充分利用第i位和第i+1位弧的连接方式变化不大这一点(如图1-2所示,第i位和第i+1位只有一条弧的指向发生了变化,即第i+1位将其中一条弧指向了第i位),所以要对图中的弧进行记录,只需对弧的指向进行整体赋值,并改变其中的某一条弧即可。
因此,我们通过采用图的逻辑结构,使得寻找字母的效率大大提高,其判断的复杂度为O(length(t)),最坏为O(100),比原来方法的判断效率提高了10倍。
(附程序codes.pas)
对于这个例子,虽然用线性的数据结构也可以解决,但由于判断的特殊性,每次需要的信息并不能从相邻的元素中找到,而线性结构中只有相邻元素之间存在关系的这一点,就成为了一个很明显的缺点。因此,问题一线性结构中的信息,就属于“不可直接使用”的信息。相对而言,图的结构就正好满足了我们的需要,将所有可能产生关系的点都用弧连接起来,使我们可以利用弧的关系,高效地进行判断寻找的过程。虽然图的结构更加复杂,但却将“不可直接使用”的信息,转化成为了“可直接使用”的信息,算法效率的提高,自然在情理之中。。
二、 不记录“无用”信息。
从问题一中我们看到,由于图结构的信息量大,所以其中的信息基本上都是“可用”的。但是,这并不表示我们就一定要使用图的结构。在某些情况下,图结构中的“可用”信息,是有些多余的。
信息都“可用”自然是好事,但倘若其中“无用”(不需要)的信息太多,就只会增加我们思考分析和处理问题时的复杂程度,反而不利于我们解决问题了。
〖问题二〗 湖南省1997年组队赛的《乘船问题》
〖问题描述〗
有N个人需要乘船,而每船最多只能载两人,且必须同名或同姓。求最少需要多少条船。
〖问题分析〗
看到这道题,很多人都会想到图的数据结构:将N个人看作无向图的N个点,凡同名或同姓的人之间都连上边。
要满足用船最少的条件,就是需要尽量多的两人共乘一条船,表现在图中就是要用最少的边完成对所有顶点的覆盖。这就正好对应了图论的典型问题:求最小边的覆盖。所用的算法为“求任意图最大匹配”的算法。
使用“求任意图最大匹配”的算法比较复杂(要用到扩展交错树,对花的收缩等等),效率也不是很高。因此,我们必须寻找一个更简单高效的方法。
首先,由于图中任两个连通分量都是相对独立的,也就是说任一条匹配边的两顶点,都只属于同一个连通分量。因此,我们可以对每个连通分量分别进行处理,而不会影响最终的结果。
同时,我们还可以对需要船只s的下限进行估计:
对于一个包含Pi个顶点的连通分量,其最小覆盖边数显然为[Pi/2]。若图中共有L个连通分量,则s=∑[Pi/2](1<=i<=L)。
然后,我们通过多次尝试,可得出一个猜想:
实际需要的覆盖边数完全等于我们求出的下限∑[Pi/2](1<=i<=L)。
要用图的结构对上述猜想进行证明,可参照以下两步进行:
1. 连通分量中若不存在度为1的点,就必然存在回路。
2. 从图中删去度为1的点及其相邻的点,或删去回路中的任何一边,连通分量依然连通,即连通分量必然存在非桥边。
由于图的方法不是这里的重点,所以具体证明不做详述。而由采用图的数据结构得出的算法为:每次输出一条非桥的边,并从图中将边的两顶点删去。此算法的时间复杂度为O(n3)。(寻找一条非桥边的复杂度为O(n2),寻找覆盖边操作的复杂度为O(n))
由于受到图结构的限制,时间复杂度已经无法降低,所以如果我们要继续对算法进行优化,只有考虑使用另一种逻辑结构。这里,我想到了使用二叉树的结构,具体说就是将图中的连通分量都转化为二叉树,用二叉树来解决问题。
首先,我们以连通分量中任一个顶点作为树根,然后我们来确定建树的方法。
1. 找出与根结点i同姓的点j(j不在二叉树中)作为i的左儿子,再以j为树根建立子树。
2. 找出与根结点i同名的点k(k不在二叉树中)作为i的右儿子,再以k为树根建立子树。
如图2-1-1中的连通分量,我们通过上面的建树方法,可以使其成为图2-1-2中的二叉树的结构(以结点1为根)。(两点间用实线表示同姓,虚线表示同名)
图2-1-2
图2-1-1
接着,我就来证明这棵树一定包含了连通分量中的所有顶点。
【引理2.1】
若二叉树T中包含了某个结点p,那么连通分量中所有与p同姓的点一定都在T中。
证明:
为了论证的方便,我们约定:s表示与p同姓的顶点集合;lc[p,0]表示结点p,lc[p,i](i>0)表示lc[p,i-1]的左儿子,显然lc[p,i]与p是同姓的。
假设存在某个点q,满足qs且qT。由于s是有限集合,因而必然存在某个lc[p,k]无左儿子。则我们可以令lc[p,k+1]=q,所以qT,与假设qT相矛盾。
所以假设不成立,原命题得证。
由引理2.1的证明方法,我们同理可证引理2.2。
【引理2.2】
若二叉树T中包含了某个结点p,那么连通分量中所有与p同名的点一定都在T中。
有了上面的两个引理,我们就不难得出下面的定理了。
【定理一】
以连通分量中的任一点p作为根结点的二叉树,必然能够包含连通分量中的所有顶点。
证明:
由引理2.1和引理2.2,所有与p同姓或同名的点都一定在二叉树中,即连通分量中所有与p有边相连的点都在二叉树中。由连通分量中任两点间都存在路径的特性,该连通分量中的所有点都在二叉树中。
在证明二叉树中包含了连通分量的所有顶点后,我们接着就需要证明我们的猜想,也就是下面的定理:
【定理二】包含m个结点的二叉树Tm,只需要船的数量为boat[m]=[m/2](mN)。
证明:
(i) 当m=1,m=2,m=3时命题显然成立。
图2-2-1
图2-2-2
图2-2-3
(ii) 假设当m<k(k>3)时命题成立,那么当m=k时,我们首先从树中找到一个层次最深的结点,并假设这个结点的父亲为p。那么,此时有且只有以下三种情况(结点中带有阴影的是p结点):
(1) 如图2-2-1,p只有一个儿子。此时删去p和p唯一的儿子,Tk就成为了Tk-2,则boat[k]=boat[k-2]+1=[(k-2)/2]+1=[k/2]。
(2) 如图2-2-2,p有两个儿子,并且p是其父亲的左儿子。此时可删去p和p的右儿子,并可将p的左儿子放到p的位置上。同样地,Tk成为了Tk-2,boat[k]=boat[k-2]+1=[k/2]。
(3) 如图2-2-3,p有两个儿子,并且p是其父亲的右儿子。此时可删去p和p的左儿子,并可将p的右儿子放到p的位置上。情况与(2)十分相似,易得此时得boat[k]=boat[k-2]+1=[k/2]。
综合(1)、(2)、(3),当m=k时,boat[k]=[k/2]。
最后,综合(i)、(ii),对于一切mN,boat[m]=[m/2]。
由上述证明,我们将问题中数据的图结构转化为树结构后,可以得出求一棵二叉树的乘船方案的算法:
proc try(father:integer;var root:integer;var rest:byte);
{输出root为树根的子树的乘船方案,father=0表示root是其父亲的左儿子,
father=1表示root是其父亲的右儿子,rest表示输出子树的乘船方案后,
是否还剩下一个根结点未乘船}
begin
visit[root]:=true; {标记root已访问}
找到一个与root同姓且未访问的结点j;
if j<>n+1 then try(0,j,lrest);
找到一个与root同姓且未访问的结点k;
if k<>n+1 then try(1,k,rrest);
if (lrest=1) xor (rrest=1) then begin {判断root是否只有一个儿子,情况一}
if lrest=1 then print(lrest,root) else print(rrest,root);
rest:=0;
end
else if (lrest=1) and (rrest=1) then begin {判断root是否有两个儿子}
if father=0 then begin
print(rrest,root);root:=j; {情况二}
end
else begin
print(lrest,root);root:=k; {情况三}
end;
rest:=1;
end
else rest:=1;
end;
这只是输出一棵二叉树的乘船方案的算法,要输出所有人的乘船方案,我们还需再加一层循环,用于寻找各棵二叉树的根结点,但由于每个点都只会访问一次,寻找其左右儿子各需进行一次循环,所以算法的时间复杂度为O(n2)。(附程序boat.pas)
最后,我们对两种结构得出不同时间复杂度算法的原因进行分析。其中最关键的一点就是因为二叉树虽然结构相对较简单,但已经包含了几乎全部都“有用”的信息。由我们寻找乘船方案的算法可知,二叉树中的所有边不仅都发挥了作用,而且没有重复的使用,可见信息的利用率也是相当之高的。
既然采用树结构已经足够,图结构中的一些信息就显然就成为了“无用”的信息。这些多余的“无用”信息,使我们在分析问题时难于发现规律,也很难找到高效的算法进行解决。这正如迷宫中的墙一样,越多越难走。“无用”的信息,只会干扰问题的规律性,使我们更难找出解决问题的方法。
小结
我们对数据的逻辑结构进行选择,是构造数学模型一大关键,而算法又是用来解决数学模型的。要使算法效率高,首先必须选好数据的逻辑结构。上面已经提出了选择逻辑结构的两个条件(思考方向),总之目的是提高信息的利用效果。利用“可直接使用”的信息,由于中间不需其它操作,利用的效率自然很高;不不记录“无用”的信息,就会使我们更加专心地研究分析“有用”的信息,对信息的使用也必然会更加优化。
总之,在解决问题的过程中,选择合理的逻辑结构是相当重要的环
三、 选择合理的存储结构
数据的存储结构,分为顺序存储结构和链式存储结构。顺序存储结构的特点是借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系;链式存储结构则是借助指示元素存储地址的指针表示数据元素之间的逻辑关系。
因为两种存储结构的不同,导致这两种存储结构在具体使用时也分别存在着优点和缺点。
这里有一个较简单的例子:我们需要记录一个n×n的矩阵,矩阵中包含的非0元素为m个。
此时,我们若采用顺序存储结构,就会使用一个n×n的二维数组,将所有数据元素全部记录下来;若采用链式存储结构,则需要使用一个包含m个结点的链表,记录所有非0的m个数据元素。由这样两种不同的记录方式,我们可以通过对数据的不同操作来分析它们的优点和缺点。
1. 随机访问矩阵中任意元素。由于顺序结构在物理位置上是相邻的,所以可以很容易地获得任意元素的存储地址,其复杂度为O(1);对于链式结构,由于不具备物理位置相邻的特点,所以首先必须对整个链表进行一次遍历,寻找需进行访问的元素的存储地址,其复杂度为O(m)。此时使用顺序结构显然效率更高。
2. 对所有数据进行遍历。两种存储结构对于这种操作的复杂度是显而易见的,顺序结构的复杂度为O(n2),链式结构为O(m)。由于在一般情况下m要远小于n2,所以此时链式结构的效率要高上许多。
除上述两种操作外,对于其它的操作,这两种结构都不存在很明显的优点和缺点,如对链表进行删除或插入操作,在顺序结构中可表示为改变相应位置的数据元素。
既然两种存储结构对于不同的操作,其效率存在较大的差异,那么我们在确定存储结构时,必须仔细分析算法中操作的需要,合理地选择一种能够“扬长避短”的存储结构。
一、合理采用顺序存储结构。
我们在平常做题时,大多都是使用顺序存储结构对数据进行存储。究其原因,一方面是出于顺序结构操作方便的考虑,另一方面是在程序实现的过程中,使用顺序结构相对于链式结构更便于对程序进行调试和查找错误。因此,大多数人习惯上认为,能够使用顺序结构进行存储的问题,最“好”采用顺序存储结构。
其实,这个所谓的“好”只是一个相对的标准,是建立在以下两个前提条件之下的:
1. 链式结构存储的结点与顺序结构存储的结点数目相差不大。这种情况下,由于存储的结点数目比较接近,使用链式结构完全不能体现出记录结点少的优点,并且可能会由于指针操作较慢而降低算法的效率。更有甚者,由于指针自身占用的空间较大,且结点数目较多,因而算法对空间的要求可能根本无法得到满足。
2. 并非算法效率的瓶颈所在。由于不是算法最费时间的地方,这里是否进行改进,显然是不会对整个算法构成太大影响的,若使用链式结构反而会显得操作过于繁琐。
二、必要时采用链式存储结构。
上面我对使用顺序存储结构的条件进行了分析,最后就只剩下何时应该采用链式存储结构的问题了。
由于链式结构中指针操作确实较繁琐,并且速度也较慢,调试也不方便,因而大家一般都不太愿意用链式的存储结构。但是,这只是一般的观点,当链式结构确实对算法有很大改进时,我们还是不得不进行考虑的。
〖问题三〗 IOI99的《地下城市》。
〖问题描述〗
已知一个城市的地图,但未给出你的初始位置。你需要通过一系列的移动和探索,以确定初始时所在的位置。题目的限制是:
1. 不能移动到有墙的方格。
2. 只能探索当前所在位置四个方向上的相邻方格。
在这两个限制条件下,要求我们的探索次数(不包括移动)尽可能的少。
〖问题分析〗
由于存储结构要由算法的需要确定,因此我们首先来确定问题的算法。
经过对问题的分析,我们得出解题的基本思想:先假设所有无墙的方格都可能是初始位置,再通过探索一步步地缩小初始位置的范围,最终得到真正的初始位置。同时,为提高算法效率,我们还用到了分治的思想,使我们每一次探索都尽量多的缩小初始位置的范围(使程序尽量减少对运气的依赖)。
接着,我们来确定此题的存储结构。
由于这道题的地图是一个二维的矩阵,所以一般来讲,采用顺序存储结构理所当然。但是,顺序存储结构在这道题中暴露了很大的缺点。我们所进行的最多的操作,一是对初始位置的范围进行筛选,二是判断要选择哪个位置进行探索。而这两种操作,所需要用到的数据,只是庞大地图中很少的一部分。如果采用顺序存储结构(如图3-1中阴影部分表示已标记),无论你需要用到多少数据,始终都要完全的遍历整个地图。
4
3
2
1
1 2 3 4
图3-1
head
图3-2
然而,如果我们采用的是链式存储结构(如图3-2的链表),那么我们需要多少数据,就只会遍历多少数据,这样不仅充分发挥了链式存储结构的优点,而且由于不需单独对某一个数据进行提取,每次都是对所有数据进行判断,从而避免了链式结构的最大缺点。
我们使用链式存储结构,虽然没有降低问题的时间复杂度(链式存储结构在最坏情况下的存储量与顺序存储结构的存储量几乎相同),但由于体现了前文所述选择存储结构时扬长避短的原则,因而算法的效率也大为提高。(程序对不同数据的运行时间见表3-3)
测试数据编号 使用顺序存储结构的程序 使用链式存储结构的程序
1 0.06s 0.02s
2 1.73s 0.07s
3 1.14s 0.06s
4 3.86s 0.14s
5 32.84s 0.21s
6 141.16s 0.23s
7 0.91s 0.12s
8 6.92s 0.29s
9 6.10s 0.23s
10 17.41s 0.20s
表3-3
(附使用链式存储结构的程序under.pas)
我们选择链式的存储结构,虽然操作上可能稍复杂一些,但由于改进了算法的瓶颈,算法的效率自然也今非昔比。由此可见,必要时选择链式结构这一方法,其效果是不容忽视的。
小结
合理选择逻辑结构,由于牵涉建立数学模型的问题,可能大家都会比较注意。但是对存储结构的选择,由于不会对算法复杂度构成影响,所以比较容易忽视。那么,这种不能降低算法复杂度的方法是否需要重视呢?
大家都知道,剪枝作为一种常用的优化算法的方法,被广泛地使用,但剪枝同样是无法改变算法的复杂度的。因此,作用与剪枝相似的存储结构的合理选择,也是同样很值得重视的。
总之,我们在设计算法的过程中,必须充分考虑存储结构所带来的不同影响,选择最合理的存储结构。
四、 多种数据结构相结合
上文所探讨的,都是如何对数据结构进行选择,其中包含了逻辑结构的选择和存储结构的选择,是一种具有较大普遍性的算法优化方法。对于多数的问题,我们都可以通过选择一种合理的逻辑结构和存储结构以达到优化算法的目的。
但是,有些问题却往往不如人愿,要对这类问题的数据结构进行选择,常常会顾此失彼,有时甚至根本就不存在某一种合适的数据结构。此时,我们是无法选择出某一种合适的数据结构的,以上的方法就有些不太适用了。
为解决数据结构难以选择的问题,我们可以采用将多种数据结构进行结合的方法。通过多种数据结构相结合,达到取长补短的作用,使不同的数据结构在算法中发挥出各自的优势。
这只是我们将多种数据结构进行结合的总思想,具体如何进行结合,我们可以先看下面的例子。
我们可以采用映射的方法,将线性结构中的元素与堆中间的结点一一对应起来,若线性的数组中的元素发生变化,堆中相应的结点也接着变化,堆中的结点发生变化,数组中相应的元素也跟着变化。
将两种结构进行结合后,无论是第一步还是第二步,我们都不需对所有元素进行遍历,只需进行常数次复杂度为O(log2n)的堆化操作。这样,整个时间复杂度就成为了O(nlog2n),算法效率无疑得到了很大提高。
五、 总结
我们平常使用数据结构,往往只将其作为建立模型和算法实现的工具,而没有考虑这种工具对程序效率所产生的影响。信息学问题随着难度的不断增大,对算法时空效率的要求也越来越高,而算法的时空效率,在很大程度上都受到了数据结构的制约。
㈧ Tent映射与PSO算法用于波段寻优的思想
高光谱遥感对地物光谱特征进行了细致的刻画,提高了地物识别的可靠性,但是随着光谱维数增加也带来了大量冗余数据,给高光谱数据处理与信息识别等增添了负担,同时也会影响地物识别的精度,故地物识别时对高光谱数据进行降维、选取特征波段就显得非常重要。支持向量机(Support Vector Machine,SVM)是一种机器学习算法,由美国贝尔实验室Vapnik针对分类和回归问题,为适合小样本学习问题首先提出来的(Vapnik,1995),SVM具有很好的泛化能力,并在一定程度上克服了机器学习的维数灾难。近年来,SVM以及基于其他算法改进的SVM用于高光谱影像的分类得到了广泛应用,并取得了很好的分类精度(Melgani et al.,2004;李祖传等,2011)。但针对高光谱数据冗余性,粒子群优化(Particle Swarm Optimization,PSO)算法在寻找最优特征波段组合与进一步提高SVM分类精度方面具有较好的优势。
PSO算法是一种通过个体与群体之间的协作来寻找最优解的机器学习算法,具有自适应,自组织以及快速得到最优解的能力。PSO算法首先由Kennedy和Eberhart提出来的,后来为了使PSO有更广泛的应用范围,他们又提出了二进制PSO算法(Kennedy et al.,1995,1997;Khanesar et al.,2007;张浩等,2008)。自从PSO算法提出以来,该算法已经在各个研究领域得到了广泛的关注。在高光谱遥感应用方面,Monteiro和Kosugi(2007)提出基于PSO的高光谱影像最佳波段组合和最佳波段数的选取方法,并通过实验和传统波段选取方法相比较,证明了基于PSO进行特征波段选取的优越性。丁胜等(2010)提出一种PSO-BSSVM分类模型,用于高光谱影像特征波段的选取以及对SVM的参数寻优,通过和其他方法的实验比较得出该模型可以提高分类精度。李林宜和李德仁(2011)也在模糊特征的选取中也用了PSO算法。总之PSO在高光谱影像分类的特征波段选取中应用比较成功,但由于PSO容易早熟,陷入局部最优,所以针对这点以及为获得更高的SVM分类精度,对PSO加以改进是非常有意义的。Tent映射是混沌理论中典型的混沌映射例子,Tent映射具有随机性和遍历性,所以把Tent映射加入PSO可以对PSO算法容易陷入局部最优的状况进行改善。本章就主要通过改进Tent映射后运用于二进制PSO算法进行寻优,寻找高光谱影像SVM分类的最优特征波段组合。
㈨ 色调映射的色调映射算法
在最近几年中已经开发了各种各样的色调映射算法 用于生成前一幅图像的六幅不同曝光程度的图像
另外一组更加复杂的算法是基于对比度或者梯度域的方法,这些算法的侧重点在于对比度的保持而不是亮度的映射,这种方法的思路起源于人眼对于对比度或者不同亮度区域的亮度比例最为敏感。这种色调映射由于较好地保存了对比度细节,所以通常会产生非常锐利的图像,但是这样做的代价是使得整体的图像对比度变得平缓。