贪心算法聚类_算法设计的目录

1. 倪志伟的论文专着

近五年来，在国内外学术期刊上公开发表论文30多篇，其中有15篇论文被EI或ISTP收录。出版的教材或专着有：
1．《Foxpro实用教程》，南京大学出版社，1994年（主编）
2．《用C++建造专家系统》，电子工业出版社，1996年（副主编）3．《机器学习与智能决策支持系统》，科学出版社，2004年5月（副主编）
4．《编译原理》，北京希望电子出版社，2005年11月（主编）
5．《现代物流技术》，中国物资出版社，2006年1月（主编）（被评为国家“十一五”规划教材）
6．《物流信息系统》，中国物资出版社，2006年2月（副主编）
7. 《智能管理技术与方法》，科学出版社，2007年10月（主编）
8. 《动态数据挖掘》，科学出版社，2010年8月（主编）
近年来，发表的主要学术论文如下： [1] Zhangjun Wu, Xiao Liu, Zhiwei Ni, Dong Yuan, Jinjun Chen, Yun Yang: A Market-Oriented Hierarchical Scheling Strategy in Cloud Workflow Systems, Journal of Supercomputing, Volume 63,Issue 1,pp.256-293,2013.(UT WOS:000313166000013).[2] Xiao Liu,Zhiwei Ni,et al.A Novel Statistical Time-Series Pattern based Interval Forecastting Strategy for Activity Durations in Workflow Systems.Journal of Software and system,2011,(84),354-376.(SCI indexed)[3] Liping Ni, Zhiwei Ni, YaZhuo Gao.Stock trend Prediction Based on Fractal Feature Selection and Support Vector Machine.Expert system with applications,2011,(38),5569-5576.(SCI indexed)[4]Xiao Liu,Zhiwei Ni,et al.A probabilistic strategy for temporal constraint management in scientisfic workflow systems.Concurrrency and Computation :Pratice and Experience,2011,23(16),1893-1919.(SCI indexed) [5] Xiao Liu, Zhiwei Ni, Zhangjun Wu, Dong Yuan, Jinjun Chen, Yun Yang: A Novel General Framework for Automatic and Cost-Effective Handling of Recoverable Temporal violations in Scientific Workflow Systems, Journal of Software and System,2011,(84),492-509. (SCI indexed ) [6]Zhiwei Ni,Junfeng guo ,et al.An Efficient Method for Improving Query Efficiency in Data Warehouse.Journal of software,2011,6(5),857-865.[7]高雅卓，倪志伟等.连续属性上的OLAP查询建模方法研究.情报学报，2011，30(4),372-379.[8]张以文，倪志伟等.云计算环境下动态虚拟企业伙伴选择模型.计算机科学，2011，38(7),212-215.[9]倪志伟，公维峰等.数据流中随机型分型维数计算方法研究.计算机科学，2011，38(4),209-212.[10]倪志伟，吴昊等.基于改进的经验模态分解的时间序列匹配算法.系统仿真学报，2011，23(11),2395-2399.[11]姜苗，倪志伟等.数据流时间窗口中闭频繁项集的在线挖掘.中国科学技术大学学报，2011，(8),729-745.[12] Zhangjun Wu, Zhiwei Ni, Lichuan Gu, Xiao Liu: A Revised Discrete Particle Swarm Optimization for Cloud Workflow Scheling, 2010 International Conference on Computational Intelligence and Security (CIS2010), Nanning, China, 11-14 Dec. 2010 (EI indexed) [13] Xiao Liu, Zhiwei Ni, Zhangjun Wu, Dong Yuan, Jinjun Chen, Yun Yang: A Framework for Handling Fine-Grained Recoverable Temporal Violations in Scientific Workflows, 16th IEEE International Conference on Parallel and Distributed Systems (ICPADS2010), Shanghai, China, December 7-11, 2010, on Sept. 05, 2010 (EI indexed). [14] Yazhuo Gao, Zhiwei Ni, Yuxiao Zhao.A scheling strategy for OLAM tasks and its application in a financial BI system Business Intelligence and Financial Engneering .2009会议论文集: 435-440 (EI收录) [15] Zhiwei Ni, Dan Han, Gongrang Zhang, Yazhuo Gao.Extension CBR Retrieval.AICI2009:224—227 (EI收录) [16] Zhangjun Wu, Zhiwei Ni，Chang Zhang, Lichuan Gu. A Novel PSO for Multi-stage Portfolios Planning, IEEE International Conference on Artificial Intelligence and Computational Intelligence (AICI2009)，71—77 (EI收录) [17] Chang Zhang, Zhiwei Ni, Zhangjun Wu,Lichuan Gu. A Novel Swarm Model with Quasi-Oppositional Particle, International Forum on Information Technology and Applications (IFITA 2009), pp.325-330 (EI收录) [18] Li Fenggang, Wang Xiaolu, Ni Zhiwei, Ni Liping. Semantic Analysis Based Literature Transaction System of Xi-An Medical Authority, Intelligent Information Management Systems and Technologies (2010),Volume6,No.3 ,219—226 [19] Xiao Liu, Jinjun Chen, Zhangjun Wu, Zhiwei Ni, Dong Yuan, Yun Yang.Handling Recoverable Temporal Violations in Scientific Workflow Systems: A, Workflow Rescheling Based Strategy,2010,pp.534-537 [20]Chao Wang ,Zhi-wei Ni ,Jun-fen Guo.A Fast Bidirectional Method for Mining Maximal Frequent Itemsets，The Third International Joint Conference on Computational Sciences and Optimization (CSO 2010),447—450 [21]倪志伟,高雅卓,李伟东,束建华.基于矩阵的增量式关联规则挖掘算法.计算机工程与应用, 2008,44(13):153-155 [22]刘斌,倪志伟,赵敏.基于属性重要性的贪心算法的改进算法.合肥工业大学学报,2010,33(8):1185-1188 [23]王丽红,倪志伟, 高雅卓.改进的蚁群算法求解多目标车间作业调度问题.计算机技术与发展,2008 ,18(10):49—52 [24]吴姗,倪志伟,罗贺,郑盈盈.一种基于密度的无监督联系发现方法.中国管理科学,2008,16:29—32 [25]梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数聚类算法.计算机应用,2009,29(3):830-833 [26]倪丽萍,倪志伟,吴昊,叶红云.基于分形维数和蚁群算法的属性选择方法.模式识别与人工智能, 2009,22(2):293—298(EI收录) [27]倪志伟,倪丽萍,杨葛钟啸.分形技术在案例库维护中的应用.计算机应用,2009,29(6):1598—1604 [28]倪志伟,吴姗,胡汤磊.联系发现在证券客户划分中的应用研究.计算机工程与应用, 2009, 45(18):201--204 [29]Dan Han, Zhiwei Ni, Gongrang Zhang, Hongyu Wang, Jun Yan. Research and Design the Extension Case BaseBased on CBR. BIFE International meeting, 2009，:210—214 (EI收录) [30]郑盈盈,倪志伟,吴姗,王丽红.基于移动网格和密度的数据流聚类算法.计算机工程与应用,2009,45(8):129--131 [31]王园园,倪志伟,赵裕啸,伍章俊.基于决策树的模糊聚类评价算法及其应用.计算机技术与发展, 2009,19(9):232-235 [32]严军,倪志伟,王宏宇,韩丹.案例推理在汽车诊断中的应用.计算机应用研究. 2009,26(10):3846-3848 [33]刘慧婷,倪志伟.基于EMD与交叉覆盖算法的个人信用的评估.计算机工程与设计,2009,10:4472—4491 [34]刘慧婷,倪志伟.基于EMD与K-means算法的时间序列聚类.模式识别与人工智能,2009.10 :803—808 [35]倪志伟,李建洋,李锋刚, 杨善林.案例决策技术及案例决策支持系统研究综述.计算机科学,2009,36(11):18—23 [36]郭峻峰, 倪志伟, 高雅卓, 伍章俊.一种提高数据仓库查询效率的有效方法.计算机集成制造系统, 2009,15(12):2451-2457 (EI收录) [37]高雅卓,倪志伟,郭峻峰,胡汤磊.用户兴趣驱动的冰山数据立方体构建及更新方法研究.计算机科学, 2009,36(12):179-182 [38]赵裕啸,倪志伟,王园园,伍章俊.SQL Server 2005数据挖掘技术在证券客户忠诚度的应用.计算机技术与发展, 2010,20(2):229-232 [39]李锋刚,倪志伟, 郜峦.案例推理和多策略相似性检索的中医处方自动生成.计算机应用研究,2010, 27(2):544—547 [40]李建洋,倪志伟,郑金彬,谢秀珍.案例知识维护技术的研究进展.武汉工程大学学报,2010,32(3):96-99 [41]赵敏,倪志伟,刘斌.K-means与朴素贝叶斯在商务智能中的应用.计算机技术与发展, 2010,20(4):179-182 [42]王宏宇,倪志伟,严军,韩丹.灰度关联理论在CBR中的应用研究.计算机技术与发展, 2010,20(5):96-100 [43]罗义钦,倪志伟,杨葛钟啸.一种新的数据流分形聚类算法.计算机工程与应用, 2010,46 (6): 136-13 [44]查春生，倪志伟，倪丽萍，公维峰.基于相空间重构的股指时间序列相关性分析,计算机技术与发展，计划在2010年第8期刊载 [45]姜苗，倪志伟，王超，戴奇波.在线挖掘数据流混合窗口中闭频繁项集，系统仿真学报， [46]辜丽川，倪志伟，张友华.一种基于核矩阵迭代学习的范例相似度算法，模式识别与人工智能。 [47] Case base maintenance based on outlier data mining，Proc. 4th Intl. Conf. on Machine Learning and Cybernetics，IEEE Press, China, 2005.8 ，2861-2864 [48] 基于相似粗糙集的案例特征项的约简维护, 计算机科学，Vol.32,No.8.A , 2005，93-96 [49] 数据流管理与挖掘研究, 合肥工业大学学报(自然科学版), Vol.28, No.9 , 2005，1157-1162 [50] Case-Based Reasoning Framework Based On Data Mining Technique. Proceedings of the Third International Conference on Machine Learning and Cybernetics, Shanghai, August，2004，2511-2514 [51] 基于案例和规则相结合的推理技术,小型微型计算机系统，2004,Vol.25，No.7,1155-1158 [52] 集成范例推理系统的研究，系统仿真学报，2004，Vol.16，No.4， 803-806 [53] 范例推理中范例自动获取的数据挖掘技术，天津大学学报，2003年，Vol.36,No.1，82-86 [54] 基于知识发现的范例推理系统，计算机科学，Vol.30,No.5,2003年，26-29 [55] 范例推理系统中的范例库维护，小型微型计算机系统，Vol.24, No.10，2003年10月，1825-1828 [56] Integrated case-based reasoning，Proceedings of 2003 International Conference on Machine Learning and Cybernetics ,Xi’an,2003，1845-1849 [57]范例推理中的知识发现技术，小型微型计算机系统，Vol.23,No.2，2002年2月，159-162 [58]范例库中特征项权重的发现技术，厦门大学学报， Vol.41,No.2,2002年3月，168-172 [59]用神经网络来实现基于范例的推理系统，计算机工程，2002年7月，Vol.28,No.7 [60]A neural network case-based reasoning and its application , Proceedings of 2002 International Conference on Machine Learning and Cybernetics ,Beijing, 2002.11，529-532 [61]范例库上的知识发现，南开大学学报，2002年12月，Vol.35,No.4 [62]神经网络专家系统及其数据挖掘技术的探讨，系统工程学报，2001年，Vol.16, No.1, 61-65

2. 分组算法的典型代表包括什么

哈希算法、贪心算法、分治算法、聚类算法。
1、哈希算法：哈希算法通常使用散列函数将输入数据转换为固定长度的哈希值，并按照哈希值来划分不同的数据组。哈希算法的特点是速度快、存储空间小，但可能存在哈希冲突等问题。
2、贪心算法：贪心算法是一种从局部最优解出发，逐步扩展到全局最优解的算法。在分组问题中，贪心算法可以根据某些特定的分组规则（例如距离、大小、权重等），逐步将数据划分为多个子集，以达到最优解。
3、分治算法：分治算法是将大问题拆分为多个小问题，然后分别解决这些小问题的算法。在分组问题中，我们可以采用分治思想，将样本分成多个子集，分别对每个子集进行处理，最后将结果合并起来。
4、聚类算法：聚类算法通常通过计算相似性或距离来将数据分组。例如，K均值算法可以先随机选取几个中心点，然后按照距离将数据集分为多个簇，最后调整中心点的位置以达到最优解。

3. 算法设计的目录

第1章引言：某些典型的问题
1.1第一个问题：稳定匹配
1.2五个典型问题
带解答的练习
练习
注释和进一步的阅读
第2章算法分析基础
2.1计算可解性
2.2增长的渐近阶
2.3用表和数组实现稳定匹配算法
2.4一般运行时间的概述
2.5更复杂的数据结构：优先队列
带解答的练习
练习
注释和进一步的阅读
第3章图
3.1基本定义与应用
3.2图的连通性与图的遍历
3.3用优先队列与栈实现图的遍历
3.4二分性测试：宽度优先搜索的一个应用
3.5有向图中的连通性
3.6有向无圈图与拓扑排序
带解答的练习
练习
注释和进一步的阅读
第4章贪心算法
4.1区间调度：贪心算法领先
4.2最小延迟调度：一个交换论证
4.3最优高速缓存：一个更复杂的交换论证
4.4一个图的最短路径
4.5最小生成树问题
4.6实现Kruskal算法：Unoin－Find数据结构
4.7聚类
4.8Huffman码与数据压缩
4.9最小费用有向树：一个多阶段贪心
带解答的练习
练习
注释和进一步的阅读
第5章分治策略
5.1第一个递推式：归并排序算法
5.2更多的递推关系
5.3计数逆序
5.4找最接邻近的点对
5.5整数乘法
5.6卷积与快速傅里叶变换
带解答的练习
练习
注释和进一步的阅读
第6章动态规划
6.1带权的区间调度：一个递归过程
6.2动态规划原理：备忘录或者子问题迭代
6.3分段的最小二乘：多重选择
6.4子集和与背包：加一个变量
6.5RNA二级结构：在区间上的动态规划
6.6序列比对
6.7通过分治策略在线性空间的序列比对
6.8图中的最短路径
6.9最短路径和距离向量协议
6.10图中的负圈
带解答的练习
练习
注释和进一步的阅读
第7章网络流
第8章Ng与计算的难解性
第9章一个超出
第10章扩展易解性的界限
第11章近似算法
第12章局部搜索
第13章随机算法
后记：永不停止运行的算法
索引

4. 当前最火IT专业术语（以后陆续完善）

我国大数据产业蓬勃发展，各级政府与企业积极促进技术创新，推动大数据应用，产业体系初具规模，支撑能力不断增强。展望未来，大数据产业正步入“黄金期”。在大数据成为热门话题的今天，了解相关专业术语对生活与工作大有裨益。本文将介绍人工智能、区块链、图灵测试、回归分析、MapRece、贪心算法、数据挖掘、数据可视化、分布式计算、分布式架构、Hadoop、BI（商务智能）、NoSQL、结构化数据、半结构化数据、非结构化数据库、数据清洗、算法、深度学习、人工神经网络、数据聚类、随机森林、分治法、支持向量机、熵、辛普森悖论、朴素贝叶斯模型、数据科学家、并行处理、云计算等重要术语。

人工智能( AI)是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新兴技术科学。它企图了解智能的实质，并生产出一种能以人类智能相似的方式做出反应的智能机器。人工智能领域包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来，理论和技术日益成熟，应用领域不断扩大。

区块链是一种将数据以时间顺序相连的方式组合成的链式数据结构，并以密码学方式保证其不可篡改和不可伪造。区块链技术可应用于分布式账本、自动化脚本代码（智能合约）等，形成全新的分布式基础架构与计算范式。

图灵测试是艾伦·图灵发明的一种测试机器是否具有人类智能的方法。测试者通过提问与被测试者（人或机器）隔开，判断是否能确定出被测试者是人还是机器。目前，我们对机器思考能力的预测已远远落后于图灵的原始预测。

回归分析是一种确定变量间相互依赖的定量关系的统计分析方法。根据涉及变量的数量，可分为一元回归、多元回归、简单回归和多重回归。如果只包含一个自变量和一个因变量，且二者关系可用直线近似表示，称为一元线性回归。

MapRece是一种编程模型，用于大规模数据集的并行运算。其核心思想是映射（Map）和归约（Rece），借鉴了函数式编程和矢量编程的特性，极大方便了编程人员在无需分布式并行编程的情况下运行程序。

贪心算法是一种在对问题求解时总是做出在当前看来是最好的选择的算法。其关键在于选择局部最优解，但必须满足无后效性。贪心算法的基本思路是从问题的一个初始解出发，逐步进行，确保每一步都是局部最优解。

数据挖掘是从大量数据中通过算法搜索隐藏于其中信息的过程。它通常涉及统计、在线分析处理、情报检索、机器学习、专家系统（基于过去的经验法则）和模式识别等方法，目标是发现知识。

数据可视化是关于数据视觉表现形式的科学技术研究，通过图形、图像处理、计算机视觉和用户界面展示数据，以表达、建模和显示立体、表面、属性和动画。

分布式计算是研究分散系统如何进行计算的领域，这些系统由链接和通信的电子计算组成。分布式架构是分布式计算技术的应用和工具，用于处理大规模计算任务。

Hadoop是一个分布式系统基础架构，允许用户在不了解分布式底层细节的情况下开发分布式程序。它提供了一个分布式文件系统（HDFS）和MapRece框架。

BI（商务智能）是一套完整解决方案，用于整合企业数据，快速准确地提供报表和决策依据。商业智能能够辅助操作层、战术层和战略层的决策。

NoSQL（非SQL）数据库是不兼容SQL功能的关系型数据库。它们具有非关系型、分布式、不提供ACID特性等特征，旨在处理结构化和非结构化数据。

结构化数据是指数据库中的数据，如企业ERP、财务系统、医疗HIS数据库等。它们通常用于高速存储、数据备份、数据共享和数据容灾。

半结构化数据具有一定的结构性，但不像严格的关系数据库数据那样结构化。例如，OEM是一种典型的半结构化数据模型。

非结构化数据库用于处理非结构化数据，如全文文本、图像、声音、影视、超媒体等。它们不仅可以处理结构化数据，还可以处理更复杂的数据类型。

数据清洗是发现并纠正数据文件中错误数据的最后一道程序。它包括检查数据一致性、处理无效值和缺失值等，以过滤不符合要求的数据。

算法是解题方案的描述，包含一系列解决问题的清晰指令。算法的优劣由空间复杂度和时间复杂度衡量。

深度学习是基于人工神经网络研究的一种算法，通过组合低层特征形成更抽象的高层表示，以发现数据的分布式特征表示。

人工神经网络是一种模仿动物神经网络行为特征的算法模型，用于分布式并行信息处理。

数据聚类是静态数据分析技术，广泛应用于机器学习、数据挖掘、模式识别、图像分析和生物信息等领域。聚类是将相似对象分组，形成不同子集，以便在每个子集中成员具有相似的属性。

随机森林是一种包含多个决策树的分类器，通过多个树的输出结果的众数来确定分类。它是基于Leo Breiman和Adrian Cutler发展出的算法。

分治法是一种计算机科学中的重要算法，将复杂问题分解为两个或多个相同或相似的子问题，再递归地解决子问题，直到最后得到原问题的解。

支持向量机是一种有监督学习模型，用于模式识别、分类和回归分析。其主要思想是将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分。

熵是体系混乱程度的度量，在热力学、概率论、数论、天体物理、生命科学等领域有广泛应用。熵的概念由鲁道夫·克劳修斯提出，并应用于热力学中。

辛普森悖论是指在某个条件下，两组数据分别讨论时会满足某种性质，但合并考虑时可能导致相反的结论。在探究变量相关性时，辛普森悖论可能在某些前提下出现。

朴素贝叶斯模型是一种贝叶斯分类算法，基于贝叶斯定理，通过“朴素”的假定（属性之间条件独立）进行数据分类。

数据科学家是运用科学方法、数据挖掘工具和数字化技术寻找复杂数据洞察的工程师或专家。他们需要具备数据采集、数学算法、数学软件、数据分析、预测分析、市场应用和决策分析等技能。

并行处理是计算机系统中同时执行两个或更多处理机的一种计算方法，旨在节省大型和复杂问题的解决时间。并行处理需要程序并行化，即将工作各部分分配到不同处理机中，以实现协同工作。

云计算基于互联网提供动态、易扩展且经常虚拟化的资源，通常涉及通过互联网提供服务。云计算能够模拟核爆炸、预测气候变化和市场发展趋势，使用户通过电脑、笔记本、手机等设备接入数据中心，按需进行运算。

导航:首页 > 源码编译 > 贪心算法聚类

贪心算法聚类

与贪心算法聚类相关的资料