‘壹’ <算法图解>
二分查找、大O分析法;数组和链表;递归、快速排序;分治、动态规划、贪婪算法;散列表(键值对组成的数据结构);图算法(模拟网络的方法):广度优先搜索、迪杰斯特拉算法(计算网络中两点之间最短距离);K近邻(KNN,用于创建推荐系统、OCR引擎、预测股价、物件分类)。
二分查找的时间复杂度为log2n,多少个2相乘等于n。
有序数组,定义low和high,非一个元素,猜中,大了,小了。
选择排序:o(n方),快速排序:o(nlogn),存储最小的值,存储最小元素的索引,找出最小的值,加到新数组中。
循环,程序的性能更好,递归,程序更容易理解。栈有两种操作:压入和弹出。
每个递归函数都有两部分:基线条件和递归条件,递归条件指的是函数调用自己,基线条件指的是函数不再调用自己,避免无限循环。
编程概念,调用栈,计算机在内部使用被称为调用栈的栈,递归是调用自己的函数。
调用栈可能占用大量内存,解决方案是编写循环代码,或者使用尾递归,但并非所有的语言都支持尾递归。
分治-递归式问题解决办法:步骤:找出基线条件,确定如何缩小问题的规模,使其符合基线条件。
涉及数组的递归函数,基线条件通常是数组为空或只包含一个元素。
快速排序-D&C算法:步骤:设置基线条件,数组小于2,选择基准值,将数组分成两个子数组:小于和大于基准值的元素,对这两个子数组进行快速排序,递归调用。
合并排序:o(nlogn),快速排序:o(nlogn):层数o(logn)乘每层需要的时间o(n),但最差情况为o(n方)。
散列表-基本数据结构之一:内部机制:实现、冲突、散列函数。
散列表无序,数据结构:数组、列表、(栈、不能用于查找)、散列表(包含额外逻辑)。
数组和链表都直接映射到内存,但散列表使用散列函数来确定元素存储位置。
散列函数:不同的输入映射到不同的索引,输出不同的数字,散列表是散列函数和数组的结合,也称散列映射、映射、字典、关联数组。
缓存的数据存储在散列表中,访问页面时,先检查散列表是否存储了页面。
如果两个键映射到了同一个位置引发冲突,可以在这个位置存储一个链表,好的散列函数可以减少冲突。
填装因子为散列表元素/位置总数,因子越低,发生冲突的可能性越小,性能越高。
广度优先搜索(BFS)的含义:解决最短路径问题的算法。
步骤:使用图来建立问题模型,使用广度优先搜索算法(是否有路径,哪个路径最短)。
所有算法中,图算法是最有用的。
队列(数据结构):类似于栈,不能随机访问队列中元素,只支持入队和出队(压入和弹出),先加入的先出队,即先进先出(FIFO),而栈是后进先出(LIFO)。
有向图:关系是单向的,无向图:没有箭头,直接相连的节点互为邻居。
拓扑排序:根据图创建一个有序列表。
迪杰斯特拉算法:适用于加权图(提高或降低某些边的权重),找出加权图中的最短路径。
只适用于有向无环图,如果有负权边,不能使用迪杰斯特拉算法,因为算法假设处理过的节点,没有前往终点的最短路径,故,有负权边的可用贝尔曼-福特算法。
在未处理的节点找到开销最小的节点,遍历当前节点的所有邻居,如果经当前节点前往该邻居更近,就更新邻居开销,同时将该邻居的父节点设置为当前节点,将当前节点标记为处理过,找出接下来要处理的节点,并循环。
贪婪算法:每步都选择局部最优解,最终就是全局最优解,易于实现,运行快,是个不错的近似算法。
集合类似于列表,但是不包含重复的元素。
贪婪算法:o(n方),NP完全问题:需要计算所有的解,从中选出最小距离,计算量大,最佳做法是使用近似算法。
动态规划:约定条件下找到最优解,在问题可分解为彼此独立且离散的子问题时,就可使用动态规划来解决。
动态规划解决方案涉及网络,每个单元格都是子问题,需考虑如何将问题分解为子问题。
最长公共序列。
K最近邻算法(KNN):电影推荐系统。
特征抽取:指标打分,计算距离(相似程度),N维。
KNN的基本工作:分类和回归。
应用:OCR光学字符识别(optical character recognition),提取线段、点、曲线特征,找出与新图像最近的邻居;语音识别,人脸识别。
垃圾邮件过滤器:朴素贝叶斯分类器。
二叉查找树(binary search tree):有序树状数据结构。
二叉查找树插入和删除操作快于有序数组,但不能随机访问(没有索引)。
红黑树是处于平衡状态的特殊二叉树,不平衡时,如向右倾斜时性能不佳。
B树是一种特殊的二叉树。
反向索引:一个散列表,将单词映射到包含他的页面,常用于创建搜索引擎。
并行算法:速度的提升非线性,因为并行性管理开销和负载均衡。
分布式算法:特殊的并行算法,maprece(映射和归并函数),映射:任务多时自动分配多台计算机完成,将一个数组转换成另一个数组,归并是将一个数组转换成一个元素。
线性规划:在给定约束条件下最大限度的改善指定指标,使用simplex算法,图算法为线性规划子集。
‘贰’ 【图解】数据结构代码领背-折半插入排序
折半插入排序,巧妙地将数组划分为有序与无序两部分,其核心思想是利用折半查找的高效性,寻找待插入元素的精确位置。相较于直接插入排序,它在比较次数上有所优化,但移动元素的次数并未减少,整体时间复杂度依然保持在O(n^2)。让我们通过一个生动示例来揭秘这一算法的运作机制。 以数组{3,1,7,5,2,4}为例,不使用“哨兵”辅助,但理解其原理同样重要。首先,我们以元素1开始,作为待排元素(记为temp)。在第一轮中,temp = 1,mid指向3,发现temp < A[mid],所以将high更新为mid-1(即-1),循环结束,1的插入位置为0。 进入第二轮,待排元素是7。low = 0,high = 1,mid = 0指向1,由于temp > mid,low递增为1。再次计算,mid = 1,temp > mid,此时low = mid + 1 = 2。因为low > high,循环结束,7应插入位置为2。 第三轮,以5为例,mid第一次指向3,发现5 A[mid],于是high = mid - 1 = 1。由于low = 2 > high,插入位置确定为high + 1,即2。接下来的元素插入过程同样遵循这个逻辑,细节之处尽显折半查找的精妙。 在编写代码时,需要注意以下几点: 深入理解折半插入排序,不仅有助于提升代码实现的效率,还能在解决复杂问题时提供有力的算法工具。通过实践和分析,你将能更好地驾驭这一数据结构的精髓。
【视觉解读】深入剖析:折半插入排序的代码实践与理解</