恋上数据结构算法图解_<算法图解>

‘壹’ <算法图解>

二分查找、大O分析法；数组和链表；递归、快速排序；分治、动态规划、贪婪算法；散列表（键值对组成的数据结构）；图算法（模拟网络的方法）：广度优先搜索、迪杰斯特拉算法（计算网络中两点之间最短距离）；K近邻（KNN，用于创建推荐系统、OCR引擎、预测股价、物件分类）。

二分查找的时间复杂度为log2n，多少个2相乘等于n。

有序数组，定义low和high，非一个元素，猜中，大了，小了。

选择排序：o(n方)，快速排序：o(nlogn)，存储最小的值，存储最小元素的索引，找出最小的值，加到新数组中。

循环，程序的性能更好，递归，程序更容易理解。栈有两种操作：压入和弹出。

每个递归函数都有两部分：基线条件和递归条件，递归条件指的是函数调用自己，基线条件指的是函数不再调用自己，避免无限循环。

编程概念，调用栈，计算机在内部使用被称为调用栈的栈，递归是调用自己的函数。

调用栈可能占用大量内存，解决方案是编写循环代码，或者使用尾递归，但并非所有的语言都支持尾递归。

分治-递归式问题解决办法：步骤：找出基线条件，确定如何缩小问题的规模，使其符合基线条件。

涉及数组的递归函数，基线条件通常是数组为空或只包含一个元素。

快速排序-D&C算法：步骤：设置基线条件，数组小于2，选择基准值，将数组分成两个子数组：小于和大于基准值的元素，对这两个子数组进行快速排序，递归调用。

合并排序：o(nlogn)，快速排序：o(nlogn)：层数o(logn)乘每层需要的时间o(n)，但最差情况为o(n方)。

散列表-基本数据结构之一：内部机制：实现、冲突、散列函数。

散列表无序，数据结构：数组、列表、（栈、不能用于查找）、散列表（包含额外逻辑）。

数组和链表都直接映射到内存，但散列表使用散列函数来确定元素存储位置。

散列函数：不同的输入映射到不同的索引，输出不同的数字，散列表是散列函数和数组的结合，也称散列映射、映射、字典、关联数组。

缓存的数据存储在散列表中，访问页面时，先检查散列表是否存储了页面。

如果两个键映射到了同一个位置引发冲突，可以在这个位置存储一个链表，好的散列函数可以减少冲突。

填装因子为散列表元素/位置总数，因子越低，发生冲突的可能性越小，性能越高。

广度优先搜索（BFS）的含义：解决最短路径问题的算法。

步骤：使用图来建立问题模型，使用广度优先搜索算法（是否有路径，哪个路径最短）。

所有算法中，图算法是最有用的。

队列（数据结构）：类似于栈，不能随机访问队列中元素，只支持入队和出队（压入和弹出），先加入的先出队，即先进先出（FIFO），而栈是后进先出（LIFO）。

有向图：关系是单向的，无向图：没有箭头，直接相连的节点互为邻居。

拓扑排序：根据图创建一个有序列表。

迪杰斯特拉算法：适用于加权图（提高或降低某些边的权重），找出加权图中的最短路径。

只适用于有向无环图，如果有负权边，不能使用迪杰斯特拉算法，因为算法假设处理过的节点，没有前往终点的最短路径，故，有负权边的可用贝尔曼-福特算法。

在未处理的节点找到开销最小的节点，遍历当前节点的所有邻居，如果经当前节点前往该邻居更近，就更新邻居开销，同时将该邻居的父节点设置为当前节点，将当前节点标记为处理过，找出接下来要处理的节点，并循环。

贪婪算法：每步都选择局部最优解，最终就是全局最优解，易于实现，运行快，是个不错的近似算法。

集合类似于列表，但是不包含重复的元素。

贪婪算法：o(n方)，NP完全问题：需要计算所有的解，从中选出最小距离，计算量大，最佳做法是使用近似算法。

动态规划：约定条件下找到最优解，在问题可分解为彼此独立且离散的子问题时，就可使用动态规划来解决。

动态规划解决方案涉及网络，每个单元格都是子问题，需考虑如何将问题分解为子问题。

最长公共序列。

K最近邻算法（KNN）：电影推荐系统。

特征抽取：指标打分，计算距离（相似程度），N维。

KNN的基本工作：分类和回归。

应用：OCR光学字符识别（optical character recognition），提取线段、点、曲线特征，找出与新图像最近的邻居；语音识别，人脸识别。

垃圾邮件过滤器：朴素贝叶斯分类器。

二叉查找树（binary search tree）：有序树状数据结构。

二叉查找树插入和删除操作快于有序数组，但不能随机访问（没有索引）。

红黑树是处于平衡状态的特殊二叉树，不平衡时，如向右倾斜时性能不佳。

B树是一种特殊的二叉树。

反向索引：一个散列表，将单词映射到包含他的页面，常用于创建搜索引擎。

并行算法：速度的提升非线性，因为并行性管理开销和负载均衡。

分布式算法：特殊的并行算法，maprece（映射和归并函数），映射：任务多时自动分配多台计算机完成，将一个数组转换成另一个数组，归并是将一个数组转换成一个元素。

线性规划：在给定约束条件下最大限度的改善指定指标，使用simplex算法，图算法为线性规划子集。

‘贰’ 【图解】数据结构代码领背-折半插入排序

【视觉解读】深入剖析：折半插入排序的代码实践与理解</

折半插入排序，巧妙地将数组划分为有序与无序两部分，其核心思想是利用折半查找的高效性，寻找待插入元素的精确位置。相较于直接插入排序，它在比较次数上有所优化，但移动元素的次数并未减少，整体时间复杂度依然保持在O(n^2)。让我们通过一个生动示例来揭秘这一算法的运作机制。

以数组{3,1,7,5,2,4}为例，不使用“哨兵”辅助，但理解其原理同样重要。首先，我们以元素1开始，作为待排元素（记为temp）。在第一轮中，temp = 1，mid指向3，发现temp < A[mid]，所以将high更新为mid-1（即-1），循环结束，1的插入位置为0。

进入第二轮，待排元素是7。low = 0，high = 1，mid = 0指向1，由于temp > mid，low递增为1。再次计算，mid = 1，temp > mid，此时low = mid + 1 = 2。因为low > high，循环结束，7应插入位置为2。

第三轮，以5为例，mid第一次指向3，发现5 A[mid]，于是high = mid - 1 = 1。由于low = 2 > high，插入位置确定为high + 1，即2。接下来的元素插入过程同样遵循这个逻辑，细节之处尽显折半查找的精妙。

在编写代码时，需要注意以下几点：

外层循环初始化从第二个元素开始，i = 2，确保正确处理无序部分。

务必在排序开始时，将待插入元素赋值给A[0]，避免后续元素移动时数据丢失。

深入理解折半插入排序，不仅有助于提升代码实现的效率，还能在解决复杂问题时提供有力的算法工具。通过实践和分析，你将能更好地驾驭这一数据结构的精髓。

导航:首页 > 源码编译 > 恋上数据结构算法图解

恋上数据结构算法图解

与恋上数据结构算法图解相关的资料