㈠ 折半查找法在Excel函数中的运用
排序与查找不管是在Excel领域,还是其他领域,例如C语言,都有着很高的使用率。学会了这个技能,我们做起事情来更加方便快捷,省去不少时间,效率倍增。下面我们就来介绍一下折半查找在Excel函数里面的运用。
折半查找
又称之为二分查找,它要求目标数组中的数据是有序排列的。优点是比较次数少,查找速度快,平均性能好,适用于不经常变动而查找频繁的有序列表。下面先来看看下面的流程图。
为了便于大家理解,我作几点说明:
①将需要查找的值与中间值(也叫做中位值)进行对比;
②大于中位值时,以中位作为边界,继续在其右侧取新的中位值继续对比;
③小于中位值时,以中位作为边界,继续在其左侧取新的中位值继续对比;
④等于中位值时,依次判断其右侧数值是否继续相等,直到不相等时返回最后一个相等的数值;
⑤当中位位置与边界重叠时,中止对比,此时如果查找值大于中位值,则返回中位值;如果查找值小于中位值,则返回中位左侧数值。如果左侧数值不存在,返回#N/A。
流程图大致的介绍就是如此,不知道我描述是不是清楚,这只是一个算法而已,不懂也不需要太过深入研究。当数据个数为偶数时,中位等于个数除以2;数据个数为奇数时,中位等于除以2
案例剖析
①如下图所示,给出了一连串升序排列的数组,我们要找出33这个数。按照上面的介绍,我们知道中位值为24.
②第一次比较,因为33>24,所以锁定第二次查找范围在中位值的后面,而不是前面,前面的数字都比24小,不可能找得到33.
③第二次比较,中位值变为了31,33>31,继续找后面的。
④依次类推,直到找到数字或者整个数组被查找完毕,没有找到则会返回#N/A
现在或许大家还在疑问为什么要是一个有序的序列才可以进行折半查找?下面这张图,与之前的图对比一下,你就知道了。
Excel中也有类似的函数,LOOKUP,我们要查找74,但是用LOOKUP函数计算出来的结果却是49,下面就来分析一下。
①第一次比较74小于116,所以开始往前查找。
②中位值变为50.74大于50,向后查找。
③74又大于47,依旧向后。
④最后只剩下一个49了,这就是函数的返回值。
㈡ 全国计算机等级考试二级C,VB等等不同语言笔试部分的公共基础知识考试内容是一样的吗
第一章 数据结构与算法
经过对部分考生的调查以及对近年真题的总结分析,笔试部分经常考查的是算法复杂度、数据结构的概念、栈、二叉树的遍历、二分法查找,读者应对此部分进行重点学习。
详细重点学习知识点:
1.算法的概念、算法时间复杂度及空间复杂度的概念
2.数据结构的定义、数据逻辑结构及物理结构的定义
3.栈的定义及其运算、线性链表的存储方式
4.树与二叉树的概念、二叉树的基本性质、完全二叉树的概念、二叉树的遍历
5.二分查找法
6.冒泡排序法
1.1算法
考点1 算法的基本概念
考试链接:
考点1在笔试考试中考核的几率为30%,主要是以填空题的形式出现,分值为2分,此考点为识记内容,读者还应该了解算法中对数据的基本运算。
计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。
1.算法的基本特征:可行性、确定性、有穷性、拥有足够的情报。
2.算法的基本要素:
(1)算法中对数据的运算和操作
一个算法由两种基本要素组成:一是对数据对象的运算和操作;二是算法的控制结构。
在一般的计算机系统中,基本的运算和操作有以下4类:算术运算、逻辑运算、关系运算和数据传输。
(2)算法的控制结构:算法中各操作之间的执行顺序称为算法的控制结构。
描述算法的工具通常有传统流程图、N-S结构化流程图、算法描述语言等。一个算法一般都可以用顺序、选择、循环3种基本控制结构组合而成。
考点2 算法复杂度
考试链接:
考点2在笔试考试中,是一个经常考查的内容,在笔试考试中出现的几率为70%,主要是以选择的形式出现,分值为2分,此考点为重点识记内容,读者还应该识记算法时间复杂度及空间复杂度的概念。
1.算法的时间复杂度
算法的时间复杂度是指执行算法所需要的计算工作量。
同一个算法用不同的语言实现,或者用不同的编译程序进行编译,或者在不同的计算机上运行,效率均不同。这表明使用绝对的时间单位衡量算法的效率是不合适的。撇开这些与计算机硬件、软件有关的因素,可以认为一个特定算法"运行工作量"的大小,只依赖于问题的规模(通常用整数n表示),它是问题规模的函数。即
算法的工作量=f(n)
2.算法的空间复杂度
算法的空间复杂度是指执行这个算法所需要的内存空间。
一个算法所占用的存储空间包括算法程序所占的空间、输入的初始数据所占的存储空间以及算法执行过程中所需要的额外空间。其中额外空间包括算法程序执行过程中的工作单元以及某种数据结构所需要的附加存储空间。如果额外空间量相对于问题规模来说是常数,则称该算法是原地工作的。在许多实际问题中,为了减少算法所占的存储空间,通常采用压缩存储技术,以便尽量减少不必要的额外空间。
疑难解答:算法的工作量用什么来计算?
算法的工作量用算法所执行的基本运算次数来计算,而算法所执行的基本运算次数是问题规模的函数,即算法的工作量=f(n),其中n是问题的规模。
1.2数据结构的基本概念
考点3 数据结构的定义
考试链接:
考点3在笔试考试中,是一个经常考查的内容,在笔试考试中出现的几率为70%,主要是以选择的形式出现,分值为2分,此考点为识记内容,读者还应该识记数据的逻辑结构和存储结构的概念。
数据结构作为计算机的一门学科,主要研究和讨论以下三个方面:
(1)数据集合中个数据元素之间所固有的逻辑关系,即数据的逻辑结构;
(2)在对数据元素进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;
(3)对各种数据结构进行的运算。
数据:是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。
数据元素:是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。
数据对象:是性质相同的数据元素的集合,是数据的一个子集。
数据的逻辑结构是对数据元素之间的逻辑关系的描述,它可以用一个数据元素的集合和定义在此集合中的若干关系来表示。数据的逻辑结构有两个要素:一是数据元素的集合,通常记为D;二是D上的关系,它反映了数据元素之间的前后件关系,通常记为R。一个数据结构可以表示成
B=(D,R)
其中B表示数据结构。为了反映D中各数据元素之间的前后件关系,一般用二元组来表示。
数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构(也称数据的物理结构)。
由于数据元素在计算机存储空间中的位置关系可能与逻辑关系不同,因此,为了表示存放在计算机存储空间中的各数据元素之间的逻辑关系(即前后件关系),在数据的存储结构中,不仅要存放各数据元素的信息,还需要存放各数据元素之间的前后件关系的信息。
一种数据的逻辑结构根据需要可以表示成多种存储结构,常用的存储结构有顺序、链接、索引等存储结构。而采用不同的存储结构,其数据处理的效率是不同的。因此,在进行数据处理时,选择合适的存储结构是很重要的。
考点4 线性结构与非线性结构
考试链接:
考点4在笔试考试中,虽然说不是考试经常考查的内容,但读者还是对此考点有所了解,在笔试考试中出现的几率为30%,主要是以填空题出现的形式出现,分值为2分,此考点为识记内容。
根据数据结构中各数据元素之间前后件关系的复杂程度,一般将数据结构分为两大类型:线性结构与非线性结构。如果一个非空的数据结构满足下列两个条件:
(1)有且只有一个根结点;
(2)每一个结点最多有一个前件,也最多有一个后件。
则称该数据结构为线性结构。线性结构又称线性表。在一个线性结构中插入或删除任何一个结点后还应是线性结构。如果一个数据结构不是线性结构,则称之为非线性结构。
疑难解答:空的数据结构是线性结构还是非线性结构?
一个空的数据结构究竟是属于线性结构还是属于非线性结构,这要根据具体情况来确定。如果对该数据结构的算法是按线性结构的规则来处理的,则属于线性结构;否则属于非线性结构。
1.3栈及线性链表
考点5 栈及其基本运算
考试链接:
考点5在笔试考试中,是一个必考的内容,在笔试考试中出现的几率为100%,主要是以选择的形式出现,分值为2分,此考点为重点掌握内容,读者应该掌握栈的运算 。
1.栈的基本概念
栈是限定只在一端进行插入与删除的线性表,通常称插入、删除的这一端为栈顶,另一端为栈底。当表中没有元素时称为空栈。栈顶元素总是后被插入的元素,从而也是最先被删除的元素;栈底元素总是最先被插入的元素,从而也是最后才能被删除的元素。栈是按照"先进后出"或"后进先出"的原则组织数据的。
2.栈的顺序存储及其运算
用一维数组S(1∶m)作为栈的顺序存储空间,其中m为最大容量。
在栈的顺序存储空间S(1∶m)中,S(bottom)为栈底元素,S(top)为栈顶元素。top=0表示栈空;top=m表示栈满。
栈的基本运算有三种:入栈、退栈与读栈顶元素。
(1)入栈运算:入栈运算是指在栈顶位置插入一个新元素。首先将栈顶指针加一(即top加1),然后将新元素插入到栈顶指针指向的位置。当栈顶指针已经指向存储空间的最后一个位置时,说明栈空间已满,不可能再进行入栈操作。这种情况称为栈"上溢"错误。
(2)退栈运算:退栈是指取出栈顶元素并赋给一个指定的变量。首先将栈顶元素(栈顶指针指向的元素)赋给一个指定的变量,然后将栈顶指针减一(即top减1)。当栈顶指针为0时,说明栈空,不可进行退栈操作。这种情况称为栈的"下溢"错误。
(3)读栈顶元素:读栈顶元素是指将栈顶元素赋给一个指定的变量。这个运算不删除栈顶元素,只是将它赋给一个变量,因此栈顶指针不会改变。当栈顶指针为0时,说明栈空,读不到栈顶元素。
小技巧:栈是按照"先进后出"或"后进先出"的原则组织数据,但是出栈方式有多种选择,在考题中经常考查各种不同的出栈方式。
考点6 线性链表的基本概念
考试链接:
考点6在笔试考试中出现的几率为30%,主要是以选择的形式出现,分值为2分,此考点为识记内容。重点识记结点的组成。
在链式存储方式中,要求每个结点由两部分组成:一部分用于存放数据元素值,称为数据域,另一部分用于存放指针,称为指针域。其中指针用于指向该结点的前一个或后一个结点(即前件或后件)。
链式存储方式既可用于表示线性结构,也可用于表示非线性结构。
(1)线性链表
线性表的链式存储结构称为线性链表。
在某些应用中,对线性链表中的每个结点设置两个指针,一个称为左指针,用以指向其前件结点;另一个称为右指针,用以指向其后件结点。这样的表称为双向链表。
(2)带链的栈
栈也是线性表,也可以采用链式存储结构。带链的栈可以用来收集计算机存储空间中所有空闲的存储结点,这种带链的栈称为可利用栈。
疑难解答:在链式结构中,存储空间位置关系与逻辑关系是什么?
在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。
1.4树与二叉树
考点7 树与二叉树及其基本性质
考试链接:
考点7在笔试考试中,是一个必考的内容,在笔试考试中出现的几率为100%,主要是以选择的形式出现,有时也有出现在填空题中,分值为2分,此考点为重点掌握内容。重点识记树及二叉树的性质。
误区警示:
满二叉树也是完全二叉树,而完全二叉树一般不是满二叉树。应该注意二者的区别。
1、树的基本概念
树(tree)是一种简单的非线性结构。在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点。每一个结点可以有多个后件,它们称为该结点的子结点。没有后件的结点称为叶子结点。
在树结构中,一个结点所拥有的后件个数称为该结点的度。叶子结点的度为0。在树中,所有结点中的最大的度称为树的度。
2、二叉树及其基本性质
(1)二叉树的定义
二叉树是一种很有用的非线性结构,具有以下两个特点:
①非空二叉树只有一个根结点;
②每一个结点最多有两棵子树,且分别称为该结点的左子树和右子树。
由以上特点可以看出,在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。另外,二叉树中的每个结点的子树被明显地分为左子树和右子树。在二叉树中,一个结点可以只有左子树而没有右子树,也可以只有右子树而没有左子树。当一个结点既没有左子树也没有右子树时,该结点即为叶子结点。
(2)二叉树的基本性质
二叉树具有以下几个性质:
性质1:在二叉树的第k层上,最多有2k-1(k≥1)个结点;
性质2:深度为m的二叉树最多有2m-1个结点;
性质3:在任意一棵二叉树中,度为0的结点(即叶子结点)总是比度为2的结点多一个。
性质4:具有n个结点的二叉树,其深度至少为〔log2n〕+1,其中〔log2n〕表示取log2n的整数部分。
小技巧:在二叉树的遍历中,无论是前序遍历,中序遍历还是后序遍历,二叉树的叶子结点的先后顺序都是不变的。
3、满二叉树与完全二叉树
满二叉树是指这样的一种二叉树:除最后一层外,每一层上的所有结点都有两个子结点。在满二叉树中,每一层上的结点数都达到最大值,即在满二叉树的第k层上有2k-1个结点,且深度为m的满二叉树有2m-1个结点。
完全二叉树是指这样的二叉树:除最后一层外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。
对于完全二叉树来说,叶子结点只可能在层次最大的两层上出现:对于任何一个结点,若其右分支下的子孙结点的最大层次为p,则其左分支下的子孙结点的最大层次或为p,或为p+1。
完全二叉树具有以下两个性质:
性质5:具有n个结点的完全二叉树的深度为〔log2n〕+1。
性质6:设完全二叉树共有n个结点。如果从根结点开始,按层次(每一层从左到右)用自然数1,2,……,n给结点进行编号,则对于编号为k(k=1,2,……,n)的结点有以下结论:
①若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点编号为INT(k/2)。
②若2k≤n,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)。
③若2k+1≤n,则编号为k的结点的右子结点编号为2k+1;否则该结点无右子结点。
考点8 二叉树的遍历
考试链接:
考点8在笔试考试中考核几率为30%,分值为2分,读者应该熟练掌握各种遍历的具体算法,能由两种遍历的结果推导另一种遍历的结果。
在遍历二叉树的过程中,一般先遍历左子树,再遍历右子树。在先左后右的原则下,根据访问根结点的次序,二叉树的遍历分为三类:前序遍历、中序遍历和后序遍历。
(1)前序遍历:先访问根结点、然后遍历左子树,最后遍历右子树;并且,在遍历左、右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。
(2)中序遍历:先遍历左子树、然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。
(3)后序遍历:先遍历左子树、然后遍历右子树,最后访问根结点;并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。
疑难解答:树与二叉树的不同之处是什么?
在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。
1.5查找技术
考点9 顺序查找
考试链接:
考点9在笔试考试中考核几率在30%,一般出现选择题中,分值为2分,读者应该具体掌握顺序查找的算法。
查找是指在一个给定的数据结构中查找某个指定的元素。从线性表的第一个元素开始,依次将线性表中的元素与被查找的元素相比较,若相等则表示查找成功;若线性表中所有的元素都与被查找元素进行了比较但都不相等,则表示查找失败。
在下列两种情况下也只能采用顺序查找:
(1)如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用顺序查找。
(2)即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。
考点10 二分法查找
考试链接:
考点10在笔试考试中考核几率为30%,一般出现填空题中,分值为2分,考核比较多查找的比较次数,读者应该具体掌握二分查找法的算法。
二分法只适用于顺序存储的,按非递减排列的有序表,其方法如下:
设有序线性表的长度为n,被查找的元素为i,
(1)将i与线性表的中间项进行比较;
(2)若i与中间项的值相等,则查找成功;
(3)若i小于中间项,则在线性表的前半部分以相同的方法查找;
(4)若i大于中间项,则在线性表的后半部分以相同的方法查找。
疑难解答:二分查找法适用于哪种情况?
二分查找法只适用于顺序存储的有序表。在此所说的有序表是指线性表中的元素按值非递减排列(即从小到大,但允许相邻元素值相等)。
这个过程一直进行到查找成功或子表长度为0为止。
对于长度为n的有序线性表,在最坏情况下,二分查找只需要比较log2n次。
1.6排序技术
考点11 交换类排序法
考试链接:
考点11属于比较难的内容,一般以选择题的形式考查,考核几率为30%,分值约为2分,读者应该熟练掌握几种排序算法的基本过程。
冒泡排序法和快速排序法都属于交换类排序法。
(1)冒泡排序法
首先,从表头开始往后扫描线性表,逐次比较相邻两个元素的大小,若前面的元素大于后面的元素,则将它们互换,不断地将两个相邻元素中的大者往后移动,最后最大者到了线性表的最后。
然后,从后到前扫描剩下的线性表,逐次比较相邻两个元素的大小,若后面的元素小于前面的元素,则将它们互换,不断地将两个相邻元素中的小者往前移动,最后最小者到了线性表的最前面。
对剩下的线性表重复上述过程,直到剩下的线性表变空为止,此时已经排好序。
在最坏的情况下,冒泡排序需要比较次数为n(n-1)/2。
(2)快速排序法
它的基本思想是:任取待排序序列中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子序列,左子序列元素的排序码均小于或等于基准元素的排序码,右子序列的排序码则大于基准元素的排序码,然后分别对两个子序列继续进行排序,直至整个序列有序。
疑难解答:冒泡排序和快速排序的平均执行时间分别是多少?
冒泡排序法的平均执行时间是O(n2),而快速排序法的平均执行时间是O(nlog2n)。
1.7 例题详解
一、选择题
【例1】算法的时间复杂度取决于_______。(考点2)
A)问题的规模 B)待处理的数据的初态
C)问题的难度 D)A)和B)
解析:算法的时间复杂度不仅与问题的规模有关,在同一个问题规模下,而且与输入数据有关。即与输入数据所有的可能取值范围、输入各种数据或数据集的概率有关。
答案:D)
【例2】在数据结构中,从逻辑上可以把数据结构分成_______。(考点3)
A)内部结构和外部结构 B)线性结构和非线性结构
C)紧凑结构和非紧凑结构 D)动态结构和静态结构
解析:逻辑结构反映数据元素之间的逻辑关系,线性结构表示数据元素之间为一对一的关系,非线性结构表示数据元素之间为一对多或者多对一的关系,所以答案为B)。
答案:B)
【例3】以下_______不是栈的基本运算。(考点5)
A)判断栈是否为素空 B)将栈置为空栈
C)删除栈顶元素 D)删除栈底元素
解析:栈的基本运算有:入栈,出栈(删除栈顶元素),初始化、置空、判断栈是否为空或满、提取栈顶元素等,对栈的操作都是在栈顶进行的。
答案:D)
【例4】链表不具备的特点是_______。(考点6)
A)可随机访问任意一个结点 B)插入和删除不需要移动任何元素
C)不必事先估计存储空间 D)所需空间与其长度成正比
解析:顺序表可以随机访问任意一个结点,而链表必须从第一个数据结点出发,逐一查找每个结点。所以答案为A)。
答案:A)
【例5】已知某二叉树的后序遍历序列是DACBE,中序遍历序列是DEBAC,则它的前序遍历序列是_______。(考点8)
A)ACBED B)DEABC
C)DECAB D)EDBAC
解析:后序遍历的顺序是"左子树-右子树-根结点";中序遍历顺序是"左子树-根结点-右子树";前序遍历顺序是"根结点-左子树-右子树"。根据各种遍历算法,不难得出前序遍历序列是EDBAC。所以答案为D)。
答案:D)
【例6】设有一个已按各元素的值排好序的线性表(长度大于2),对给定的值k,分别用顺序查找法和二分查找法查找一个与k相等的元素,比较的次数分别是s和b,在查找不成功的情况下,s和b的关系是_______。(考点9)
A)s=b B)s>b C)s<b D)s≥b
解析:对于顺序查找,查找不成功时和给定关键字比较的次数为n+1。二分查找查找不成功的关键字比较次数为〔log2n〕+1。当n≥2时,显然n+1>〔log2n〕+1。
答案:B)
【例7】在快速排序过程中,每次划分,将被划分的表(或子表)分成左、右两个子表,考虑这两个子表,下列结论一定正确的是_______。(考点11)
A)左、右两个子表都已各自排好序
B)左边子表中的元素都不大于右边子表中的元素
C) 左边子表的长度小于右边子表的长度
D)左、右两个子表中元素的平均值相等
解析:快速排序基本思想是:任取待排序表中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子表,左子表元素的排序码均小于或等于基准元素的排序码,右子表的排序码则大于基准元素的排序码,然后分别对两个子表继续进行排序,直至整个表有序。
答案:B)
二、填空题
【例1】问题处理方案的正确而完整的描述称为_______。(考点1)
解析:计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。
答案:算法
【例2】一个空的数据结构是按线性结构处理的,则属于_______。(考点4)
解析:一个空的数据结构是线性结构或是非线性结构,要根据具体情况而定。如果对数据结构的运算是按线性结构来处理的,则属于线性结构,否则属于非线性结构。
答案:线性结构
【例3】设树T的度为4,其中度为1、2、3和4的结点的个数分别为4、2、1、1,则T中叶子结点的个数为_______。(考点7)
解析:根据树的性质:树的结点数等于所有结点的度与对应的结点个数乘积之和加1。
因此树的结点数为1×4+2×2+3×1+4×1+1=16。叶子结点数目等于树结点总数减去度不为0的结点数之和,即16-(4+2+1+1)=8。
答案:8
【例4】二分法查找的存储结构仅限于_______且是有序的。(考点10)
解析:二分查找,也称折半查找,它是一种高效率的查找方法。但二分查找有条件限制:要求表必须用顺序存储结构,且表中元素必须按关键字有序(升序或降序均可)。
答案:顺序存储结构
㈢ 如何轻松考过计算机二级
方法/步骤
全国计算机二级等级考试分为两个部分,第一项为二级公共基础,这是所有考生都要考的,第二项为你所选的分类,如c语言程序设计等等。
就我考试的经验来看,二级公共基础为最易得分项,主要考察考生对概念的理解及掌握。下面为我总结的二级公共基础中易考及必会的内容,我相信只要掌握了它,二级公共基础这项就可以轻松过关啦。
一。数据结构与算法:
算法的定义
算法是指解决方案的准确而完整的描述,是一系列解决问题的清晰指令。算法 ≠ 程序。
算法的5大特征
1. 至少1个输出:任何算法,必须有输出结果。2. 至少0个输入,足够的情报:对于复杂算法,情报越充足,效果越好。3. 有穷性:算法能在有限的执行步骤内、有限的时间内执行结束。4. 可行性:算法的每一个步骤都必须能够翻译成计算机可执行的基本操作。5. 确定性:算法的每一个步骤都必须描述准确,没有歧义。
算法的复杂度
【时间复杂度】以基本操作次数的数量级计数,不以秒计数。常见复杂度(越小越快):O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(2^n)<O(n!)【空间复杂度】算法执行过程中的空间开销。【二者关系】虽然算法中常常会以牺牲空间的方式来换取时间效率,但一般认为二者没有必然关系。
数据结构的定义
数据结构是指计算机组织、存储数据的方式。数据结构可分为逻辑结构和存储结构。其中:1. 逻辑结构又分为线性结构和非线性结构。2. 存储结构又分为顺序存储结构和链式存储结构
逻辑结构
逻辑结构不关心数据如何存储,只关心数据的组织方式。逻辑结构可分为线性结构和非线性结构。典型线性结构:栈、队列典型非线性结构:树(二叉树)、网状图
存储结构
存储结构不关心数据如何组织,只关心数据的存储方式。存储结构又分为顺序存储结构和链式存储结构。【顺序存储结构】1. 所有元素在内存中按顺序排列2. 查找、修改比较不方便3. 插入、删除比较方便【链式存储结构】1. 所有元素在内存中随机分布2. 插入、删除比较不方便3. 查找、修改比较方便4. 由于要存储下一元素的地址,所以需要更多的存储空间【二者关系】二者没有必然关系。
基本概念
1. 栈属于逻辑结构的概念,属于线性结构。2. 栈既可以用顺序存储结构实现,也可以用链式存储结构实现。3. 栈的特点是先进后出(FILO)。4. 进出过程中,栈底指针不变,栈顶指针移动。
计算规则
视栈顶和栈底指针的指向规则而定。一般的,栈底指向首元素的前一位置(比如0),栈顶指针指向尾元素(比如5),即栈中1、2、3、4、5各存储了一个数据。此时:栈中元素个数=栈顶指针-栈底指针(比如5-0=5)
基本概念
1. 队列属于逻辑结构的概念,属于线性结构。2. 队列既可以用顺序存储结构实现,也可以用链式存储结构实现。3. 队列的特点是先进先出(FIFO)。4. 队头负责出队,队尾负责入队。
循环队列
循环队列是专门针对顺序存储结构空间固定的特点而设计的,所以一般认为循环队列是顺序存储结构。其核心原理是:当队尾到达队列最大位置、而队头不在最小位置时如果继续入队,则队尾移至队列最小位置,从头开始移动,形成循环。出队时同理。
计算规则
视栈顶和栈底指针的指向规则而定。一般的,队头指向首元素的前一位置,队尾指针指向尾元素。假设队列容量为20:1. 若队尾>队头(比如队尾为7,队头为2):队列元素个数=队尾指针-队头指针(7-2=5)2. 若队头>队尾(比如队尾为2,队头为7):队列元素个数=队尾指针-队头指针+队列容量(2-7+20=15)其中,第二种情况只有循环队列中才会出现。
基本概念
1. 一个二叉树只有一个根节点。2. 在二叉树中,任何一个节点最多只能有2个子节点。3. 一个节点有几个子节点,则度为几。度为0的节点称为叶子节点。
常用公式
1. 第n层的节点数最多为2^(n-1)个。2. 层数为n的二叉树,总节点数最多为2^n-1个。3. 叶子节点数 = 度为2的节点数+14. 二叉树节点总数 = 度为2的节点数 + 度为1的节点数 + 叶子节点数
遍历规则
先序遍历:父节点、左子树、右子树中序遍历:左子树、父节点、右子树后序遍历:左子树、右子树、父节点其中左右子树按此规则继续拆分,拆分过程中也按其对应规则遍历,直到不能再拆分为止。
顺序查找
其算法复杂度为O(n),长度为n的线性表,最多需要n次才能找到指定元素。
顺序查找最大/最小值
长度为n的线性表,所有元素随机排列,最多需要n-1次才能找到最大/最小值。
二分查找
其算法复杂度为O(logn),长度为n的线性表,最多需要logn次就能找到指定元素。
二分查找使用条件
1. 使用顺序存储结构(如数组)。2. 所有元素按序排列。
按原理分类
交换类:冒泡排序、快速排序选择类:简单选择排序、堆排序插入类:简单插入排序、希尔排序
按稳定性分类
稳定:冒泡排序、简单插入排序……不稳定(快选希堆):快速排序、简单选择排序、希尔排序、堆排序
按算法复杂度
O(n^2):冒泡排序、简单选择排序、简单插入排序O(nlogn):快速排序、堆排序、希尔排序在一般情况下,快速排序是已知常用算法中效率最高的。在最坏情况下,快速排序的算法复杂度是O(n^)2。
二。软件工程:
基本概念
可行性研究主要考虑:经济、技术、法律。需求分析阶段最重要的文档:《软件需求规格说明书》。《软件需求规格说明书》的任务是统一认识,所以必须追求准确,消灭歧义。
数据流图(DFD)
箭头:数据流圆形、椭圆形:数据的加工方框:系统和环境的接口半开口的方框、双杠:数据的存储文件
数据字典
1. 是数据流图的重要补充2. 应该包含数据流图中提到的所有数据
概要设计
耦合性:模块之间的关联程度内聚性:模块内部的关联程度设计原则:高内聚低耦合软件系统结构图:深度、宽度、扇入、扇出。
详细设计
【程序流程图】箭头:控制流矩形:执行步骤菱形:逻辑条件【N-S图】【PAD图】
基本原则
自顶向下、逐步求精、模块化使用3种基本控制结构,限制goto语句的使用
3种控制结构
顺序结构、选择结构、循环结构
基本概念
对象是类的实例。类由两个部分组成:属性、方法。由同一个类定义的对象,拥有相同的属性和方法
类的特征
封装型、继承性、多态性
基本概念
测试:发现错误调试:诊断并改正错误注意:没有一种方法可以保证软件没有错误
黑盒和白盒
【黑盒】根据软件的外部功能设计测试用例例如:等价类划分、边界值分析、错误推测法【白盒】根据软件的内部逻辑设计测试用例例如:基本路径覆盖测试、逻辑条件覆盖测试
测试流程
单元测试:对单一模块进行测试集成测试:对模块间的协作进行测试确认测试:对《软件需求规格说明书》的需求进行逐一确认系统测试:对安全、性能等系统指标进行测试回归测试:对调试后的代码重新进行测试
三。数据库系统:
基本概念
数据(Data):信息的载体。包括类型和值两个属性。数据库(DB):依照某种数据模型将数据组织并存放起来的集合。数据库管理系统(DBMS):系统软件,是数据库系统的核心,为数据库提供底层服务。数据库管理系统(DBAS):基于数据库管理系统设计的应用软件,面向普通用户使用。数据库管理员(DBA):负责数据库设计、维护、性能、安全等工作的高科技人才。数据库系统(DBS):包括以上所有概念,再加上其他相关软硬件环境的总和。
数据语言
数据定义语言:表的建立、修改和删除数据操纵语言:表中数据的增加、删除、修改和查询数据控制语言:负责表中的安全性和完整性的设置
发展阶段
人工管理阶段 -> 文件管理阶段 -> 数据库管理阶段数据库管理阶段主要解决的问题:数据共享。
独立性
逻辑独立性:逻辑结构修改时,应用程序不需要修改。物理独立性:物理结构修改时,应用程序不需要修改。
三级模式
概念模式(逻辑模式):数据库逻辑结构的全局描述外模式(子模式):用户能看到的数据库逻辑结构和描述内模式(物理模式):数据库的物理存储结构和存取方法
基本概念
E(Entity):实体R(RelationShip):联系一对一:学生和学号、中国公民和身份证、考生和准考证号……一对多:班长和班级、宿舍和学生……多对多:学生和课程、老师和课程……
图示
实体:矩形联系:菱形属性:椭圆形
基本概念
层次模型:用“树”的方式组织数据网状模型:用“图”的方式组织数据关系模型:用“二维表”的方式组织数据【关系模型】 属性、元组【关系数据库】字段、记录元组的分量是关系模型中的最小不可再分单位
数据完整性
候选键(候选关键字):可以标识记录唯一性的几个字段。主键(主关键字):可以标识记录唯一性的一个字段。一个表只能有一个主关键字。外键(外部关键字):如果当前表中某字段是其他表的主键,则称此字段为外键。实体完整性:主键和候选键不能为空。参照完整性:对一对多关系中父表和子表之间关系的制约。自定义完整性:其他设置。如域完整性,就是对字段取值范围进行设置。
基本概念
【交】计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:对两个关系中的元组求交集。【并】计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:对两个关系中的元组求并集。【差】R-S=T计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:表示取R中存在且S中不存在的元组形成结果T。【笛卡儿积】RxS=T计算前提:对属性无要求属性规则:对两个关系的属性求并集。元组规则:对两个关系的元组做全排列。【除】R/S=T计算前提:S的属性应是R的子集属性规则:取R中存在的属性而S中不存在的属性作为结果T的属性,即对属性做差运算。元组规则:在R中选择与各属性值完全相等的元组,将其对T中的属性做投影
基本概念
【交】计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:对两个关系中的元组求交集。【并】计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:对两个关系中的元组求并集。【差】R-S=T计算前提:两个关系的属性完全相同属性规则:属性保持不变。元组规则:表示取R中存在且S中不存在的元组形成结果T。【笛卡儿积】RxS=T计算前提:对属性无要求属性规则:对两个关系的属性求并集。元组规则:对两个关系的元组做全排列。【除】R/S=T计算前提:S的属性应是R的子集属性规则:取R中存在的属性而S中不存在的属性作为结果T的属性,即对属性做差运算。元组规则:在R中选择与各属性值完全相等的元组,将其对T中的属性做投影
生命周期
【需求分析】数据流图、数据字典、需求规格说明书【概念设计】设计E-R模型【逻辑设计】将E-R模型转换为数据模型(主要是关系模型)【物理设计】将关系模型转换为关系数据库