数据结构
基本概念
数据结构是一门研究如何有效组织数据,并提高数据处理效率的学科。通过研究各种数据内部的逻辑关系,使用某种特定的存储形式,并在此基础上对数据实施各种操作,这些工作被称为称为广义上的算法。
-
逻辑结构
-
指数据之间的内在关系。通常有集合、线性表、树、图等常见的逻辑结构。
-
逻辑结构是数据之间本身的属性,跟我们怎么处理它们无关。
-
-
线性关系:各个元素之间是一种一对一的关系,比如图书馆中的书架的书,除了首尾两本书之外,其余的任意一本书的编号假设是N,都有且仅有一个直接前驱节点N-1,有且仅有一个直接后继节点N+1。这种关系就是典型的线性逻辑。
-
非线性关系:与上述线性关系的表述不同,如果各个元素之间不是严格一对一的关系,则被称为非线性关系,比如家族中的各个成员、不同城市间的交通道路等,对于它们中间的某个元素,都可能有不止一个元素与之关联。这种关系是典型的非线性逻辑。
-
存储形式
- 数据的存储方式。比如顺序存储、链式存储等。
- 不同的存储形式对最终数据的处理效率通常有很大的影响。
- 逻辑结构与存储形式并无必然联系。
算法分析
算法分析是指算法在正确的情况下,对其优劣的分析。一个好的算法通常是指:
- 算法对应的程序所耗时间少
- 算法对应的程序所耗存储空间少
- 算法结构性好、易读、易移植和调试
数据结构与算法的本质任务,是提高程序的时间空间效率,简单讲就是让程序的执行速度越快越好,所需内存空间越少越好。虽然在很多情况下,程序的时空特性是相互制约的,就像鱼和熊掌不可兼得,但我们可以根据程序实际解决问题的侧重点,去平衡时间和空间的对性能的消耗。
时间复杂度
一般而言,时间复杂度并不考察一段代码运行所需要的绝对时间,因为不同的计算机的硬件参数不同,考察绝对时间没有意义。时间复杂度一般指的是代码的语句执行总次数,称为语句频度。比如:
void counting(int n)
{for(int i=0; i<n; i++){printf("本行语句将会出现n次\n");for(int j=0; j<n; j++){printf("本行语句将会出现n*n次\n");}}
}
在上述代码中,程序执行的语句频度理论是:T(n)=n^2+n
但一般情况下,我们只关心多项式的最高次幂,于是上述代码的时间复杂度我们表示为:T(n)=O(n^2)
这意味着,该程序算法所需要的时间,与传进来的参数n的平方成正比。
不同算法的时间复杂度相差很大,如下图所示,随着所处理的问题规模的增大,不同时间复杂度的程序所需要的时间有天壤之别。
空间复杂度
空间复杂度的概念更简单一点,就是一段程序运行时所需的内存字节量。
时空复杂度互换
一段程序的性能指标,既要运行快速,又要节省内存,而通常这两者又是相互制约的,很难兼得。因此在实际解决问题时,会根据需要侧重一方,牺牲另一方。