数据结构一：算法效率分析（时间复杂度和空间复杂度）-重点

在学习具体的数据结构和算法之前，每一位初学者都要掌握一个技能，即善于运用时间复杂度和空间复杂度来衡量一个算法的运行效率。所谓算法，即解决问题的方法。同一个问题，使用不同的算法，虽然得到的结果相同，但耗费的时间和资源肯定有所差异。这也就意味着，如果解决问题的算法有多种，我们就需要从中选出最好的那一个。那么，怎么判断哪个算法更好（或者更优）呢？在满足准确性和健壮性的基础上，还有一个重要的筛选条件，即通过算法所编写出的程序的运行效率。程序的运行效率具体可以从 2 个方面衡量，分别为：程序的运行时间和程序运送所需的内存空间大小。本篇博客详细总结如何计算一个算法的时间复杂度和空间复杂度，根据代码的编写形式分为：非递归式(循环)和递归代码的时间复杂度，空间复杂度计算，根据出题的形式又可分为：给定代码计算时间复杂度和空间复杂度，或者给定题目请设计算法同时给出时间复杂度和空间复杂度；后者作为笔试面试的重点考查方式，需要重点掌握！

一、算法复杂度

算法在编写成可执行程序后，运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏，一般是从时间和空间两个维度来衡量的，即时间复杂度和空间复杂度。 时间复杂度主要衡量一个算法的运行快慢，而空间复杂度主要衡量一个算法运行所需要的额外内存空间。根据算法编写出的程序，运行时间更短，运行期间占用的内存更少，该算法的运行效率就更高，算法也就更好。在计算机发展的早期，计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展，计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

二、复杂度在校招中的考察

三、时间复杂度

3.1 时间复杂度的概念，如何理解？

在进行算法分析时，语句总的执行次数T(n)是关于问题规模n的函数，进而分析T(n)随n的变化情况并确定T(n)的数量级。记作:T(n)=O(f(n))，其中f(n)是问题规模n的某个函数。它表示随问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称作算法的渐近时间复杂度，简称为时间复杂度。O(语句总的执行次数)，即：找到某条基本语句与问题规模N之间的数学表达式，就是算出了该算法的时间复杂度。

理解概念的两个关键点：

1. 用计算语句总的执行次数，来度量时间的；

2. 把握好问题的规模这个概念，抓住问题规模；

3.2 推导大O阶方法

大O符号（Big O notation）：是用于描述函数渐进行为的数学符号。

推导大O阶方法：

用常数1取代运行时间中的所有加法常数。

在修改后的运行次数函数中，只保留最高阶项。

如果最高阶项存在且不是1，则去除与这个项相乘的常数。得到的结果就是大O阶。

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项，简洁明了的表示出了执行次数。另外有些算法的时间复杂度存在最好、平均和最坏情况：

最坏情况：任意输入规模的最大运行次数(上界)

平均情况：任意输入规模的期望运行次数

最好情况：任意输入规模的最小运行次数(下界)

例如：在一个长度为N数组中搜索一个数据x 最好情况：1次找到最坏情况：N次找到平均情况：N/2次找到在实际中一般情况关注的是算法的最坏运行情况，所以数组中搜索数据时间复杂度为O(N)。

总结：O(执行次数) ----> O(阶次/数量级)

举个栗子：

实现getsum函数求和1+2+3+...+n
int getsum(int n)
{
    int result=0；   执行1次
    for(int i=1;i<=n;i++)   执行次数为：1+n+n
    {
         result+=i;        执行次数为：n
    }
    return result;         执行1次
}

分析：

问题规模体现在形参n上，当n不同，计算求和的项数就不同，计算总的执行次数为f(n)=1+1+n+n+n+1=3n+3; 经过化简可知：O(n) ，可以总结出：像定义变量、循环初始条件、循环判断条件、循环自增变量等这些都不会影响最终的结果(当n较大时)，在计算总的执行次数时可以不计算它们！只需要看循环内部语句总的执行次数。

3.3 常见的时间复杂度

3.3.1 常数阶

#include <stdio.h>
int main()
{
   int res=0,n=100; 执行1次
   res=(1+n)*n/2;   执行1次
   printf("%d",res); 执行1次
   return 0;         执行1次
}

分析：这个算法的运行次数函数是f(n)=4。根据我们推导大O阶的方法，第一步就是把常数项 4改为1。在保留最高阶项时发现，它根本没有最高阶项，所以这个算法的时间复杂度为O(1)

#include <stdio.h>
int main()
{
   int res=0,n=100; 执行1次
   res=(1+n)*n/2;   执行第1次
   res=(1+n)*n/2;   执行第2次
   res=(1+n)*n/2;   执行第3次
   res=(1+n)*n/2;   执行第4次
   res=(1+n)*n/2;   执行第5次
   res=(1+n)*n/2;   执行第6次
   res=(1+n)*n/2;   执行第7次
   res=(1+n)*n/2;   执行第8次
   res=(1+n)*n/2;   执行第9次
   res=(1+n)*n/2;   执行第10次
   printf("%d",res); 执行1次
   return 0;         执行1次
}

事实上无论n为多少，上面的两段代码就是4次和13次执行的差异。这种与问题的大小无关(n的多少)，即没有问题规模，执行时间恒定的算法，我们称之为具有 0(1)的时间复杂度，又叫常数阶。O(K)=O(1)

对于分支结构而言，无论是真，还是假，执行的次数都是恒定的，不会随着 n的变大而发生变化，所以单纯的分支结构 (不包含在循环结构中)，其时间复杂度也是0(1)。

3.3.2 线性阶

线性阶的循环结构会复杂很多。要确定某个算法的阶次，我们常常需要确定某个特定语句或某个语句集运行的次数。(关键是要分析O(1)语句执行的总次数)。因此，我们要分析算法的复杂度，关键就是要分析循环结构的运行情况。

示例一：
#include <stdio.h>
int main()
{
   int i=0;
   for(i=0;i<n;i++)
   {
      /*时间复杂度为O(1)的程序步骤序列 */
   }
   return 0;       
}

上面这段代码，它的循环的时间复杂度为 O(n)，因为循环体中的代码须要执行 n次。

总结：对于单层for循环，循环条件与问题规模n有关，时间复杂度一般都是O(n)

3.3.3 对数阶

实例1：
#include<stdio.h>
int main()
{
    int  count=1;
    while (count <n)
    {
         count *=2;
         /*时间复杂度为O(1)的程序步骤序列*/
    }
    return 0;
}


实例2：
#include<stdio.h>
int main()
{
    int  num;
    while (num!=0)
    {
        num/=2;
       /*时间复杂度为O(1)的程序步骤序列*/
    }
    return 0;
}

示例1：

由于每次 count 乘以2之后，就距离n 更近了一分。也就是说，有多少个2相乘后大于 n，则会退出循环。由2^x=n 得到 x=log2n(x也代表次数)。所以这个循环的时间复杂度为0(logn)。

实例2：

由于每次num除以2之后，就距离0 更近了一分。也就是说，有多少个2相除后等于0，则会退出循环。由n/2^x=1 ,得到 x=log2n(x也代表次数)。所以这个循环的时间复杂度为0(logn)。

3.3.4 平方阶

实例1：
#include<stdio.h>
int main()
{
    int i,j;
    for(i=0;i<n;i++)
    {
       for(j=0;j<n;j++)
        {
            /*时间复杂度为O(1)的程序步骤序列*/
        }
    }
    return 0;
}


实例2：
#include<stdio.h>
int main()
{
    int i,j;
    for(i=0;i<m;i++)
    {
       for(j=0;j<n;j++)
        {
            /*时间复杂度为O(1)的程序步骤序列*/
        }
    }
    return 0;
}

实例3：
#include<stdio.h>
int main()
{
    int i,j;
    for(i=0;i<n;i++)
    {
       for(j=0;j<=i;j++)
        {
            /*时间复杂度为O(1)的程序步骤序列*/
        }
    }
    return 0;
}

实例1：

是一个循环嵌套，它的内循环刚才我们已经分析过，时间复杂度为O(n)。而对于外层的循环，不过是内部这个时间复杂度为 O(n)的语句，再循环n次。所以这段代码的时间复杂度为O(n^2)。

实例2：

如果外循环的循环次数改为了m，时间复杂度就变为O(mxn)。

实例3：

由于当i=0，内层循环执行1次，当i=1，内层循环执行2次，当i=2，内层循环执行3次......当i=n-1，内层循环执行n次，因此总的执行次数为：1+2+3+4+...+n即等差数列求和问题：(1+n)*n/2=n/2+n^2=O(n^2)

总结：总结：对于双层for循环，内外循环条件与问题规模n有关，时间复杂度一般都是O(n^2)

四、空间复杂度

空间复杂度也是一个数学表达式，是对一个算法在运行过程中临时占用存储空间大小的量度空间复杂度不是程序占用了多少bytes的空间，因为这个也没太大意义，所以空间复杂度算的是变量的个数。 空间复杂度计算规则基本跟实践复杂度类似，也使用大O渐进表示法。注意：函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了，因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

空间复杂度计算的是与问题规模有关的额外开辟的内存空间！！！比如：临时定义的变量与问题规模无关不能算进去。

五、常用的时间复杂度

六、经典题目（非递归和递归代码比较）

6.1 计算1+2+3...+n的和

1.非递归方式
int getsum(int n)
{
   int res=0;
   for(int i=1;i<=n;i++)
   {
       res+=i;
   }
   return res;
}

2.递归方式
int getsum(int n)
{
    if(n==1)
      {
          return 1;
      }  
    else
      {
         return getsum(n-1)+n;
      }
}

分析：非递归方式：问题规模体现在形参上n

时间复杂度：单层for循环，语句执行次数为n，所以时间复杂度为：O(n)

空间复杂度：没有与问题规模相关额外开辟的内存，空间复杂度为O(1)

注：临时变量res和i都与问题规模无关，无论求和项数是多少，都只开这两个O(2)-----O(1)

递归总结分析：

重点：递归就是函数自己调用自己，发生函数调用就会发生函数栈帧的开辟，每进行一次函数调用就会在内存上开辟一块内存，且需要注意，只有当函数调用完毕（函数语句执行完毕，得到确切的值，返回给被调函数，这块内存才会被释放！！！）

递归的时间复杂度：函数的调用次数

递归的空间复杂度：递归的深度（二叉树的深度）

分析：递归方式：问题规模体现在形参上n

在这个问题上，函数调用次数与递归深度都相同，都与问题规模有关，因此，时间复杂度和空间复杂度都是O(n)

6.2 斐波那契数列（递归与非递归实现）-重点理解

1.非递归的方式
int Fib(int n)
{
	int a = 1;
	int b = 1;
	int c = 1;
	while(n>=3)
	{
		c = a + b;
		a = b;
		b = c;
	}
	return c;
}


2.递归的方式
int Fib(int n)
{
	if(n<=2)
	
		return 1;
	
	else
		return Fib(n - 1) + Fib(n - 2);
}

分析：非递归方式：问题规模体现在形参上n

时间复杂度：单层while循环，语句执行次数为n-3+1=n-2，所以时间复杂度为：O(n)

空间复杂度：没有与问题规模相关额外开辟的内存，空间复杂度为O(1)

分析：递归方式：问题规模体现在形参上n

递归的时间复杂度：计算函数的调用总的次数

递归的空间复杂度：递归的深度（二叉树的深度）

注意：每一层的递归调用都会在栈上分配一块内存，有多少层递归调用就分配多少块相似的内存，所有内存加起来就是开辟的总的内存大小，同层占用一块内存！！

6.3 二分查找算法（递归与非递归实现）-重点理解

1.非递归方式
int binarysearch(int* arr, int len, int val)
{
	assert(arr != NULL && len > 0);   //参数检验
	int left = 0, right = len - 1;
	while (left <= right)            //查找的条件
	{
		int midindex = (left + right) / 2;
		//面试进行优化，利用位运算更偏底层运行速度更快。
		//优化一：midindex = (left + right) >> 1; 
 
		// 提示：若: 数据量很大 [0,200] left=150,right = 160; -> 310，  有可能超出范围如何解决？ 算术运算符操作的数据范围只能在基本数据类型的范围之内
		//优化二：midindex = ((right - left)>>1) + left;
		if (arr[midindex] == val)
		{
			return midindex;
		}
		else if (arr[midindex] < val)
		{
			left = midindex + 1;
		}
		else
		{
			right = midindex - 1;
		}
	}
	return -1;
}



2.递归方式
int binarysearch0(int* arr, int len, int value, int left, int right)
{
	if (left > right)
		return -1;
	int midindex = (left + right) / 2;
	if (arr[midindex] == value)
	{
		return midindex;
	}
	else if (arr[midindex] > value)
	{
		return binarysearch0(arr, len, value, left, midindex - 1);
	}
	else
	{
		return binarysearch0(arr, len, value, midindex + 1, right);
	}
}
 
int binarysearch(int* arr, int len, int value)
{
	assert(arr != NULL);
	return binarysearch0(arr, len, value, 0, len - 1);
}

分析：非递归方式：问题规模体现在形参上len，数组长度不同，问题规模就不同

时间复杂度：每次查找查找区间减半，所以减了多少次，代表语句执行的总次数，logn

空间复杂度：没有与问题规模相关额外开辟的内存，空间复杂度为O(1)

分析：递归方式：问题规模体现在形参上查找的区间上，封装成函数。

时间复杂度：每次查找查找区间减半，所以减了多少次，代表语句执行的总次数，logn

空间复杂度：没有与问题规模相关额外开辟的内存，空间复杂度为O(1)

七、给定题目设计算法，同时给出时间复杂度和空间复杂度（未知代码）

这种题型求解思路如下：

时间复杂度：访问问题规模中的元素总个数

空间复杂度：与问题规模相关额外开辟的内存空间，没有额外开辟跟问题规模相关的内存O(1)

以上便是我为大家带来的算法效率分析的内容，若有不足，望各位大佬在评论区指出，谢谢大家！可以留下你们点赞、收藏和关注，这是对我极大的鼓励，我也会更加努力创作更优质的作品。再次感谢大家！