数据安全之散列函数（六）- SHA256

SHA-256（Secure Hash Algorithm 256-bit）是SHA-2（Secure Hash Algorithm 2）家族中的一种加密哈希函数，由美国国家安全局（NSA）设计，并作为联邦信息处理标准（FIPS PUB 180-2）发布。SHA-256旨在替代旧的SHA-1算法，提供更高的安全性。它广泛用于多种安全应用和协议中，包括TLS和SSL、PGP、SSH、IPsec以及比特币和其他加密货币的区块链技术。

基本特性

输出长度：SHA-256算法输出为一个256位（32字节）的哈希值，这意味着它可以产生22562256个可能的哈希值，大大减少了哈希碰撞的概率。
输入长度：SHA-256可以处理任意长度的输入数据，并将其转换成一个固定长度的输出哈希值。
安全性：SHA-256设计用来抵抗密码攻击，包括碰撞攻击和预像攻击。它的安全性远超过先前的哈希算法如MD5和SHA-1。

工作原理

SHA-256的计算过程涉及以下几个步骤：

预处理：包括填充消息使其长度模512位等于448，并且在消息末尾附加原始消息长度的64位表示，确保处理后的消息长度为512位的整数倍。
初始化缓冲区：算法使用一个固定的初始哈希值，由八个32位的字组成，用于计算最终的哈希值。
消息分块：处理后的消息被分成512位的块进行处理。
消息扩展和压缩：每个块被扩展为64个32位的字，然后通过64轮的复杂函数和运算，结合上一块的哈希结果（或初始哈希值）来更新哈希值。
输出：经过所有块的处理后，最终的哈希值由缓冲区中的八个32位字组合而成。

SHA-256 与 MD5 的区别

SHA-256和MD5在设计上有一些基本的计算差异，这些差异影响了它们的安全性、效率以及产生的哈希值。以下是它们在计算方面的一些关键区别：

哈希值长度：

- MD5：产生一个128位（16字节）的哈希值。
- SHA-256：产生一个256位（32字节）的哈希值。更长的哈希值提供了更大的输出空间，降低了碰撞的概率。

算法结构：

- MD5：使用了基于Merle-Damg?rd结构的设计，这是一种将输入消息分块处理，然后将每一块通过不同的函数循环迭代处理的方法。
- SHA-256：虽然也基于Merle-Damg?rd结构，但它引入了更复杂的计算步骤和更多的迭代轮次（64轮），每一轮使用不同的常数和更复杂的数学运算。

运算复杂度：

- MD5的计算过程较为简单，主要包括位运算（如AND、OR、XOR、NOT）、加法和循环左移。
- SHA-256使用了更为复杂的运算，包括模32加法、位运算、循环右移和右移。SHA-256的算法设计使其对于密码分析技术更为抵抗。

消息扩展：

- MD5对每个512位的消息块进行处理，不过它的消息扩展相对简单。
- SHA-256对每个512位的消息块进行更复杂的扩展，将其扩展到64个32位的字，这增加了处理每个消息块的计算量，也提高了算法的安全性。

初始哈希值（IV）：

- MD5和SHA-256都使用固定的初始哈希值，但这些值在两种算法中是不同的，SHA-256使用了更长的初始值来匹配其输出哈希值的长度。

安全性和抗碰撞能力：

- 由于SHA-256的更长哈希值和更复杂的计算过程，它提供了比MD5更高的安全性和更强的抗碰撞能力。

综上所述，SHA-256相较于MD5在计算上更为复杂和安全，这也是为什么SHA-256被推荐用于需要较高安全性的场合，而MD5则因其安全性问题而逐渐被淘汰。