32位CPU一次只能处理32位,也就是4个字节的数据;而64位CPU一次就能处理64位即8个字节的数据。如果我们将总长128位的指令分别按照16位、32位、64位为单位进行编辑的话:旧的16位CPU(如Intel 80286 CPU)需要8个指令,32位的CPU需要4个指令,而64位CPU则只要两个指令。显然,在工作频率相同的情况下,64位CPU的处理速度比16位、32位的更快.
可以比较一下图中的32位与64位CPU,64位的代码流的数量没有改变,其宽度随着指令代码的宽度而变化;而数据流的宽度则增加了一倍。虽然理论上在一个时钟周期内64位系统处理的数据量是32位系统的两倍,但理论和现实通常都是有差距的。
要注意的是,CPU不只需要位宽够宽的寄存器,也需要足够数量的寄存器,以确保大量数据处理。因此为了容纳更多的数据,寄存器和内部数据通道也必须加倍,因此在64位CPU中的寄存器位数一般是32位CPU中的两倍。
不过,虽然寄存器位数增加了,但正在执行指令的指令寄存器却都是一样的,即数据流加倍而指令流不变。此外,增加数据位数还可以扩大动态范围。在通常使用的十进制中,只能得到最多10个整数(一位数情况下),这是因为0~9中只有10个不同的符号来表示相应的意思,想要表示10以上的数就需要增加一位数,两位数(00-99)才可以表示100个数。
可以得出十进制的动态范围的计算公式:DR=10^n (n表示数字位数)。在二进制体系中,相应的我们可以得到公式:DR=2^n,那么32位就可以达到2^32=4.3×109,升级到64位之后,就可以达到2^64=1.8×1019。动态范围扩大了43亿倍。
提示:扩大动态范围可以在一定程度上提高寄存器中数据的准确性。比如,当使用32位系统处理气象模拟运算任务时,当处理的数据超过32位所能提供的最大动态范围时,系统就会出现诸如Overflow(超过了最大正整数)或Underflow(低于最小的负整数)的错误提示,这样寄存器中的数据就无法保证准确。
除了运算能力之外,与32位CPU相比,64位CPU的优势还体现在系统对内存的控制上。由于地址使用的是特殊的整数,而64位CPU的一个ALU(算术逻辑运算器)和寄存器可以处理更大的整数,也就是更大的地址。
传统32位CPU的寻址空间最大为4GB,使得很多需要大容量内存的大规模的数据处理程序在这时都会显得捉襟见肘,形成了运行效率的瓶颈。而64位的处理器在理论上则可以达到1800万个TB(1TB=1024GB),将能够彻底解决32位计算系统所遇到的瓶颈现象。