CPU基础知识多篇详解

时间：2024-02-17 10:27:08 阅读全文下载本文

【引言】CPU基础知识多篇详解为的会员投稿推荐，但愿对你的学习工作带来帮助。

CPU基础知识大全详解有哪些？CPU在电脑中是最核心关键的硬件之一，相当于人的大脑，决定了电脑运算能力，因此CPU的选择至关重要。下面就让小编带你去看看CPU基础知识大全详解，希望对你有所帮助吧!

程序员必须了解的CPU知识 - 科普篇

1导读

对于一名程序员来说，无论你使用的是什么语言，代码最终都会交给CPU来执行。所以了解CPU相关的知识一方面属于程序员的内功，另一方面也可以帮助你在日常编写代码时写出更加高效的代码

本文不打算对CPU进行深入探究，相反是以简单的语言来帮助大家了解CPU的工作原理以及不得不提到的CPU缓存相关知识，其中晦涩的内容我会通过配图来帮助大家理解，最后会以几个例子来帮助大家更直观的感受到CPU缓存带来的性能影响

2CPU基础知识

CPU即Central ProcessingUnit(中央处理器)，是我们的代码打交道最多的硬件之一，要想让一个CPU工作，就必须给它提供指令和数据，而这里的指令和数据一般就放在我们的内存当中。其中指令就是由我们平常编写的代码翻译而来，数据也是我们代码中需要用到的数据(例如一个int值、一串字符串等等)

以C语言为例，从我们开始编写到运行的生命周期可以粗略的用下图表示：

大致分为以下几个步骤

我们日常中使用编辑器或者IDE敲入代码

代码编写完成后使用编译和链接工具生成可以被执行的程序，也就是机器语言(指令的集合)

当程序被运行时，整个程序(包括指令和数据)会被完整的载入到内存当中

CPU不停的向内存读取该程序的指令执行直到程序结束

通过上述第4步我们知道，CPU自身是没有保存我们的程序的，需要不停的向内存读取

那么有个问题是CPU是如何向内存读取的呢?

这里其实存在一个“总线”的概念，即CPU会通过地址总线、控制总线、数据总线来与我们的内存进行交互。其中地址总线的作用是寻址，即CPU告诉内存需要哪一个内存地址上的数据;控制总线的作用是对外部组件的控制，例如CPU希望从内存读取数据则会在控制总线上发一个“读信号”，如果希望往内存中写一个数据则会发一个“写信号”;而数据总线的作用顾名思义就是用来传输数据本身的了

例如CPU需要希望从内存中读一条数据，那么整个过程为：

到这里我们已经知道了CPU在执行我们程序的过程中会不断的与内存交互，读取需要的指令和数据或者写入相关的数据。这个过程是非常非常快的，一般CPU与内存交互一次需要200个时钟周期左右，而现代的处理器单个时钟周期一般都短于1纳秒(1秒= 十亿纳秒)

但我们的前辈们仍然对这个速度不满足，所以又对CPU设计了一套缓存系统来加速对内存中数据的读取

3CPU缓存

现代CPU通常设计三级缓存(L1、L2、L3)，其中L1、L2缓存是每个CPU核心独享的，L3缓存是所有CPU核心共享的，而L1缓存又分为数据缓存和指令缓存

我们的数据就从内存先到L3缓存中，再到L2缓存中，再到L1缓存中，最后再到CPU寄存器中

按照大小来看，通常L1 < L2 < L3 < 内存

以我手上这台服务器为例，L1指令缓存大小为32K、数据缓存大小为32K，L2缓存大小为1MB，L3缓存大小为35.75MB

按照速度来看，通常L1 > L2 > L3 > 内存 > 磁盘，以时钟周期为计量单位

L1缓存：约 4 个CPU时钟周期

L2缓存：约 10 个CPU时钟周期

L3缓存：约 40 个CPU时钟周期

内存：约 200 个CPU时钟周期

也就意味着如果能命中缓存，我们程序的执行速度至少提升5倍左右，如果能命中L1缓存则提升50倍左右，这已经属于相当大的性能提升了

有了缓存系统后，CPU就不必要每条指令或数据都读一次了，可以一次性读取若干条指令或数据然后放到缓存里供以后查询，因为根据局部性原理，CPU访问内存时，无论是读取指令还是数据，所访问的内存单元都趋于聚集在一个较小的连续区域中，所以一次性读取一块连续的内存有利于后续的缓存命中

现实中，CPU通常情况下每次的读取内存时都会一次性读取内存中连续的64个字节，这个连续的64字节术语就叫做CacheLine(缓存行)，所以每一级CPU缓存就像下面这样

如果你手边有一台Linu__机器的话，可以通过下面的命令查看你的机器使用的CPU的Cache Line大小是多少

对于我的服务器来说，L1缓存就有 32KB / 64B = 512 个Cache Line

到这里，我们已经知道了CPU缓存的工作原理和加载方式，这里实际上还遗留了两个话题没有讲，一个是如何组织每一级的 Cache Line(例如 L1 的512 个CacheLine)来提升访问的命中率;另一个更加复杂一点，在现代CPU都是多核的场景下如何保证数据的一致性，因为每个核都有自己的L1和L2缓存，那么如果核心1修改的时候只修改了缓存的数据而没有修改内存中的数据，其他核心读到的就是旧数据了，如何解决这一问题?

由于本篇文章只是期望对CPU知识进行一个科普，不希望对于小白来说一次性接触大量的新内容，所以这两个问题我准备在后面的另外两篇再进行更细致的讨论

4性能对比

下面以几个实际的例子来加深大家对Cache Line如何影响程序性能的理解

示例一

我们假设有一个5000万长度的int数组，接着把这个数组的其中一些元素乘以2，考虑下面这两份代码

直觉上代码一比代码二少循环了4倍，并且也少乘2了4倍，理论上代码一比代码二快4倍左右才合理

但在我的服务器上运行的结果是代码一平均花费90毫秒，代码二平均花费93毫秒，性能几乎是差不多的，读者可以自行思考一下原因，再点击下方空白处查看解析

点击下方空白区域查看解析

▼

解析

这里最主要的原因还是CacheLine，虽然代码一需要执行的指令确实比代码二要少4倍，但由于CPU一次会把连续的64个字节都读入缓存，而读写缓存的速度又特别快(还记得吗?L1的读取速度只有约4个时钟周期，是内存的50倍)，以至于我们很难察觉到这4倍指令的差距

示例二

假设我们需要遍历一个二维数组，考虑下面这两种遍历方法：

由于数组长度是一模一样的，直觉上我们期望的是两份代码运行时间相差无几。但在我的服务器上代码一运行需要23毫秒，代码二运行需要51毫秒，读者可以自行思考一下原因，再点击下方空白处查看解析

点击下方空白区域查看解析

▼

解析

这里最主要的原因依然是Cache Line，由于C语言中二维数组的内存是连续的，所以我们按行访问的时候访问的一直都是连续的内存，而CacheLine也是连续的64个字节，所以按行访问对Cache Line更友好，更容易命中缓存

而按列访问的话每次访问的内存不是连续的，每次的跨度都是256__sizeof(int)也就是1KB，更容易出现缓存Miss

示例三

假设我们有一个数组，我们希望计算所有大于100的元素的和，考虑下面两份代码

其中代码一是随机生成了个长度为1000W的数组，然后统计大于100的所有数字的和;代码二也是随机生成了个长度为1000W的数组，但是是先排完序，再统计大于100的所有数字的和。并且可以看到，两份代码都是只计算了统计sum的那段代码的消耗时间，所以两份代码都不考虑随机生成数组和排序花费的时间

理论上来讲两份代码花费时间应当是相差无几的，但实际上在我的机器上跑出来第一份代码输出的是46毫秒，第二份代码输出的是23毫秒

读者可以自行思考一下原因，再点击下方空白处查看解析，提示：第二份代码中在统计sum之前数组是有序的

电脑CPU如何选购?台式机CPU知识扫盲和选购建议

CPU有几个重要的参数：架构、主频、核心、线程、缓存、接口。

架构：

有句老话叫“抛开架构看核心主频都是耍流氓”，那什么是架构?假如我们把架构想象成交通工具，那么老的架构就是火车，而新的架构就是高铁，所以架构的提升直接影响CPU的性能。这也就是为什么老式的CPU虽然也有超高的主频但性能还是被现在的i3碾压的原因了。

电脑CPU如何选购?台式机CPU知识扫盲和选购建议

主频：

我们常在CPU的信息里看到某某CPU主频3.6GHz，这里的主频其实是CPU内核工作的时钟频率，并不直接等于CPU的运算速度，但是高的主频对于CPU的运算速度却至关重要。

核心：

核心又称内核，是CPU用来完成所有计算、接受/存储命令、处理数据等任务的装置。我们可以简单的把核心理解为人的手，单核就是一只手、双核就是两只手、四核就是四只手。

核心数并不是越多越好的，要看使用场景，比如在打字的时候，两只手就比一只手效率高，但是在操作鼠标的时候，使用两只手只会起到适得其反的效果。至于什么场景需要使用多少核心的CPU在下面会讲到。

电脑CPU如何选购?台式机CPU知识扫盲和选购建议

线程：

我们通常会看到“四核四线程”和“四核八线程”这两种说法，我们可以简单的把工厂里的流水线比作线程，把工人比作核心，早先由于工人工作技能不高，一个工人只能处理一条流水线的任务，我们可以把这个称为单核单线程，但是后来工人技术熟练了，觉得操作一条流水线很无聊，不能体现自己的价值，于是就给又分配一条流水线，让这个工人同时处理两条流水线的任务，我们可以把这个称为“单核双线程”。

缓存：

缓存也是CPU里的一项非常重要的参数，由于CPU的运算速度比内存条的读写速度要快很多，这会让CPU花费很长的时间等待数据的到来或是把数据写入内存条，这个时候CPU内的高速缓存可以作为临时的存储介质来缓解CPU的运算速度与内存读写速度不匹配的矛盾，所以缓存越大越好。

电脑CPU如何选购?台式机CPU知识扫盲和选购建议

接口：

CPU需要通过接口安装在主板上才能工作，而目前CPU的接口都是针脚式接口，AMD和英特尔的CPU在接口上就有很大的差别，所以需要使用适配接口的主板才能正常工作。目前英特尔主流的接口类型为LGA-1151接口(6、7、8代i3i5 i7都是这种接口);AMD平台主流的接口类型有AM4接口(锐龙系列)和FM2+接口(速龙系列、APU系列)。

PS:英特尔最新的酷睿8代CPU虽然也是LGA-1151接口，但不适配老式的LGA-1151接口主板的平台，需要另购主板

说完了这些重要的参数，相信你也对CPU有了一个大概的了解，我们再谈谈不同场景对CPU的选择。