当前位置 博文首页 > 冰河的专栏:奉劝那些刚参加工作的学弟学妹们:这些计算机与操作

    冰河的专栏:奉劝那些刚参加工作的学弟学妹们:这些计算机与操作

    作者:[db:作者] 时间:2021-07-07 22:08

    大家好,我是冰河~~

    最近发现很多小伙伴工作很久了,大部分工作都是在重复的进行CRUD,对于一些基础性的知识,比如:计算机基础知识,操作系统,数据结构和算法等,却了解的少之又少。其实,很多时候,这些基础性的知识往往是造成程序员职业生涯瓶颈的一个重要的因素。所以,冰河强烈建议这些基础知识越早知道越好,越早掌握越好!最好是在大学时期就充分掌握这些计算机基础知识。

    好了,接下来,冰河为大家总结了一篇万字长文系统介绍计算机中有关数据方面的基础知识。

    数据的表示形式

    在计算机中,所有的数据都是以二进制的形式进行表示的,也就是说,在计算机中使用0和1来表示所有的数据。而我们日常生活中的数字都是10进制的,那我们平时使用的数字如果在计算机中表示时就需要进行进制的转换。

    进制转换

    R进制转10进制

    R进制转10进制可以使用按权展开的方法,具体的操作就是:将R进制数的每一位数值使用Rk表示,底数是R,指数是k。其中,k与该位和小数点之间的位置有关。当这个位置位于小数据左边时,k的值是从小数点向左依次数的个数,需要注意的是:紧邻小数点的数字位置为0,接下来是1,2…依次类推。同样的,如果这个位置在小数点的右边,则紧邻小数据点位置的数字从-1开始,依次向右数为-2,-3等等,依此类推。

    例如,我们给出一个二进制数字,11010101.01,转换为10进制数字为:1 x 27 + 1 x 26 + 0 x 25 + 1 x 24 + 0 x 23 + 1 x 22 + 0 x 21 + 1 x 20 + 0 x 2-1 + 1 x 2-2

    再比如,我们给出一个八进制数,76128.01,转换为10进制数字为:7 x 84 +6 x 83 + 1 x 82 + 2 x 81 + 8 x 80 + 0 x 8-1 + 1 x 8-2

    十进制转R进制

    十进制转R进制就比较简单了,这里我们可以使用短除法。

    例如,将十进制数字69转换为二进制的过程如下所示。

    得出短除的结果后,我们需要将余数倒过来排列即为十进制69转换为二进制的结果,所以结果数据为:1000101。

    二进制与八进制互转

    二进制转八进制时,每三位二进制数表示一个八进制数。因为在八进制中,总共有8个基数,分别是0~7,逢8进1。而如果要使用二进制来表示时,0的二进制为000,7的二进制为111,所以,每三位二进制数对应一位八进制数。反过来,每一位八进制数对应三位二进制数。

    具体的划分策略是,从二进制的低位开始,从低到高,也就是从右向左,每三位二进制数对应一个八进制数,不足三位的前面补0,例如,我们将二进制数:10001110转化为八进制数的过程,具体如下所示。

    所以,二进制数10001110转化为八进制数的结果为216。

    同理,八进制转二进制与二进制转八进制正好相反,八进制的每一位对应三位的二进制数。也就是说,将八进制数的每一位转化成三位的二进制数即可。

    二进制与十六进制互转

    在十六进制表示的数字中,总共有15个基数,为0~15,逢16进1。如果要将二进制数转化为十六进制数时,首先要弄清楚每位十六进制数需要多少为二进制数表示。在十六进制中,最大的基数为15,15的二进制表示为:1111,最小的基数为0,0的二进制数为0000,也就是说,十六进制的基础使用二进制表示为 0000~1111,所以,每位十六进制数需要四位二进制数表示。

    从二进制数的低位开始,也就是从右侧开始,每四位二进制数对应一位十六进制数。

    例如,我们需要将二进制数10001110转换为十六进制数,如下所示。

    注意:在十六进制中,分别使用A,B,C,D,E,F代表10,11,12,13,14,15。

    所以,二进制10001110转化为十六进制的结果为8E。

    十六进制转二进制与二进制转十六进制正好相反,将十六进制的每一位转换为四位二进制数即可。

    数据的码制

    在计算机中,带符号的机器数可以采用原码、反码、补码和移码表示,这些编码称为码制。

    原码

    在原码表示中,最高位是符号位,0表示正号,1表示负号,其余的n-1位表示数值的绝对值,数值0的原码有两种表示形式: [ + 0 ] 原 [+0]_原 [+0]? = 0 0000000, [ ? 0 ] 原 [-0]_原 [?0]? = 1 0000000。

    反码

    在反码中,最高位是符号位,0表示正号,1表示负号,正数的反码与原码相同,负数的反码是其绝对值按位取反。数值0的反码有两种表示形式: [ + 0 ] 反 [+0]_反 [+0]? = 0 0000000, [ ? 0 ] 反 [-0]_反 [?0]? = 1 1111111。

    补码

    在补码中,最高位是符号位,0表示正号,1表示负号,正数的补码与原码和反码相同,负数的补码等于其反码的末位加1。在补码的表示中,0有唯一的补码: [ + 0 ] 补 [+0]_补 [+0]? = 0 0000000, [ ? 0 ] 补 [-0]_补 [?0]? = 0 0000000。

    移码

    移码表示法是在数X上增加一个偏移量来定义的,常用于表示浮点数中的阶码。如果机器字长为n,规定偏移量为 2n-1

    实际上,在偏移 2n-1的情况下,只要将补码的符号位取反就可以获得相应的移码。

    码制总结

    我们来看下面的表格,这里,我直接使用八位的二进制数来表示相应的数值。

    码制数值1数值-11-1
    原码0000 00011000 00011000 0010
    反码0000 00011111 11101111 1111
    补码0000 00011111 11110000 0000
    移码1000 00010111 11111000 0000

    通过表格我们发现:

    • 正数的原码、反码和补码是相同的。
    • 负数的反码是原码除符号位外,其他位分别取反;
    • 负数的补码是其反码的末位加1。
    • 移码是在补码的基础上符号位取反得到。

    在负数的原码和补码的转换中,我们可以得出如下结论:

    • 负数的原码转补码是在原码的基础上除符号位外,其他位取反,然后末位加1。
    • 负数的补码转原码是在补码的基础上除符号位外,其他位取反,然后末位加1。

    也就是说,负数的原码转补码和补码转原码的规则是一样的。小伙伴们可以根据表格自行验证

    计算机使用补码进行加减法运算

    我们再来看表格的最后一列 1-1,在计算机中,表示为1+(-1),其正确的结果应该为0。接下来,我们分别分析下使用原码、反码、补码和移码进行加减法运算的结果的正确性。

    • 表格的第一行中,使用原码计算的结果为1000 0010,转换为10进制数为-2,1-1不等于-2,所以,使用原码进行加减法运算的结果是错误的。
    • 在反码中,计算1-1的结果为1111 1111,显然结果不为0,所以,使用反码进行加减法运算的结果是错误的。
    • 在补码中,计算1-1的结果为0000 0000,结果为0,所以,使用补码进行加减法运算的结果是正确的。
    • 在移码中,计算1-1的结果为1000 0000,结果为-0,虽然-0也等于0,但是严格意义来讲,这个结果是不正确的。

    在计算机中,不会使用移码进行加减法运算,移码用于浮点数的阶码。

    数值的表示范围

    在计算机中,码制所表示的范围,可以分为定点整数和定点小数。在定点数中,小数点是固定的。定点整数就是说小数点在最低位的后面,也就是在最右面,此时的小数点可以忽略不写。定点小数就是小数点在最高位的前面,也就是在最左边。

    值得注意的是:在定点整数和定点小数中,小数点都不占位数。所以,小数点在定点整数和定点小数中不会影响数值的范围。

    我们可以将定点整数和定点小数的取值范围总结成下表所示。

    码制定点整数定点小数
    原码-(2n-1 -1) ~ +(2n-1 -1)-(1-2-(n-1)) ~ +(1-2-(n-1))
    反码-(2n-1 -1) ~ +(2n-1 -1)-(1-2-(n-1)) ~ +(1-2-(n-1))
    补码-2n-1 ~ +(2n-1 -1)-1~ +(1-2-(n-1))
    移码-2n-1 ~ +(2n-1 -1)-1~ +(1-2-(n-1))

    表格中的n表示机器的字长,也就是用多少位二进制数表示。

    这张表小伙伴们不用死记硬背,说白了,这张表,冰河也记不住,那我们怎么办呢?不慌,这里,我给大家举一个例子。

    在这里插入图片描述

    例如,我们这里使用4位机器字长来表示,为了理解方便,这里我用四个方框来表示4位二进制数。

    在这里插入图片描述

    默认最高位为符号位,如下所示。

    在这里插入图片描述

    这里我们先用4位二进制数表示定点整数,则最小值为1111,最大值为0111。

    最小值1111表示如下。

    在这里插入图片描述

    其转换成10进制数为-7。

    最大值0111表示如下。

    在这里插入图片描述

    其转换为10进制数为7。

    这样,我们使用4位二进制数表示的范围,则可以计算出结果为:-7 ~ 7。也就是 -(24-1 - 1) ~ +(24-1 -1),所以,当使用n位二进制数表示数值的范围时,我们可以得出数据的表示范围为: -(2n-1 - 1) ~ +(2n-1 -1)

    所以,我们根本就不需要记住定点整数和定点小数的取值范围表,只需要简单的使用一个实际的二进制位进行验算即可得出正确的结果数据。比如,我这里以4位二进制位进行验算举例。

    还有一点需要注意的是:补码和移码比原码和反码少一个数,就是-0。另外,验证定点小数和验证定点整数的方式相同,小伙伴们可自行验证定点小数的值,这里,我就不再赘述。

    如果我们使用8位二进制数表示,则定点整数的取值范围为:

    1111 1111 ~ 0111 1111 转换为十进制数就是: -127 ~ 127,将二进制数转换为补码为:1000 0000 ~ 0111 1111。

    其中,-128的补码为1000 0000是人为规定的。

    如果使用8位二进制数表示,则定点小数的取值范围为:

    -0.1111 1111 ~ +0.11111111,补码的范围为: -1~ + +0.11111111。

    其中,-1的补码为1000 0000是人为规定的。

    浮点数的运算

    浮点数的表示

    首先,我们先来看下浮点数的表示形式,浮点数的表示形式如下,

    N = 尾数 * 基数指数

    对于浮点数来说,我们最常说的就是圆周率 π,数学上常使用3.14来表示π的值,如果使用科学计算法的话,我们可以使用形如3.14 * 103 这样的数来表示。其中,在3.14 * 103中,3.14表示尾数,10表示基数,3表示指数。

    另外,3.14 * 103 可以写成多种形式,比如可以写成 0.314 * 104,也可以写成0.0314 * 105

    浮点数的存储格式

    浮点数在计算机中的表示中,阶码是带符号的纯整数,尾数为带符号的纯小数。浮点数的表示格式如下所示。

    在这里插入图片描述

    一个数的浮点数表示不是唯一的。当小数点的位置发生改变时,阶码也会相应的改变。可以使用多个浮点形式表示同一个浮点数。浮点数的数值范围主要由阶码决定,数值的精度则是由尾数决定的。

    浮点数的运算过程

    运算的过程要依次经历对阶、尾数计算和结果格式化三个阶段。

    例如计算:3.14 * 103 + 1.5 * 105的结果数据。

    首先,我们需要先进行对阶操作,这里有个原则就是小数向大树看齐,这里我们需要将3.14 * 103进行对阶操作,转化成0.0314 * 105,然后与1.5 * 105进行相加操作,得出结果数据1.5314 * 105

    在这里插入图片描述

    接下来,我们再来看看浮点数的特点。

    浮点数的特点

    浮点数的主要特点如下所示。

    • 一般尾数使用补码表示,阶码使用移码表示。
    • 阶码的位数决定数的表示范围,位数越多范围越大。
    • 尾数的位数决定数的有效精度,位数越多精度越高。
    • 对阶时,小数向大数看齐。
    • 对阶是通过较小数的尾数右移实现的。

    计算机结构

    计算机结构主要由运算器、控制器、存储器、输入设备和输出设备组成。简化的结构图如下图所示。

    在这里插入图片描述

    接下来,我们再看看看其详细的结构图如下所示。

    在这里插入图片描述

    其中,主存储器又叫做内存储器,也就是内存;辅助存储器又叫做辅存,也就是外存储器,例如磁盘;CPU的核心部件为运算器和控制器。

    CPU由运算器、控制器、寄存器组和内部总线组成。

    在这里插入图片描述

    运算器包含:算术逻辑单元、累加寄存器、数据缓冲寄存器、状态条件寄存器。

    在这里插入图片描述

    • 算术逻辑单元(ALU):数据的算术运算和逻辑运算。
    • 累加寄存器(AC):通用寄存器,为ALU提供一个工作区,用于暂存数据。
    • 数据缓冲寄存器(DR):写内存时,暂存指令或数据。
    • 状态条件寄存器(PSW):存储状态标志和控制标志,有时也可以将状态条件寄存器归为控制器部分。

    控制器包含:程序计数器、指令寄存器、指令译码器、时序部件。

    在这里插入图片描述

    • 程序计数器(PC):存储下一条要执行的指令的地址。
    • 指令寄存器(IR):存储即将执行的指令。
    • 指令译码器(ID):对指令中的操作码字段进行分析解释。
    • 时序部件:提供时序控制信号。

    计算机体系结构分类

    首先,我们先来看一个在计算机领域中,对计算机的体系结构进行分类的一种经典方法,就是Flynn分类法,Flynn分类法将计算机分成单指令流单数据流、单指令流多数据流、多指令流单数据流、多指令流多数据流。

    在这里插入图片描述

    具体信息如下表所示。

    体系结构类型结构关键特性代表
    单指令流单数据流(SISD)控制部分:一个 处理器:一个 主存模块:一个单处理器系统
    单指令流多数据流(SIMD)控制部分:一个 处理器:多个 主存模块:多个各处理机以异步的形式执行同一条机灵并行处理机、阵列处理机、超级向量处理机
    多指令流单数据流(MISD)控制部分:多个 处理器:一个 主存模块:多个被证明是不可能的,至少是不实际的目前没有,有资料记载流水线处理机为此类
    多指令流多数据流(MIMD)控制部分:多个 处理器:多个 主存模块:多个能够实现作业、任务、指令等各级全面并行多处理机系统、多计算机

    指令的基本概念

    一条指令就是机器语言的一个语句,它是一组有意义的二进制代码,指令的格式如下所示。

    在这里插入图片描述

    其中,操作码部分指出了计算机要执行什么性质的操作,例如,加法、减法、取数、存数等。地址码字段需要包含各操作数的地址及操作结果的存放地址等,从其地址结构的角度可以分为三地址指令、二地址指令、一地址指令和零地址指令。

    三地址指令

    在这里插入图片描述

    例如,执行a+b=c操作时,就是使用的三地址指令。此时如下所示。

    在这里插入图片描述

    二地址指令

    在这里插入图片描述

    例如,执行a+=b操作时,执行的就是二地址指令,此时如下所示。

    在这里插入图片描述

    一地址指令

    在这里插入图片描述

    例如,执行a++操作时,执行的就是一地址指令,此时如下所示。

    在这里插入图片描述

    零地址指令

    在这里插入图片描述

    例如,宕机就是零地址指令。

    寻址方式

    总体来说,寻址方式可以分为:立即寻址、直接寻址、间接寻址、寄存器寻址、寄存器间接寻址。
    在这里插入图片描述

    • 立即寻址:操作数直接在指令中,速度快,灵活性差。
    • 直接寻址:指令中存放的是操作数的地址。
    • 间接寻址:指令中存放了一个地址,这个地址对应的内容是操作数的地址。
    • 寄存器寻址:寄存器存放操作数。
    • 寄存器内存放的是操作数的地址。

    CISC与RISC

    CISC和RISC分别表示复杂指令集系统和精简指令集系统,具体信息如下表所示。

    指令系统类型指令存执方式实现方式其他
    CISC(复杂)数量多、使用频率差别大,可变长格式支持多种微程序控制技术(微码)研发周期长
    SISC(精简)数量少,使用频率接近,定长格式,大部分为单周期指令,操作寄存器,只有Load/Store操作内存。支持方式少增加了通信寄存器、硬布线逻辑控制为主,适合采用流水线优化编译,有效支持高级编程语言

    如何比较CISC和RISC,分哪些维度?

    指令数量、指令使用频率、存执方式、寄存器、流水线支持、高级语言支持。

    • CISC:复杂、指令数量多,频率差别大、多寻址。
    • RISC:精简、指令数量少。操作寄存器,单周期,少寻址,多通用寄存器,流水线,

    流水线概念

    流水线是指在程序执行时,多条指令重叠进行操作的一种准并行处理的实现技术。各种部件同时处理是针对不同指令而言的,它们同时为多条指令的不同部分进行工作,以提高各部件的利用率和指令的平均执行速度。

    流水线的相关参数计算包括:流水线执行时间计算、流水线吞吐率、流水线加速比、流水线效率。

    在这里插入图片描述

    在计算机中,对于指令的操作主要分为三个部分:取指、分析和执行。如下所示。

    在这里插入图片描述

    如果执行取值、分析和执行各需要1ms的话,则串行执行三条指令的时间总共需要9ms。这是因为一条执行的操作需要经过取指、分析和执行三个步骤,每个步骤需要1ms,执行一条指令的时间为3ms,则串行执行三条指令的时间为9ms。我们可以用下图来表示这个过程。

    在这里插入图片描述

    在上图的表示中,貌似执行三条指令使用9ms是没啥问题的。但是,如果我们把图形改造一下,我们就会发现相应的问题。我们使用下面的图形来表示执行三条指令的情况。

    在这里插入图片描述

    此时,我们发现,在上图执行指令操作的过程中,有很多空白的格子,而空白的格子表示在执行执行的过程中有空余的时间片资源没有利用起来。很显然,没有必要等待指令1完全执行完毕后再执行指令2,同样的,没有必要等待指令2完全执行完毕后再执行指令3。而且,我们发现按照上图执行完三条指令需要9ms时间。

    此时,如果将空余的时间片利用起来,则可以使用下图来表示。

    在这里插入图片描述

    此时,在执行三条指令的过程中,取指操作对指令1执行完取指后,马上对指令2进行取指,然后又马上对指令3进行取指;分析操作同样是对指令1执行完分析后,马上对指令2进行分析,然后又马上对指令3进行分析;执行操作也是对指令1执行完毕后,马上对指令2进行执行操作,然后又马上对指令3进行执行操作。期间,将空余的时间片资源充分的利用起来了。而且,我们发现,充分利用空余的时间片后,执行三条指令的时间由原来的9ms变为现在的5ms。

    从另一个角度,我们发现执行完第一条指令时,需要3ms,执行完第二条指令时,只需要在执行完第一条指令的基础上增加1ms。同样的,执行完第三条指令时,只需要在执行完第二条指令的基础上增加1ms。以后每增加一条指令,只需要增加1ms的时间便可以执行完此条指令。

    这就是计算机中的流水线技术。接下来,我们就说说流水线技术的相关计算问题。

    流水线计算

    关于流水线计算,我们先来看一个图。
    在这里插入图片描述

    在上图中,我们可以看出,执行完第一条指令时,需要3ms时间,执行完第二条指令时,只需要在执行完第一条指令的基础上增加1ms;执行完第三条指令时,只需要在执行完第二条指令的基础上增加1ms。以此类推,执行完第n条指令时,只需要在执行第n-1条指令的基础上增加1ms。说到这里,不知道小伙伴们有没有思考这样一个问题,流水线技术的这种规律就涉及到一个非常重要的概念,叫作 流水线周期

    流水线周期为执行时间最长的一段,上图中的流水线周期为1ms

    流水线的计算公式为:

    1条指令执行时间 + (指令条数 -1)*  流水线周期
    

    流水线的理论公式如下所示。

    (t1 + t2 + ... + tk) + (n-1) * △t
    

    其中t1,t2…tk表示执行一条指令的每个步骤分别需要的时间,n为指令的条数,△t为流水线周期。

    流水线的实践公式如下所示。

    k*△t + (n-1) * △t
    

    其中,k为执行一条指令的步骤数,n为指令的条数,△t为流水线周期。

    这里,给小伙伴们举一个例子。

    在这里插入图片描述

    例如,一条执行的执行过程可以分解为取指,分析和执行三步,在取指时间t取指=3△t,分析时间分析=2△t,执行时间t执行=4△t的情况下,若按照串行方式执行,则10条指令全部执行完需要多少△t?若按照流水线方式执行,流水线周期为多少△t?使用流水线方式时,执行完10条指令需要多少△t?

    (1)串行方式比较简单,就是将每条指令的执行时间进行累加。

    (3△t + 2△t + 4△t) * 10 = 90△t。

    (2)在执行一条指令的过程中,取指为3△t,分析为2△t,执行为4△t。根据流水线中对于流水线周期的定义: