计算机组成与设计硬件/软件接口 Risc-v 版-锐单电子商城

我们强调性能 X = 1 执行时间 X 性能 Y = 1 执行时间 Y 性能_X=\dfrac{1}{执行时间_X}\qquad性能_Y=\dfrac{1}{执行时间_Y} 性能X=执行时间X1性能Y=执行时间Y1 若有性能 X 性能 Y = 执行时间 Y 执行时间 X = n 称 X 的执行速度是 Y 的 n 倍若有\quad \dfrac{性能_X}{性能_Y}=\dfrac{执行时间_Y}{执行时间_X}=n \quad 称 X 的执行速度是 Y 的 n 倍若有性能Y性能X=执行时间X执行时间Y=n称X的执行速度是Y的n倍

1.6.2 性能的度量

运行时间：总响应时间，包括所有方面。处理，I/O，操作系统开销，空闲时间。决定系统性能。

CPU 时间：不同程序影响不同的CPU和系统性能

1.6.3 CPU 性能及其度量因素

程序的 C P U 执行时间 = 程序的 C P U 时钟周期数时钟频率 = 程序的 C P U 时钟周期数 × 时钟周期时间程序的\mathrm{CPU} 执行时间=\dfrac{程序的\mathrm{CPU}时钟周期数}{时钟频率}=程序的\mathrm{CPU}时钟周期数\times 时钟周期时间程序的CPU执行时间=时钟频率程序的CPU时钟周期数=程序的CPU时钟周期数×时钟周期时间

1.6.4 指令性能

C P U 时钟周期数 = 指令数 × C P I \mathrm{CPU}时钟周期数=指令数\times \mathrm{CPI} CPU时钟周期数=指令数×CPI

1.6.5 经典的 CPU 性能公式

C P U 时钟周期数 = ∑ i = 1 n ( C P I i × 指令数 i ) 平均 C P I = ∑ i = 1 n ( C P I i × 指令数 i 总指令数 ) \mathrm{CPU}时钟周期数=\sum_{i=1}^n (\mathrm{CPI}_i\times 指令数_i) \\平均\mathrm{CPI}=\sum_{i=1}^n(\mathrm{CPI}_i\times\dfrac{指令数_i}{总指令数}) CPU时钟周期数=i=1∑n(CPIi×指令数i)平均CPI=i=1∑n(CPIi×总指令数指令数i)

x0：定值为0
x1：返回地址
x2：栈指针
x3：全局指针
x4：线程指针
x5-x7，x28-x31：临时值
x8：帧指针
x9，x18-x27：过程调用保存
x10-x11：函数参数与返回值
x12-x17：函数参数

2.2 计算机硬件的操作

设计原则1：简单源于规整

2.3 计算机硬件的操作数

设计原则2：更少则更快

寄存器操作数：x0-31（00000-11111）

存储器操作数：imm(x?)

立即数操作数：addi x22,x22,4

2.4 无符号数和有符号数

2.5 计算机的指令表示

设计原则3：优秀的设计需要适当的折中

R-型指令

R-型指令包含：所有的不含立即数的算术逻辑运算指令

I-型指令

I-型指令包含：所有的含立即数的算术逻辑运算指令，所有的 load 指令，jalr指令

S-型指令

S-型指令包含：所有的 store 指令

2.6 逻辑操作

所有含有立即数的移位操作只需要少量的立即数位数，它们也是I-型指令

2.7 用于决策的指令

SB-型指令

SB-型指令包含：所有的条件分支指令

注意：SB-型指令没有第 0 位立即数，这意味着第 0 位缺省为 0 。只能跳转到偶数的位置。

条件分支指令采用 PC 相对寻址，跳转到 P C + i m m × 2 \mathrm{PC}+\mathrm{imm}\times 2 PC+imm×2

可以实现循环 switch/case语句

2.8 计算机对于过程的支持

UJ-型指令

UJ-型指令包含：jal 指令

例 jal x1,L1

采用 PC 相对寻址，并且将返回地址 PC+4 赋值给 x1

另例 jalr x0,0(x1)

跳转到 0+x1 的位置，此处 x0 = 0 ，效果是丢弃返回地址

void strcpy (char x[], char y[])
{ 
        
    size_t i;
    i = 0;
    while ((x[i] = y[i]) != '/0') /* copy & test byte*/
        i += 1
}

strcpy:
	addi sp,sp,-8 	// adjust stack for 1 doubleword
	sd x19,0(sp) 	// push x19
	add x19,x0,x0 	// i=0
L1: add x5,x19,x11 	// x5 = addr of y[i]
	lbu x6,0(x5) 	// x6 = y[i]
	add x7,x19,x10 	// x7 = addr of x[i]
	sb x6,0(x7)	 	// x[i] = y[i]
	beq x6,x0,L2 	// if y[i] == 0 then exit
	addi x19,x19, 1 // i = i + 1
	jal x0,L1 		// next iteration of loop
L2: ld x19,0(sp) 	// restore saved x19
	addi sp,sp,8 	// pop 1 doubleword from stack
	jalr x0,0(x1) 	// and return

2.10 对大立即数的 Risc-v 编址和寻址

2.10.1 大立即数

U-型指令

U-型指令包括 lui 指令 auipc 指令

U 型指令用来设置寄存器高位

2.11 指令与并行性：同步

在并行中避免数据竞争：两个处理器共享的内存。P1写，然后P2读取。数据竞争如果P1和P2不同步

需要使用原子操作，如下

保留加载：lr.d rd,(rs1) 从地址 rs1 加载，(rs1) -> rd

条件存储：sc.d rd,rs2,(rs1) rs2->(rs1) 存储，成功则设置 rd=0，失败则 rd=1。成功条件：内存值在上一次 lr.d 之后未更改。

可以通过该方案来对并行进程进行锁操作

		addi x12,x0,1 		// copy locked value
again: 	lr.d x10,(x20) 		// read lock
		bne x10,x0,again 	// check if it is 0 yet
		sc.d x11,x12,(x20) 	// attempt to store
		bne x11,x0,again 	// branch if fails
Unlock:
		sd x0,0(x20) 		// free lock

规格化的值

最普遍的情况，当 exp 位既不全为 0，也不全为 1 时。这种情况下：

阶码的值 E = e − B i a s E=e-Bias E=e−Bias 其中 B i a s = 2 k − 1 − 1 Bias = 2^{k-1}-1 Bias=2k−1−1，在单精度中对应为 127，双精度对应为 1023。最终阶码的取值范围为 − 126 ∼ + 127 -126\sim+127 −126∼+127（单精度）， − 1022 ∼ + 1023 -1022\sim+1023 −1022∼+1023

尾数值为 M = 1 + f M=1+f M=1+f 其中 f = 0. f n − 1 … f 1 f 0 f=0.f_{n-1}\dots f_1f_0 f=0.fn−1…f1f0
标签： 82r晶片电阻集成电路x0 le154电容 2sd965晶体管 2x10p线对线连接器 2sb1293晶体管

锐单商城拥有海量元器件数据手册、 IC替代型号，打造电子元器件IC百科大全！

计算机组成与设计 硬件/软件接口 Risc-v 版

最近热搜

历史搜索 清除历史记录

计算机组成与设计硬件/软件接口 Risc-v 版

历史搜索清除历史记录