标签:iso 进制 可见 编程模式 启动方式 S5PV210启动 Superviso 参考 使用方法
- 1 . CPU在固定频率的时钟控制下节奏运行
- 2 . CPU可以通过总线读取外部存储设备中的二进制指令集,然后解码执行
- 3 . 这些可以被CPU解码执行的二进制指令集是CPU设计的时候确定的,是CPU的设计者(ARM公司)定义的,本质上是一串由1和0组成的数字。这就是CPU的汇编指令集
- 汇编无移植性,c语言有一定可移植性,jave等更高级的语言移植性更强
- 汇编语言效率最高,C次之,jave等更高级语言效率更低
- 汇编不适合完成大型复杂的项目,更高级语言更适合完成更大,更复杂的项目
- 汇编的实质是机器指令(机器码)的助记符,是一种低级符号语言
- 机器指令集是一款CPU的编程特征,是这款CPU的设计者制定的。CPU的内部电路设计就是为了实现这些指令集的功能。机器指令集就好像CPU的API接口一样
- 汇编器的工作是把助记符(如MOV类似人的姓名)翻译成(101001类似身份证号码)
- 纯机器码编码
- 汇编语言编程
- c语言编程
- c++语言编程
- jave,c#等语言编程
- 脚本语言编程
- 汇编语言就是CPU的机器指令集的助记符,是一款CPU的本质特征
- 不同CPU的机器指令集设计不同,因此汇编程序不能在不同CPU之间相互移植
- 使用汇编编程可以充分发挥CPU的设计特点,所以汇编编程效率最高,因此在操作系统内核中效率极其重要处都需要用汇编处理
complex instruction set computer复杂指令集CPU
CISC体系的设计理念是用最少的指令来完成任务(譬如计算乘法只需要一条MUL指令即可),因此CISC的CPU本身设计复杂,工艺复杂,但好处是编译器好设计。CISC出现较早,至今Intel还一直采用CISC设计
Reduced Instruction Set computer精简指令集CPU
RISC的设计理念是让软件来完成具体的任务,CPU本身仅提供基本功能指令集。因此RISC CPU的指令集中只有很少的指令,这种设计相对于CISC,CPU的设计和工艺简单了,但是编译器的设计变难了
早期简单CPU,指令和功能都很有限
CISC时代--CPU功能扩展依赖于指令集的扩展,实质是CPU内部组合逻辑电路的扩展
RISC年代--CPU仅提供基础功能指令(譬如内存与寄存器通信指令,基本运算与判断指令等),功能扩展由使用CPU的人利用基础构架来灵活实现
一般典型CISC CPU指令在300条左右
ARM CPU常用指令30条左右
没有纯粹的RISC或CISC,发展方向是RISC和CISC结合,形成一种介于2者之间的CPU类型
内存就是程序的运行场所,内存和CPU之间通过总线连接,CPU通过一定的地址来访问具体内存单元
IO(input and output)是输入输出接口,是CPU和其他外部设备(如串口,LCD,触摸屏,LED等)之间通信的道路。一般的,IO就是只CPU的各种内部和外部外设
内存通过CPU的数据总线来寻址定位,然后通过CPU数据总线来读写
CPU的地址总线的位数是CPU设计时确定的,因此一款CPU所能寻址的范围是一定的,而内存是需要占用CPU的寻址空间
内存与CPU的这种总线式连接方式是一种直接连接,优点是效率高访问块,缺点是资源有限,扩展性差
IO指的是与CPU连接的各种外设
CPU访问各种外设有2种方式,一种是类似于访问内存的方式,即把外设的寄存器当做一个内存地址来读写,从而以访问内存相同的方式来操作外设,叫IO与内存统一编址方式(RISC,如ARM);另一种是使用专用的CPU指令来访问某种特定外设,叫IO与内存独立编址(CISC)
由于内存访问频率高,因此采用总线式连接,直接地址访问,效率最高
IO与内存统一编址方式,优势是IO当做内存来访问,编程简单;缺点是IO也需要占用一定的CPU地址空间,而CPU的地址空间是有限资源
IO与内存独立编址方式,优势是不占用CPU地址空间;缺点是CPU设计变复杂了
程序运行是两大核心元素:程序代码+数据
程序是我们写好的源代码经过编译,汇编之后得到的机器码,这些机器码可以拿给CPU去解码执行,CPU不会去修改程序,所以程序是只读的
数据是程序运行过程中定义和产生的变量的值,是可以读写的,程序运行实际就是为了改写数据的值
程序和数据都放在内存中,且不彼此分离的结构称为冯诺伊曼结构,譬如Intel的CPU均采用冯诺伊曼结构
程序和内存分开独立放在不同的内存块中,彼此完全分离的结构称为哈佛结构。譬如大部分单片机(MCS51,ARM9等)均采用哈佛结构
冯诺伊曼结构中程序和数据不区分的放在一起,因此安全域稳定性(病毒)是个问题,好处是处理器来简单
哈佛结构中程序(一般放在ROM,flash中)和数据(一般放在RAM中)独立分开存放,因此好处是安全和稳定性高,缺点是软件处理复杂一些(需要统一规划链接地址等)
- 寄存器属于CPU外设的硬件组成部分
- CPU可以像访问内存一样访问寄存器
- 寄存器是CPU的硬件设计者制定的,目的是留作外设被编程的"活动开关"
- 正如汇编指令集是CPU的编程接口API一样,寄存器是外设硬件的软件编程接口API。使用软件编程控制某一硬件,其实就是编程读写该硬件的寄存器
[ ] 常用的ARM汇编指令只有二三十条
[ ] ARM是低功耗CPU
[ ] ARM的架构非常适合单片机,嵌入式,尤其是物联网领域;而服务器等高校性能领域目前主导还是Intel
[ ] 大部分ARM(M3 M4 M7 M0 ARM9 ARM11 A8 A9等)都是32位架构
[ ] 32位ARM CPU支持的内存少于4G,通过CPU地址总线来访问
[ ] SoC中的各种内部外设通过各自的SFR编程访问,这些SFR的访问方式类似于访问普通内存,这叫IO与内存统一编址
常见的ARM(ARM7除外(已淘汰))都是哈佛结构的
哈佛结构保证了ARM CPU运行的稳定性和安全性,因此ARM适用于嵌入式领域
哈佛结构也决定了ARM裸机程序(使用实地址即物理地址的地址叫裸机程序)的链接比较麻烦,必须使用复杂的链接脚本告知链接器如何组织程序;对于OS之上的应用(工作在虚拟地址之中)则不需考虑这么多
S5PV210属于ARM Cortex-A8架构,32位CPU,CPU设计时就有32根地址线&32根数据线
32根地址线决定了CPU的地址空间为4G,那么这4G空间如何分配使用?这个问题就是地址映射问题(硬编码,不能修改)
- ROM:read only memory 只读存储器(不能直接通过地址总线和数据总线写)
- RAM:ramdom access memory 随机访问存储器
- IROM:internal rom 内部ROM,指的是集成到SoC内部的ROM(内存条有两个IROM&IRAM,目的是映射和转换。底下是上面的映射,很灵活)
- IRAM:internal ram 内部RAM,指的是集成到SoC内部的RAM
- DRAM:dynamic ram 动态RAM(外部接的内存就是平时我们插入的内存条)
- SRAM:static ram 静态RAM,容量小,价格高,优点是不需要软件初始化直接上电就能用
- SROM:接网卡
内存就是内部存储器,是用来运行程序的,即RAMDRAM,SRAM,DDR),通过地址总线访问
外存就是外部存储器,是用来存储东西的,即ROM(硬盘,flash(Nand,iNand...U盘,SSD),光盘)
CPU连接内存和外存的连接方式不同。内存需要直接地址访问,所以是通过地址总线和数据总线的总线式访问方式连接到(好处是直接访问,随机访问;坏处是占用CPU的地址空间,大小受限);外存是通过CPU的外存接口来连接到(好处是不占用CPU的地址空间,坏处是访问速度没有总线式快,访问时序较复杂)
- NorFlash(总线式访问,接到SROMC Bank,优点是可以直接总线访问,一般用来启动,太贵,已很少使用,但很可靠)
- NandFlash(分为SLC和MLC,已渐渐淘汰)
- eMMC/iNand/moviNand(iNand是SanDisk公司出厂的eMMC,moviNand是三星出厂的eMMC)
- oneNAND(oneNand是三星出的一种Nand,只有三星使用)
- eSSD(e即embeded嵌入式)
- SD卡/TF卡/MMC卡
SATA硬盘(机械式访问,磁存储原理,SATA是接口)
X210有2个版本,Nand版和iNand版,分别使用NandFlash和iNand位外部存储器。我们使用的是iNand版本,板载4GBiNand
S5PV210共支持4个SD/MMC通道,其中通道0和2依次用作启动。X210开发板中SD/MMC0通道用于连接板载MMC,因此外部启动时SD/MMC2通道(注意通道3不能启动)
第一步:CPU上电后先从内部iROM中读取预先设置的代码,执行。这一段iROM代码做了一些基本的初始化(CPU时钟,关看门狗...)(这一段iROM代码是三星出厂前设置的,三星不知道我们板子上将来接的是什么样的DRAM,因此这一段iROM是不能负责初始化外接的DRAM,因此这一段代码只能初始化SoC内部的东西);然后这一段代码会判断我们选择的启动模式(我们通过硬件跳线可以更改板子的启动模式),然后从相应的外部存储器去读取第一部分启动代码(BL1,大小为16KB)到内部SRAM
第二步:从SRAM去运行上一步读取来的BL1(16KB),然后执行。BL1负责初始化NandFlash,然后将BL2读取到iRAM(80KB).
第三步:从iRAM运行BL2,BL2初始化DRAM,然后将OS读取到DRAM中,然后启动OS,启动过程结束
思路:因为启动代码的大小是不定的,所以两步启动不合适
三星的解决方案是:把启动代码分为2半(BL1和BL2),这两部分协同工作来完成启动
- 关看门狗
- 初始化指令cache
- 初始化栈
- 初始化堆
- 初始化块设备复制函数device copy function
- 设置SoC时钟系统
- 复制BL1到内部的iRAM(16KB)
- 检查BL1的校验和
- 跳转到BL1去执行
- 先1st,通过OMpin选择启动介质
- 再2nd启动,从SD2
- 再Uart启动
- 再USB启动
内存:
SRAM:静态内存,特点是容量小,价格高,优点是不需要软件初始化直接上电就能用
DRAM:动态内存,特点是容量大,价格低,缺点是上电后不能直接使用,需要软件初始化后才可以使用
单片机中:内存需求量小,而且希望开发尽量简单,适合全部用SRAM
嵌入式系统:内存需求量大,而且没有NorFlash等可启动介质
PC机中:内存需求量大,而且软件复杂,不在乎DRAM的初始化开销,适合全部用DRAM
2 . 外存:
NorFlash:特点是容量小,价格低,优点是可以和CPU直接总线式相连,CPU上电后可以直接读取,所以一般用启动介质
NandFlash(跟硬盘一样):特点是容量大,价格低,缺点是不能总线式访问,也就是说不能上电CPU直接读取,需要CPU先运行一些初始化软件,然后通过时序接口读写
所以一般PC机都是:很少容量的BIOS(NorFlash) + 很大容量的硬盘(类似NandFlash) + 大容量的DRAM
一般的单片机:很少容量的NorFlash + 很少容量的SRAM
嵌入式系统:因为NorFlash很贵,现在很多嵌入式系统倾向于不同NorFlash,直接用:外接的大容量Nand + 外接大容量DRAM + SoC内置SRAM
3 . S5PV210启动方式是:外接的大容量Nand + 外接大容量DRAM + SoC内置SRAM
实际上,210内置了一块96KB的SRAM(叫iRAM),同时还有一块内置的64KB大小的NorFlash
体验从SD0的eMMC启动
开发板默认从eMMC启动,内部预先烧录了Android
从SD2启动
可以使用外置SD卡从SD2通道启动,但这需要先破坏板载的eMMC中的android镜像。破坏方法见《X210V3开发板立即教程》2.5.2节
USB调试模式
ARM约定:
Byte: 8 bits
Halfword:16 bits (2 byte)
Word: 32 bits (4 byte)
大部分ARM core提供
ARM指令集(32 bit)
Thumb指令集(16 bit)
Thumb2指令集(16 & 32 bit)
4.Jazelle cores 支持 jave bytecode
ARM处理器共有7种基本工作模式
用户模式
User:非特权模式,大部分任务执行在这种模式
异常模式
FIQ:当一个高优先级(fast)中断产生时将会进入这种模式
IRQ:当一个低优先级(normal)中断产生是将会进入这种模式
Supervisor(管理模式):当复位或软中断指令执行时将会进入这种模式
Abort:当存取异常时将会进入这种模式
Undef:当执行未定义指令时将会进入这种模式
系统模式
System:使用和User模式相同寄存器集的特权模式
注意:
ARM总共有37个寄存器,但是每种模式下最多只能看到18个寄存器,其他寄存器虽然名字相同但是在当前模式下不可见。
37个寄存器中30个为"通用”型,1个固定用作PC,一个固定用作CPSR,5个固定用作5中异常模式下的SPSR
对r14这个名字来说,在ARM中共有6个名叫r14(又叫sp)的寄存器,但是在每种特定处理器模式下,只有一个r14是当前可见的,其他的r14必须切换到它的对应模式下才能看到。这种设计叫影子寄存器(banked register)
Mode位(0 - 4)
处理器模式位
T Bit(5)
仅ARM xT架构支持
T = 0:处理器处于ARM状态
T = 1:处理器处于Thumb状态
中断禁止位(6 - 7)
I = 1:禁止IRQ
F = 1:禁止FIQ
J位(24)
仅ARM 5TE/J架构支持
J = 1:处理器处于Jazelle状态
Q位(27)
仅ARM 5TE/J架构支持
指示饱和状态
条件位(28 - 31)
N = Negative result from ALU
Z = Zero result from ALU
C = ALU operation Carried out
V = ALU operation overflowed
正常工作之外的流程都叫异常
异常会打断正在执行的工作,并且一般我慢希望异常处理完成后继续回来执行原来的工作
中断是异常的一种
所有的CPU都有异常向量表,这是CPU设计时就设定好的,是硬件决定的
当异常发生时,CPU会自动动作(PC跳转到宜昌向量处处理异常,有时伴有一些辅助动作)
异常向量表是应将想软件提供的处理异常的支持
当异常产生时
拷贝CPSR到SPSR_<mode>
设置适当的CPSR位:
改变处理器状态进入ARM态
改变处理器模式进入相应的异常模式
设置中断禁止位禁止相应中断
保存返回地址到LR_<mode>
设置PC为相应的异常向量
返回时,异常处理需要
从SPSR_<mode>恢复CPSR
从LR_<mode>恢复PC
Note:这些操作只能在ARM态执行
(汇编)指令是CPU机器指令的助记符,经过编译后会得到一串10组成的机器码,可以由CPU读取执行
(汇编)伪指令本质上不是指令(只是和指令一起写在代码中),他是编译器环境提供的,目的是用来指导编译过程,经过编译后伪指令最终不会生成机器码
ARM官方的ARM汇编风格:指令一般用大写,Windows中IDE开发环境(如ADS,MDK等)常用。如:LDR R0,[R1]
GNU风格的ARM汇编:指令一般用小写字母,linux中常用。如ldr r0,[r1]
ARM采用RISC架构,CPU本身不能直接读取内存,而需要先讲内存中的内容加载入CPU中通用寄存器中才能被CPU处理
ldr(load register)指令将内存内容加载入通用寄存器
str(store register)指令将寄存器内容存入内存空间中
ldr/str组合用来实现ARM CPU和内存数据交换
> * 寄存器寻址 mov r1,r2
> * 立即寻址 mov r0,#0xFF00
> * 寄存器移位寻址 mov r0,r1,lsl #3
> * 寄存器间接寻址 ldr r1,[r2]
> * 基址变址寻址 ldr r1,[r2,#4]
> * 多寄存器寻址 ldmia r1!,{r2-r7,r12}
> * 堆栈寻址 stmfd sp!,{r2-r7,lr}
> * 相对寻址 beq flag
同一指令经常附带不同后缀,变成不同的指令。经常使用的后缀有
> * B(Byte) 功能不变,操作长度变为8位
> * H(Half word) 功能不变,长度变为16位
> * S(Signed) 功能不变,操作数变为有符号
> * 如ldr ldrb ldrh ldrsb ldrsh
> * S(S标志) 功能不变,影响CPSR标志位
> * 如mov movs
条件后缀是否成立,不是取决于本句代码,而是取决于这句代码之前的代码运行后的结果
条件后缀决定了本句代码是否被执行,而不会影响上一句和下一句代码是否被执行
moveq r0,r1 @类似于c语言中的if (eq) {r0= r1;}
操作码 | 条件码助记符 | 标志 | 含义 |
---|---|---|---|
0000 | EQ | Z = 1 | 相等 |
0001 | NE | Z = 0 | 不相等 |
0010 | CS/HS | C = 1 | 无符号数大于或等于 |
0011 | CC/LO | C = 0 | 无符号数小于 |
0100 | MI | N = 1 | 负数 |
0101 | Pl | N = 0 | 正数或零 |
0110 | VS | V = 1 | 溢出 |
0111 | VC | V = 0 | 没有溢出 |
1000 | HI | C = 1,Z = 0 | 无符号数大于 |
1001 | LS | C = 0,Z = 1 | 无符号数小于或等于 |
1010 | GE | N = V | 有符号数大于或等于 |
1011 | LT | N != V | 有符号数小于 |
1100 | GT | Z = 0,N = V | 有符号数大于 |
1101 | LE | Z = 1,N != V | 有符号数小于或等于 |
1110 | AL | 任意 | 无条件执行(指令默认条件) |
1111 | NV | 任意 | 从不执行(不要使用) |
为了增加处理器指令流的速度,ARM使用多级流水线, S5PV210使用13级流水线,ARM11为8级
允许多个操作同时处理,而非顺序执行
PC指向正被取值的指令,而非正在指向的指令
数据传输指令 mov mvn
算术指令 add sub rsb adc sbc rsc
逻辑指令 and orr eor bic
比较指令 cmp cmn tst teq
乘法指令 mvl mla umull umlal smull smlal
前导零计数 clz
注意
1 . mvn和mov用法一样,区别是mov是原封不动的传递,而mvn是按位取反后传递
mov r1,r2 @两个寄存器之间数据传递
mov r1,#0 @将立即数传给寄存器
2 . and orr(逻辑或) eor(逻辑异或) bic(位清除指令)
bic r0,r0,#0x1f @将r0中的数的bit0到bit4清零后赋值给r0 0x1f = 0x0000 001f = 0x0000 ```` 11111
3 . 比较指令用来不叫2个寄存器中的数
cmp r0,r1 @比较r0,r1的数是否相等
cmn r0,r1 @让r0和r1中的数相加
tst r0,#0xf @测试r0的bit0-bit3是否相等
注意:比较指令不用后加s后缀就可以影响spcr中的标志位
4 . sub r2,r0,r1 (r2 = r0 -r1)
CPSR寄存器比较特殊,需要专门的指令访问,这就是mrs和msr
mrs & msr(更强)
mrs用来读psr,msr用来写psr
注意cpsr和spsr的区别和联系:
cpsr是程序状态寄存器,整个SoC中只有1个;而spsr有5个,分别在5中异常模式下,作用是当从普通模式进入一场模式时,用来保存之前普通模式下的cpsr,以在返回普通模式时恢复原来的cpsr
b & bl & bx
b 直接跳转
bl branch and link,跳转前把返回地址放入lr中,以便返回,以便于函数调用
bx 跳转同时切换到ARM模式,一般用于异常处理的跳转(现在已经不用)
ldr/str & ldm/stm &swp
单个字/半字/字节访问ldr/str
多字批量访问 ldm/stm
swp r1,r2,[r0] @内存与寄存器交换内容
swp r1,r1,[r0]
swi(software interrupt)
软中断指令用来实现操作系统中系统调用
合法立即数和非法立即数
ARM指令都是32位,除了指令标记和操作标记外,本身只能附带很少位数的立即数。因此立即数有合法与非法之分
合法立即数:经过任意位数的移位后非零部分可以用8位表示的几位合法立即数
合法:0xf000 000f,0x00ff 0000
SoC内部另一处理核心,协助主CPU实现某些功能,被主CPU调用执行一定任务
ARM设计上支持多达16个协处理器,但是一般SoC只实现其中的CP15(coprocessor)
协处理器和MMU,cache,TLB等处理有关,功能上和操作系统1的虚拟地址映射,cache管理等有关
mcr & mrc
mrc用于读取cp15中的寄存器
mcr用于写入cp15中的寄存器
举例(uboot的start.S 537行)
stmia sp,{r0-r12}
@将r0存入sp指向的内存处(假设为0x3000 1000);然后地址+4(即指向0x3000 1004),将r1存入该地址;然后地址再+4(指向0x3000 1008),将r2存入该地址.....直到r12内容放入(0x300 1030),指令完成
一个存访周期同时完成13个寄存器的读写
(r0-r12寄存器,sp寄存器里放了一个内存)
- ia(increase after)先传输,再地址+4
- ib(increase brfore)先地址+4,再传输
- da(decrease after)先传输,再地址-4
- db
- fd(full decrease)满递减堆栈
- ed(empty decrease)空递减堆栈
- fa 满递增堆栈
- ea 空递增堆栈
ldmia r0,{r2 - r3}
ldmia r0 !,{r2 - r3}
!作用是r0的值在ldm过程中发生的增加或者减少最后写回r0的值
ldmfd sp!,{r0 - r6,pc}
ldmfd sp!,{r0 - r6,pc}^
^的作用:在目标寄存器中有PC时,会同时将spsr写入到cpsr,一般用于从异常模式返回
操作栈时使用相同的后缀就不会出错
批量读取或写入内存时要用ldm/stm指令
常用stmfd和stmia
ARM中有一个ldr指令,还有一个ldr伪指令
ldr指令:ldr r0,#0xff
ldr伪指令:ldr r0,=0xfff1
@涉及到合法/非法立即数,涉及到ARM文字池
一般都使用ldr伪指令而不用ldr指令
adr和ldr的差别:ldr加载的地址在连接时确定,而adr加载的地址在运行是确定;所以我们可以通过adr和lar加载的地址比较来判断当前程序是否在链接时指定的地址运行(重定位)
注:参考朱老师物联网大讲堂
标签:iso 进制 可见 编程模式 启动方式 S5PV210启动 Superviso 参考 使用方法
原文地址:https://www.cnblogs.com/zhangj95/p/10445089.html