嵌入式 arm平台kernel启动第一阶段汇编head.s分析

作者：时间：2016-11-09 来源：网络

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

arm_linux内核生成过程：

1.依据arch/arm/kernel/vmlinux.lds生成linux内核源码根目录下的vmlinux，这个vmlinux属于未压缩，带调试信息、符号表的最初的内核，大小约23MB；
命令：arm-linux-gnu-ld-ovmlinux-Tarch/arm/kernel/vmlinux.lds
arch/arm/kernel/head.o
init/built-in.o
--start-group
arch/arm/mach-s3c2410/built-in.o
kernel/built-in.o
mm/built-in.o
fs/built-in.o
ipc/built-in.o
drivers/built-in.o
net/built-in.o
--end-group.tmp_kallsyms2.o

本文引用地址：https://www.eepw.com.cn/article/201611/317681.htm

2.将上面的vmlinux去除调试信息、注释、符号表等内容，生成arch/arm/boot/Image，这是不带多余信息的linux内核，Image的大小约3.2MB；
命令:arm-linux-gnu-objcopy-Obinary-Svmlinuxarch/arm/boot/Image

3.将arch/arm/boot/Image用gzip-9压缩生成arch/arm/boot/compressed/piggy.gz大小约1.5MB；命令:gzip-f-9arch/arm/boot/compressed/piggy.gz

4.编译arch/arm/boot/compressed/piggy.S生成arch/arm/boot/compressed/piggy.o大小约1.5MB，这里实际上是将piggy.gz通过piggy.S编译进piggy.o文件中。而piggy.S文件仅有6行，只是包含了文件piggy.gz;
命令:arm-linux-gnu-gcc-oarch/arm/boot/compressed/piggy.oarch/arm/boot/compressed/piggy.S

5.依据arch/arm/boot/compressed/vmlinux.lds将arch/arm/boot/compressed/目录下的文件head.o、piggy.o、misc.o链接生成arch/arm/boot/compressed/vmlinux，这个vmlinux是经过压缩且含有自解压代码的内核,大小约1.5MB;
命令:arm-linux-gnu-ldzreladdr=0x30008000params_phys=0x30000100-Tarch/arm/boot/compressed/vmlinux.ldsarch/arm/boot/compressed/head.oarch/arm/boot/compressed/piggy.oarch/arm/boot/compressed/misc.o-oarch/arm/boot/compressed/vmlinux

6.将arch/arm/boot/compressed/vmlinux去除调试信息、注释、符号表等内容，生成arch/arm/boot/zImage大小约1.5MB;这已经是一个可以使用的linux内核映像文件了；
命令:arm-linux-gnu-objcopy-Obinary-Sarch/arm/boot/compressed/vmlinuxarch/arm/boot/zImage

7.将arch/arm/boot/zImage添加64Bytes的相关信息打包为arch/arm/boot/uImage大小约1.5MB;
命令:./mkimage-Aarm-Olinux-Tkernel-Cnone-a0x30008000-e0x30008000-nLinux-2.6.35.7-darch/arm/boot/zImagearch/arm/boot/uImage

内核启动分析：

本文着重分析S3C2410linux-2.6.35.7内核启动的详细过程，主要包括：zImage解压缩阶段、vmlinux启动汇编阶段、startkernel到创建第一个进程阶段三个部分，一般将其称为linux内核启动一、二、三阶段，本文也将采用这种表达方式。对于zImage之前的启动过程，本文不做表述，可参考前面正亮讲得“u-boot的启动过程分析”。

本文中涉及到的术语约定如下：

基本内核映像：即内核编译过程中最终在内核源代码根目录下生成的vmlinux映像文件，并不包含任何内核解压缩和重定位代码；

zImage内核映像：包含了内核piggy.o及解压缩和重定位代码，通常是目标板bootloader加载的对象；

zImage下载地址：即bootloader将zImage下载到目标板内存的某个地址或者nandread将zImage读到内存的某个地址；

zImage加载地址：由Linux的bootloader完成的将zImage搬移到目标板内存的某个位置所对应的地址值，默认值0x30008000。

1、Linux内核启动第一阶段：内核解压缩和重定位

该阶段是从u-boot引导进入内核执行的第一阶段，我们知道u-boot引导内核启动的最后一步是：通过一个函数指针thekernel()带三个参数跳转到内核（zImage）入口点开始执行，此时，u-boot的任务已经完成，控制权完全交给内核（zImage）。

稍作解释，在u-boot的文件archarmlibbootm.c(uboot-2010.9)中定义了thekernel,并在do_bootm_linux的最后执行thekernel.

定义如下：void(*theKernel)(intzero,intarch,uintparams);

theKernel=(void(*)(int,int,uint))ntohl(hdr->ih_ep);

//hdr->ih_ep----EntryPointAddressuImage中指定的内核入口点，这里是0x30008000。

theKernel(0,bd->bi_arch_number,bd->bi_boot_params);

其中第二个参数为机器ID,第三参数为u-boot传递给内核参数存放在内存中的首地址，此处是0x30000100。

由上述zImage的生成过程我们可以知道，第一阶段运行的内核映像实际就是arch/arm/boot/compressed/vmlinux，而这一阶段所涉及的文件也只有三个：

(1)arch/arm/boot/compressed/vmlinux.lds

(2)arch/arm/boot/compressed/head.S

(3)arch/arm/boot/compressed/misc.c

下面的图是使用64MRAM时，通常的内存分布图：

下面我们的分析集中在arch/arm/boot/compressed/head.S,适当参考vmlinux.lds。

从linux/arch/arm/boot/compressed/vmlinux.lds文件可以看出head.S的入口地址为ENTRY(_start)，也就是head.S汇编文件的_start标号开始的第一条指令。

下面从head.S中得_start标号开始分析。(有些指令不影响初始化，暂时略去不分析)

代码位置在/arch/arm/boot/compressed/head.S中：

start:

.typestart,#function/*uboot跳转到内核后执行的第一条代码*/

.rept8/*重复定义8次下面的指令，也就是空出中断向量表的位置*/

movr0,r0/*就是nop指令*/

.endr

b1f@跳转到后面的标号1处

.word0x016f2818@辅助引导程序的幻数，用来判断镜像是否是zImage

.wordstart@加载运行zImage的绝对地址，start表示赋的初值

.word_edata@zImage结尾地址，_edata是在vmlinux.lds.S中定义的，表示init,text,data三个段的结束位置

1:movr7,r1@savearchitectureID保存体系结构ID用r1保存

movr8,r2@saveatagspointer保存r2寄存器参数列表，r0始终为0

mrsr2,cpsr@getcurrentmode得到当前模式

tstr2,#3@notuser?，tst实际上是相与,判断是否处于用户模式

bnenot_angel@如果不是处于用户模式，就跳转到not_angel标号处

/*如果是普通用户模式，则通过软中断进入超级用户权限模式*/

movr0,#0x17@angel_SWIreason_EnterSVC，向SWI中传递参数

swi0x123456@angel_SWI_ARM这个是让用户空间进入SVC空间

not_angel:/*表示非用户模式，可以直接关闭中断*/

mrsr2,cpsr@turnoffinterruptsto读出cpsr寄存器的值放到r2中

orrr2,r2,#0xc0@preventangelfromrunning关闭中断

msrcpsr_c,r2@把r2的值从新写回到cpsr中

/*读入地址表。因为我们的代码可以在任何地址执行，也就是位置无关代码（PIC），所以我们需要加上一个偏移量。下面有每一个列表项的具体意义。

LC0是表的首项，它本身就是在此head.s中定义的

.typeLC0,#object

LC0:.wordLC0@r1LC0表的起始位置

.word__bss_start@r2bss段的起始地址在vmlinux.lds.S中定义

.word_end@r3zImage（bss）连接的结束地址在vmlinux.lds.S中定义

.wordzreladdr@r4zImage的连接地址，我们在arch/arm/mach-s3c2410/makefile.boot中定义的

.word_start@r5zImage的基地址，bootp/init.S中的_start函数，主要起传递参数作用

.word_got_start@r6GOT（全局偏移表）起始地址，_got_start是在compressed/vmlinux.lds.in中定义的

.word_got_end@ipGOT结束地址

.worduser_stack+4096@sp用户栈底user_stack是紧跟在bss段的后面的，在compressed/vmlinux.lds.in中定义的

@在本head.S的末尾定义了zImag的临时栈空间，在这里分配了4K的空间用来做堆栈。

.section".stack","w"

user_stack:.space4096

GOT表的初值是连接器指定的，当时程序并不知道代码在哪个地址执行。如果当前运行的地址已经和表上的地址不一样，还要修正GOT表。*/

.text

adrr0,LC0/*把地址表的起始地址放入r0中*/

ldmiar0,{r1,r2,r3,r4,r5,r6,ip,sp}/*加载地址表中的所有地址到相应的寄存器*/

@r0是运行时地址，而r1则是链接时地址，而它们两都是表示LC0表的起始位置，这样他们两的差则是运行和链接的偏移量，纠正了这个偏移量才可以运行与”地址相关的代码“

subsr0,r0,r1@calculatethedeltaoffset计算偏移量，并放入r0中

beqnot_relocated@ifdeltaiszero,wearerunningattheaddresswewerelinkedat.

@如果为0，则不用重定位了，直接跳转到标号not_relocated处执行

*偏移量不为零，说明运行在不同的地址，那么需要修正几个指针

*r5–zImage基地址

*r6–GOT（全局偏移表）起始地址

*ip–GOT结束地址

addr5,r5,r0/*加上偏移量修正zImage基地址*/

addr6,r6,r0/*加上偏移量修正GOT（全局偏移表）起始地址*/

addip,ip,r0/*加上偏移量修正GOT（全局偏移表）结束地址*/

*这时需要修正BSS区域的指针，我们平台适用。

*r2–BSS起始地址

*r3–BSS结束地址

*sp–堆栈指针

addr2,r2,r0/*加上偏移量修正BSS起始地址*/

addr3,r3,r0/*加上偏移量修正BSS结束地址*/

addsp,sp,r0/*加上偏移量修正堆栈指针*/

*重新定位GOT表中所有的项.

1:ldrr1,[r6,#0]@relocateentriesintheGOT

addr1,r1,r0@table.Thisfixesupthe

strr1,[r6],#4@Creferences.

cmpr6,ip

blo1b

not_relocated:movr0,#0

1:strr0,[r2],#4@clearbss清除bss段

strr0,[r2],#4

cmpr2,r3

blo1b

blcache_on/*开启指令和数据Cache，为了加快解压速度*/

@这里的r1,r2之间的空间为解压缩内核程序所使用，也是传递给decompress_kernel的第二和第三的参数

movr1,sp@mallocspaceabovestack

addr2,sp,#0x10000@64kmax解压缩的缓冲区

@下面程序的意义就是保证解压地址和当前程序的地址不重叠。上面分配了64KB的空间来做解压时的数据缓存。

*检查是否会覆盖内核映像本身

*r4=最终解压后的内核首地址

*r5=zImage的运行时首地址，一般为0x30008000

*r2=endofmallocspace分配空间的结束地址（并且处于本映像的前面）

*基本要求：r4>=r2或者r4+映像长度<=r5

(1)vmlinux的起始地址大于zImage运行时所需的最大地址（r2）,那么直接将zImage解压到vmlinux的目标地址

cmpr4,r2

bhswont_overwrite/*如果r4大于或等于r2的话*/

(2)zImage的起始地址大于vmlinux的目标起始地址加上vmlinux大小（4M）的地址，所以将zImage直接解压到vmlinux的目标地址

addr0,r4,#4096*1024@4MBlargestkernelsize

cmpr0,r5

blswont_overwrite/*如果r4+映像长度<=r5的话*/

@前两种方案通常都不成立，不会跳转到wont_overwrite标号处，会继续走如下分支，其解压后的内存分配示意图如下：

movr5,r2@decompressaftermallocspace

movr0,r5/*解压程序从分配空间后面存放*/

movr3,r7

bldecompress_kernel

/进入decompress_kernel*/

@decompress_kernel共有4个参数，解压的内核地址、缓存区首地址、缓存区尾地址、和芯片ID，返回解压缩代码的长度。

decompress_kernel(ulgoutput_start,ulgfree_mem_ptr_p,ulgfree_mem_ptr_end_p,

intarch_id)

{

output_data=(uch*)output_start;/*Pointstokernelstart*/

free_mem_ptr=free_mem_ptr_p;/*保存缓存区首地址*/

free_mem_ptr_end=free_mem_ptr_end_p;/*保存缓冲区结束地址*/

__machine_arch_type=arch_id;

arch_decomp_setup();

makecrc();/*镜像校验*/

putstr("UncompressingLinux...");

gunzip();/*通过free_mem_ptr来解压缩*/

putstr("done,bootingthekernel.n");

returnoutput_ptr;/*返回镜像的大小*/

}

/从decompress_kernel函数返回*/

addr0,r0,#127+128

bicr0,r0,#127@alignthekernellength对齐内核长度

*r0=解压后内核长度

*r1-r3=未使用

*r4=真正内核执行地址0x30008000

*r5=临时解压内核Image的起始地址

*r6=处理器ID

*r7=体系结构ID

*r8=参数列表0x30000100

*r9-r14=未使用

@完成了解压缩之后，由于内核没有解压到正确的地址，最后必须通过代码搬移来搬到指定的地址0x30008000。搬运过程中有

@可能会覆盖掉现在运行的重定位代码，所以必须将这段代码搬运到安全的地方，

@这里搬运到的地址是解压缩了的代码的后面r5+r0的位置。

addr1,r5,r0@endofdecompressedkernel解压内核的结束地址

adrr2,reloc_start

ldrr3,LC1@LC1:.wordreloc_end-reloc_start表示reloc_start段代码的大小

addr3,r2,r3

1:ldmiar2!,{r9-r14}@copyrelocationcode

stmiar1!,{r9-r14}

ldmiar2!,{r9-r14}

stmiar1!,{r9-r14}

cmpr2,r3

blo1b

blcache_clean_flush@清cache

ARM(addpc,r5,r0)@callrelocationcode跳转到重定位代码开始执行

@在此处会调用重定位代码reloc_start来将Image的代码从缓冲区r5帮运到最终的目的地r4:0x30008000处

reloc_start:addr9,r5,r0@r9中存放的是临时解压内核的末尾地址

subr9,r9,#128@不拷贝堆栈

movr1,r4@r1中存放的是目的地址0x30008000

.rept4

ldmiar5!,{r0,r2,r3,r10-r14}@relocatekernel

stmiar1!,{r0,r2,r3,r10-r14}/*搬运内核Image的过程*/

.endr

cmpr5,r9

blo1b

movsp,r1/*留出堆栈的位置*/

addsp,sp,#128@relocatethestack

call_kernel:blcache_clean_flush@清除cache

blcache_off@关闭cache

movr0,#0@mustbezero

movr1,r7@restorearchitecturenumber

movr2,r8@restoreatagspointer

@这里就是最终我们从zImage跳转到Image的伟大一跳了，跳之前准备好r0,r1,r2

movpc,r4@callkernel

到此kernel的第一阶段zImage解压缩阶段已经执行完。

第二阶段的在另外一篇中分析。

新闻中心

嵌入式 arm平台kernel启动第一阶段汇编head.s分析

评论

相关推荐

技术专区