嵌入式 arm平台kernel启动第一阶段汇编head.s分析
1.依据arch/arm/kernel/vmlinux.lds生成linux内核源码根目录下的vmlinux,这个vmlinux属于未压缩,带调试信息、符号表的最初的内核,大小约23MB;
命令:arm-linux-gnu-ld-ovmlinux-Tarch/arm/kernel/vmlinux.lds
arch/arm/kernel/head.o
init/built-in.o
--start-group
arch/arm/mach-s3c2410/built-in.o
kernel/built-in.o
mm/built-in.o
fs/built-in.o
ipc/built-in.o
drivers/built-in.o
net/built-in.o
--end-group.tmp_kallsyms2.o
2.将上面的vmlinux去除调试信息、注释、符号表等内容,生成arch/arm/boot/Image,这是不带多余信息的linux内核,Image的大小约3.2MB;
命令:arm-linux-gnu-objcopy-Obinary-Svmlinuxarch/arm/boot/Image
3.将arch/arm/boot/Image用gzip-9压缩生成arch/arm/boot/compressed/piggy.gz大小约1.5MB;命令:gzip-f-9arch/arm/boot/compressed/piggy.gz
4.编译arch/arm/boot/compressed/piggy.S生成arch/arm/boot/compressed/piggy.o大小约1.5MB,这里实际上是将piggy.gz通过piggy.S编译进piggy.o文件中。而piggy.S文件仅有6行,只是包含了文件piggy.gz;
命令:arm-linux-gnu-gcc-oarch/arm/boot/compressed/piggy.oarch/arm/boot/compressed/piggy.S
5.依据arch/arm/boot/compressed/vmlinux.lds将arch/arm/boot/compressed/目录下的文件head.o、piggy.o、misc.o链接生成arch/arm/boot/compressed/vmlinux,这个vmlinux是经过压缩且含有自解压代码的内核,大小约1.5MB;
命令:arm-linux-gnu-ldzreladdr=0x30008000params_phys=0x30000100-Tarch/arm/boot/compressed/vmlinux.ldsarch/arm/boot/compressed/head.oarch/arm/boot/compressed/piggy.oarch/arm/boot/compressed/misc.o-oarch/arm/boot/compressed/vmlinux
6.将arch/arm/boot/compressed/vmlinux去除调试信息、注释、符号表等内容,生成arch/arm/boot/zImage大小约1.5MB;这已经是一个可以使用的linux内核映像文件了;
命令:arm-linux-gnu-objcopy-Obinary-Sarch/arm/boot/compressed/vmlinuxarch/arm/boot/zImage
7.将arch/arm/boot/zImage添加64Bytes的相关信息打包为arch/arm/boot/uImage大小约1.5MB;
命令:./mkimage-Aarm-Olinux-Tkernel-Cnone-a0x30008000-e0x30008000-nLinux-2.6.35.7-darch/arm/boot/zImagearch/arm/boot/uImage
内核启动分析:
本文着重分析S3C2410linux-2.6.35.7内核启动的详细过程,主要包括:zImage解压缩阶段、vmlinux启动汇编阶段、startkernel到创建第一个进程阶段三个部分,一般将其称为linux内核启动一、二、三阶段,本文也将采用这种表达方式。对于zImage之前的启动过程,本文不做表述,可参考前面正亮讲得“u-boot的启动过程分析”。
本文中涉及到的术语约定如下:
基本内核映像:即内核编译过程中最终在内核源代码根目录下生成的vmlinux映像文件,并不包含任何内核解压缩和重定位代码;
zImage内核映像:包含了内核piggy.o及解压缩和重定位代码,通常是目标板bootloader加载的对象;
zImage下载地址:即bootloader将zImage下载到目标板内存的某个地址或者nandread将zImage读到内存的某个地址;
zImage加载地址:由Linux的bootloader完成的将zImage搬移到目标板内存的某个位置所对应的地址值,默认值0x30008000。
1、Linux内核启动第一阶段:内核解压缩和重定位
该阶段是从u-boot引导进入内核执行的第一阶段,我们知道u-boot引导内核启动的最后一步是:通过一个函数指针thekernel()带三个参数跳转到内核(zImage)入口点开始执行,此时,u-boot的任务已经完成,控制权完全交给内核(zImage)。
稍作解释,在u-boot的文件archarmlibbootm.c(uboot-2010.9)中定义了thekernel,并在do_bootm_linux的最后执行thekernel.
定义如下:void(*theKernel)(intzero,intarch,uintparams);
theKernel=(void(*)(int,int,uint))ntohl(hdr->ih_ep);
//hdr->ih_ep----EntryPointAddressuImage中指定的内核入口点,这里是0x30008000。
theKernel(0,bd->bi_arch_number,bd->bi_boot_params);
其中第二个参数为机器ID,第三参数为u-boot传递给内核参数存放在内存中的首地址,此处是0x30000100。
由上述zImage的生成过程我们可以知道,第一阶段运行的内核映像实际就是arch/arm/boot/compressed/vmlinux,而这一阶段所涉及的文件也只有三个:
(1)arch/arm/boot/compressed/vmlinux.lds
(2)arch/arm/boot/compressed/head.S
(3)arch/arm/boot/compressed/misc.c
下面的图是使用64MRAM时,通常的内存分布图:
下面我们的分析集中在arch/arm/boot/compressed/head.S,适当参考vmlinux.lds。
从linux/arch/arm/boot/compressed/vmlinux.lds文件可以看出head.S的入口地址为ENTRY(_start),也就是head.S汇编文件的_start标号开始的第一条指令。
下面从head.S中得_start标号开始分析。(有些指令不影响初始化,暂时略去不分析)
代码位置在/arch/arm/boot/compressed/head.S中:
start:
.typestart,#function/*uboot跳转到内核后执行的第一条代码*/
.rept8/*重复定义8次下面的指令,也就是空出中断向量表的位置*/
movr0,r0/*就是nop指令*/
.endr
b1f@跳转到后面的标号1处
.word0x016f2818@辅助引导程序的幻数,用来判断镜像是否是zImage
.wordstart@加载运行zImage的绝对地址,start表示赋的初值
.word_edata@zImage结尾地址,_edata是在vmlinux.lds.S中定义的,表示init,text,data三个段的结束位置
1:movr7,r1@savearchitectureID保存体系结构ID用r1保存
movr8,r2@saveatagspointer保存r2寄存器参数列表,r0始终为0
mrsr2,cpsr@getcurrentmode得到当前模式
tstr2,#3@notuser?,tst实际上是相与,判断是否处于用户模式
bnenot_angel@如果不是处于用户模式,就跳转到not_angel标号处
/*如果是普通用户模式,则通过软中断进入超级用户权限模式*/
movr0,#0x17@angel_SWIreason_EnterSVC,向SWI中传递参数
swi0x123456@angel_SWI_ARM这个是让用户空间进入SVC空间
not_angel:/*表示非用户模式,可以直接关闭中断*/
mrsr2,cpsr@turnoffinterruptsto读出cpsr寄存器的值放到r2中
orrr2,r2,#0xc0@preventangelfromrunning关闭中断
msrcpsr_c,r2@把r2的值从新写回到cpsr中
/*读入地址表。因为我们的代码可以在任何地址执行,也就是位置无关代码(PIC),所以我们需要加上一个偏移量。下面有每一个列表项的具体意义。
LC0是表的首项,它本身就是在此head.s中定义的
.typeLC0,#object
LC0:.wordLC0@r1LC0表的起始位置
.word__bss_start@r2bss段的起始地址在vmlinux.lds.S中定义
.word_end@r3zImage(bss)连接的结束地址在vmlinux.lds.S中定义
.wordzreladdr@r4zImage的连接地址,我们在arch/arm/mach-s3c2410/makefile.boot中定义的
.word_start@r5zImage的基地址,bootp/init.S中的_start函数,主要起传递参数作用
.word_got_start@r6GOT(全局偏移表)起始地址,_got_start是在compressed/vmlinux.lds.in中定义的
.word_got_end@ipGOT结束地址
.worduser_stack+4096@sp用户栈底user_stack是紧跟在bss段的后面的,在compressed/vmlinux.lds.in中定义的
@在本head.S的末尾定义了zImag的临时栈空间,在这里分配了4K的空间用来做堆栈。
.section".stack","w"
user_stack:.space4096
GOT表的初值是连接器指定的,当时程序并不知道代码在哪个地址执行。如果当前运行的地址已经和表上的地址不一样,还要修正GOT表。*/
.text
adrr0,LC0/*把地址表的起始地址放入r0中*/
ldmiar0,{r1,r2,r3,r4,r5,r6,ip,sp}/*加载地址表中的所有地址到相应的寄存器*/
@r0是运行时地址,而r1则是链接时地址,而它们两都是表示LC0表的起始位置,这样他们两的差则是运行和链接的偏移量,纠正了这个偏移量才可以运行与”地址相关的代码“
subsr0,r0,r1@calculatethedeltaoffset计算偏移量,并放入r0中
beqnot_relocated@ifdeltaiszero,wearerunningattheaddresswewerelinkedat.
@如果为0,则不用重定位了,直接跳转到标号not_relocated处执行
/*
*偏移量不为零,说明运行在不同的地址,那么需要修正几个指针
*r5–zImage基地址
*r6–GOT(全局偏移表)起始地址
*ip–GOT结束地址
*/
addr5,r5,r0/*加上偏移量修正zImage基地址*/
addr6,r6,r0/*加上偏移量修正GOT(全局偏移表)起始地址*/
addip,ip,r0/*加上偏移量修正GOT(全局偏移表)结束地址*/
/*
*这时需要修正BSS区域的指针,我们平台适用。
*r2–BSS起始地址
*r3–BSS结束地址
*sp–堆栈指针
*/
addr2,r2,r0/*加上偏移量修正BSS起始地址*/
addr3,r3,r0/*加上偏移量修正BSS结束地址*/
addsp,sp,r0/*加上偏移量修正堆栈指针*/
/*
*重新定位GOT表中所有的项.
*/
1:ldrr1,[r6,#0]@relocateentriesintheGOT
addr1,r1,r0@table.Thisfixesupthe
strr1,[r6],#4@Creferences.
cmpr6,ip
blo1b
not_relocated:movr0,#0
1:strr0,[r2],#4@clearbss清除bss段
strr0,[r2],#4
strr0,[r2],#4
strr0,[r2],#4
cmpr2,r3
blo1b
blcache_on/*开启指令和数据Cache,为了加快解压速度*/
@这里的r1,r2之间的空间为解压缩内核程序所使用,也是传递给decompress_kernel的第二和第三的参数
movr1,sp@mallocspaceabovestack
addr2,sp,#0x10000@64kmax解压缩的缓冲区
@下面程序的意义就是保证解压地址和当前程序的地址不重叠。上面分配了64KB的空间来做解压时的数据缓存。
/*
*检查是否会覆盖内核映像本身
*r4=最终解压后的内核首地址
*r5=zImage的运行时首地址,一般为0x30008000
*r2=endofmallocspace分配空间的结束地址(并且处于本映像的前面)
*基本要求:r4>=r2或者r4+映像长度<=r5
(1)vmlinux的起始地址大于zImage运行时所需的最大地址(r2),那么直接将zImage解压到vmlinux的目标地址
cmpr4,r2
bhswont_overwrite/*如果r4大于或等于r2的话*/
(2)zImage的起始地址大于vmlinux的目标起始地址加上vmlinux大小(4M)的地址,所以将zImage直接解压到vmlinux的目标地址
addr0,r4,#4096*1024@4MBlargestkernelsize
cmpr0,r5
blswont_overwrite/*如果r4+映像长度<=r5的话*/
@前两种方案通常都不成立,不会跳转到wont_overwrite标号处,会继续走如下分支,其解压后的内存分配示意图如下:
movr5,r2@decompressaftermallocspace
movr0,r5/*解压程序从分配空间后面存放*/
movr3,r7
bldecompress_kernel
/进入decompress_kernel*/
@decompress_kernel共有4个参数,解压的内核地址、缓存区首地址、缓存区尾地址、和芯片ID,返回解压缩代码的长度。
decompress_kernel(ulgoutput_start,ulgfree_mem_ptr_p,ulgfree_mem_ptr_end_p,
intarch_id)
{
output_data=(uch*)output_start;/*Pointstokernelstart*/
free_mem_ptr=free_mem_ptr_p;/*保存缓存区首地址*/
free_mem_ptr_end=free_mem_ptr_end_p;/*保存缓冲区结束地址*/
__machine_arch_type=arch_id;
arch_decomp_setup();
makecrc();/*镜像校验*/
putstr("UncompressingLinux...");
gunzip();/*通过free_mem_ptr来解压缩*/
putstr("done,bootingthekernel.n");
returnoutput_ptr;/*返回镜像的大小*/
}
/从decompress_kernel函数返回*/
addr0,r0,#127+128
bicr0,r0,#127@alignthekernellength对齐内核长度
/*
*r0=解压后内核长度
*r1-r3=未使用
*r4=真正内核执行地址0x30008000
*r5=临时解压内核Image的起始地址
*r6=处理器ID
*r7=体系结构ID
*r8=参数列表0x30000100
*r9-r14=未使用
*/
@完成了解压缩之后,由于内核没有解压到正确的地址,最后必须通过代码搬移来搬到指定的地址0x30008000。搬运过程中有
@可能会覆盖掉现在运行的重定位代码,所以必须将这段代码搬运到安全的地方,
@这里搬运到的地址是解压缩了的代码的后面r5+r0的位置。
addr1,r5,r0@endofdecompressedkernel解压内核的结束地址
adrr2,reloc_start
ldrr3,LC1@LC1:.wordreloc_end-reloc_start表示reloc_start段代码的大小
addr3,r2,r3
1:ldmiar2!,{r9-r14}@copyrelocationcode
stmiar1!,{r9-r14}
ldmiar2!,{r9-r14}
stmiar1!,{r9-r14}
cmpr2,r3
blo1b
blcache_clean_flush@清cache
ARM(addpc,r5,r0)@callrelocationcode跳转到重定位代码开始执行
@在此处会调用重定位代码reloc_start来将Image的代码从缓冲区r5帮运到最终的目的地r4:0x30008000处
reloc_start:addr9,r5,r0@r9中存放的是临时解压内核的末尾地址
subr9,r9,#128@不拷贝堆栈
movr1,r4@r1中存放的是目的地址0x30008000
1:
.rept4
ldmiar5!,{r0,r2,r3,r10-r14}@relocatekernel
stmiar1!,{r0,r2,r3,r10-r14}/*搬运内核Image的过程*/
.endr
cmpr5,r9
blo1b
movsp,r1/*留出堆栈的位置*/
addsp,sp,#128@relocatethestack
call_kernel:blcache_clean_flush@清除cache
blcache_off@关闭cache
movr0,#0@mustbezero
movr1,r7@restorearchitecturenumber
movr2,r8@restoreatagspointer
@这里就是最终我们从zImage跳转到Image的伟大一跳了,跳之前准备好r0,r1,r2
movpc,r4@callkernel
到此kernel的第一阶段zImage解压缩阶段已经执行完。
第二阶段的在另外一篇中分析。
评论