标签:
刘柳 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程+http://mooc.study.163.com/course/USTC-1000029000+titer2008@gmail.com
提纲挈领,看代码前总览
为了管理进程,内核必须对每个进程进行清晰的描述,进程描述符提供了内核所需了解的进程信息。
struct task_struct数据结构很庞大
Linux进程的状态与操作系统原理中的描述的进程状态似乎有所不同,比如就绪状态和运行状态都是TASK_RUNNING,为什么呢?
A66:取决于是否获得cpu的控制权
每个进程唯一的标示
核心关键词有:
runqueue
优先级
抢占
调度信息
struct task_struct {
...
int on_rq;
int prio, static_prio, normal_prio;
unsigned int rt_priority;
const struct sched_class *sched_class;
struct sched_entity se;
struct sched_rt_entity rt;
...
struct sched_dl_entity dl;
...
unsigned int policy;
int nr_cpus_allowed;
cpumask_t cpus_allowed;
#ifdef CONFIG_PREEMPT_RCU
int rcu_read_lock_nesting;
union rcu_special rcu_read_unlock_special;
struct list_head rcu_node_entry;
#endif /* #ifdef CONFIG_PREEMPT_RCU */
#ifdef CONFIG_TREE_PREEMPT_RCU
struct rcu_node *rcu_blocked_node;
#endif /* #ifdef CONFIG_TREE_PREEMPT_RCU */
#ifdef CONFIG_TASKS_RCU
unsigned long rcu_tasks_nvcsw;
bool rcu_tasks_holdout;
struct list_head rcu_tasks_holdout_list;
int rcu_tasks_idle_cpu;
#endif /* #ifdef CONFIG_TASKS_RCU */
#if defined(CONFIG_SCHEDSTATS) || defined(CONFIG_TASK_DELAY_ACCT)
struct sched_info sched_info;
#endif
...
}
独立操作
程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系
/*
* pointers to (original) parent process, youngest child, younger sibling,
* older sibling, respectively. (p->father can be replaced with
* p->real_parent->pid)
*/
struct task_struct __rcu *real_parent; /* real parent process */
struct task_struct __rcu *parent; /* recipient of SIGCHLD, wait4() reports */
/*
* children/sibling forms the list of my natural children
*/
struct list_head children; /* list of my children */
struct list_head sibling; /* linkage in my parent‘s children list */
struct task_struct *group_leader; /* threadgroup leader */
非本章重点,待后面章节展开,
linux进程的地址空间,是个有趣的话题
与我们menuos相关的,注意其中sp/ip指针。
struct thread_struct {
/* Cached TLS descriptors: */
struct desc_struct tls_array[GDT_ENTRY_TLS_ENTRIES];
unsigned long sp0;
unsigned long sp;
#ifdef CONFIG_X86_32
unsigned long sysenter_cs;
#else
unsigned long usersp; /* Copy from PDA */
unsigned short es;
unsigned short ds;
unsigned short fsindex;
unsigned short gsindex;
#endif
#ifdef CONFIG_X86_32
unsigned long ip;
#endif
...
}
至此,400行左右的task_struct大致介绍到此
? Linux为每个进程分配一个8KB大小的内存区域,用于存放该进程两个不同的数据结构:Thread_info和进程的内核堆栈
? 进程处于内核态时使用,不同于用户态堆栈,即PCB中指定了内核栈,那为什么PCB中没有用户态堆栈?用户态堆栈是怎么设定的?
? 内核控制路径所用的堆栈很少,因此对栈和Thread_info来说,8KB足够了
? struct thread_struct thread;?//CPU-specific state of this task
? 文件系统和文件描述符
不深入mmu
start_kernel —>
kernel_init —>
kthreadd
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char * argv[])
{
int pid;
/* fork another process */
pid = fork();//核心调用
if (pid < 0)
{
/* error occurred */
fprintf(stderr,"Fork Failed!");
exit(-1);
}
else if (pid == 0)
{
/* child process */
printf("This is Child Process!\n");
}
else
{
/* parent process */
printf("This is Parent Process!\n");
/* parent will wait for the child to complete*/
wait(NULL);
printf("Child Complete!\n");
}
}
不仅仅是调用一个fork
int 0x80和iret的一个配合
试问fork进程的来源?我们来看下文
fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建;
Linux通过复制父进程来创建一个新进程,那么这就给我们理解这一个过程提供一个想象的框架:
err = arch_dup_task_struct(tsk, orig);
ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig); //这里只是复制thread_info,而非复制内核堆栈
要修改复制过来的进程数据,比如pid、进程链表等等都要改改吧,见copy_process内部。
从用户态的代码看fork();函数返回了两次,即在父子进程中各返回一次,父进程从系统调用中返回比较容易理解,子进程从系统调用中返回,那它在系统调用处理过程中的哪里开始执行的呢?这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题,这是在哪里设定的?copy_thread in copy_process
*childregs = *current_pt_regs(); //复制内核堆栈
childregs->ax = 0; //为什么子进程的fork返回0,这里就是原因!
p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶
p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址
fork.c
do_fork –>copy_process–>dup_task_struct
{
alloc_task_sturct //slab管理 task_stuct...
alloc_thread_info //keme_pages
stack
}
do_fork –>copy_process–>dup_task_struct
—>子进程初始化(很多)–>copy_thread
copy_thread{
sp指针
内核堆栈数据拷贝(重点展开)
}
附图
childregs->ax=0;
这里看到返回值(pid)赋值的位置
本质原因是ret_from_fork
先展开pt_regs内容,这也是int指令和save_all压到堆栈的内容
struct pt_regs {
long ebx;
long ecx;
long edx;
long esi;
long edi;
long ebp;
long eax;
int xds;
int xes;
int xfs;
int xgs;
long orig_eax;
long eip;
int xcs;
long eflags;
long esp;
int xss;
};
以系统调用位列,ax为调用号。
展开ret_from_fork
ENTRY(ret_from_fork)
movi a4, schedule_tail
callx4 a4
movi a4, do_syscall_trace_leave
mov a6, a1
callx4 a4
j common_exception_return
ENDPROC(ret_from_fork)
...
展开syscall_exit
syscall_exit:
LOCKDEP_SYS_EXIT
DISABLE_INTERRUPTS(CLBR_ANY) # make sure we don‘t miss an interrupt
# setting need_resched or sigpending
# between sampling and the iret
TRACE_IRQS_OFF
movl TI_flags(%ebp), %ecx
testl $_TIF_ALLWORK_MASK, %ecx # current->work
jne syscall_exit_work
restore_all:
TRACE_IRQS_IRET
以后的流程其实就是上节课的内容啦
个人认为,会。
原因从下面这个图(ULK)就可以说明。
now, enjoy the work see the “fork”
the information to debug
the result of debugging
- copy_process
alloc_thread_info
arc_dup_task_struct
setup_thread_stack
- copy_thread
childregs //ptype
current_pt_regs()//前后堆栈变化
ip
- ret_from_fork
//step by step
不跟踪schedule,continue
- syscall_exit (直到这个位置)
添加动手截图
gdb调试器,堆栈可以实时修改吗?
感谢:
图片路径问题
http://www.v2ex.com/t/57063
图片路径:C:/Users/Vanny/Downloads/MarkdownEditor/ 本地hard
注释中的 条件编译 被 错误解释了
注释的三个引号如何输入啦
客户端不支持 语法嵌套?比如注释里面加粗
还有回退功能有限,仅一步
还有左右的呼唤,编辑器的find..
如何让#不显示转义
二级目录
绿色版等等需要改进
标签:
原文地址:http://blog.csdn.net/titer1/article/details/44903815