巨野城乡住房建设局网站,表格制作方法,软件开发工程师是什么职业,wordpress 注册 邮件文章目录 前言一、什么是写时拷贝二、进程控制 1.进程终止2.进程等待三丶进程程序替换总结前言
了解上一篇文章中的进程地址空间后#xff0c;我们再来说说进程控制的概念#xff0c;进程控制我们需要搞清楚三个问题#xff1a;如何进程终止#xff0c;如何解决僵尸进程问… 文章目录 前言一、什么是写时拷贝二、进程控制 1.进程终止2.进程等待三丶进程程序替换总结前言
了解上一篇文章中的进程地址空间后我们再来说说进程控制的概念进程控制我们需要搞清楚三个问题如何进程终止如何解决僵尸进程问题以及写时拷贝的问题。 一、什么是写时拷贝
如果我们要在linux中创建进程就需要利用fork函数fork函数有两个返回值父进程返回子进程pid给子进程返回0如果fork失败了就返回-1当我们函数开始return的时候函数的主体部分已经做完了也就是说fork创建子进程在fork返回的时候子进程已经创建好了甚至已经被操作系统调度了代码本身是要被父子进程共享的return也是语句所以也会被共享这就会出现为什么会出现两个返回值当我们用if else分流可以发现两个判断条件同时进行那么为什么会有一个大于0的ID值和一个等于0的ID值呢因为当创建子进程时操作系统会给子进程创建相应的进程地址空间创建对应的地址空间的时候我们对应的数据等经过虚拟地址通过页表映射到物理内存的本质就是写入这个时候谁先返回谁就发生写时拷贝问题这样就出现了返回两个不同的ID值。
通常父子代码共享父子进程在不写入时数据也是共享的当任意一方试图写入便以写时拷贝的方式各自一份拷贝如下图 fork的常规用法
1.一个父进程希望复制自己使父子进程同时执行不同的代码段例如父进程等待客户端请求生成子进程来处理请求。
2.一个父进程要执行一个不同的程序例如子进程从fork返回后 调用exec函数。
fork调用失败的原因
1.系统中有太多的进程
2.实际用户的进程超出了限制
注意创建进程是会消耗资源的。
我们上一篇已经充分了解了写时拷贝下面我们进行进程控制的学习
二丶进程控制
1.进程终止
进程退出一共有三个场景
1.代码运行完毕结果正确
2.代码运行完毕结果不正确
表示代码运行正确与否可以通过main函数的返回值来判断返回值也叫进程的退出码。如下图 我们写了一个累加函数当函数返回值等于5050就返回0也就是代码运行完毕结果正确的情况。当返回值不是5050就是代码运行完毕结果不正确的情况然后我们通过$?来获取进程的返回值用echo去打印这个返回值。 我们用echo打印返回值$?只会保留最近一次进程的退出码也就是说我们看第一个打印的结果即可为什么结果不正确呢因为我们在循环中写错了我们应该写成itop才对。如下图 这个时候我们发现结果对了确实给我们返回了正确的结果接下来我们看看系统中有哪些退出码 在这里需要包含头文件#include string.h然后我们利用strerror函数打印退出码 由于太多我们只取一部分即可比如0就是运行成功2就是没有这个文件或目录下面我们验证一下 当我们试图查看一个不存在的文件或目录时报错与退出码2一致这就说明了程序的运行结果确实可以通过返回值来判断。
3.代码异常终止比如进程崩溃等等
进程退出就是操作系统少了一个进程操作系统要释放进程对应的内核数据结构代码和数据。那么进程退出有哪些方式呢
1.通过main函数return其他函数return仅仅代表该函数返回
2.exit函数退出如下图 exit(int code)code就代表进程退出码等价于main函数return。
当然_exit也可以退出如下图 _exit()需要包含头文件#include unistd.h,我们将程序运行起来 是否感觉exit与_exit没有区别呢其实不是这两个函数是有区别的我们看下图 我们用同一份代码打印hello的时候不要带\n。 在经过2秒后hello刷出来了我们在用_exit试试 当我们用_exit结束进程我们发现数据没有被缓冲区刷新出来所以这两个函数的区别在于_exit是直接结束进程不刷新缓冲区。我们也可以理解为exit就是多加了个冲刷缓冲区功能的_exit,如下图 2.进程等待 我们之前的文章说过当子进程退出父进程如果不管不顾就可能造成僵尸进程的问题进而造成内存泄漏。另外进程一旦变成僵尸状态那就无法杀掉进程因为谁也没有办法杀掉一个死去的进程。最后父进程派给子进程的任务完成的如何我们需要知道比如子进程运行完成结果对还是不对或者是否正常退出。父进程通过进程等待的方式回收子进程资源获取子进程退出信息。
我们通过man 2 wait命令查看wait的使用 我们可以看到wait的返回值是pid_t通过手册我们知道wait返回的是接收到的子进程的pid下面通过代码我们使用一下wait函数 我们先包含相应的头文件然后重新写一份代码 此代码的意思是让子进程活5s然后父进程睡眠10秒在这期间子进程是僵尸状态然后父进程苏醒接收子进程。然后我们运行起来 上面是我们写的一个shell脚本用来监视进程现在我们将程序运行起来 我们发现和我们想的一样刚开始父子进程都在运行当子进程结束后进入僵尸状态然后父进程沉睡了10秒后醒来将子进程回收然后两个进程一起退出。
如果父进程在wait的时候如果子进程没退出父进程在干什么其实很简单父进程还是在等子进程等子进程结束了父进程才会退出。在子进程没有退出的时候父进程只能一直在调用waitpid进行等待这种等待被称为阻塞等待
下面我们看看waitpid函数 第一个参数如果pid大于0就表示等待指定的进程如果pid等于-1等待任意一个子进程与wait等效而第二个参数status是一个输出型参数也就是信号比如下面这样 第三个参数一般不管输入0即可而这个status我们一般看做位图结构如下图 int有32个比特位但是只要后16位次低8位当做退出状态最后7位为终止信号。还有1位我们先不做讲解。
下面我们用waitpid演示一下 status右移8位按位与全1就能得到次低8位的值status按位与上0x7F就得到了最低7位的值这个时候我们再来运行 这个时候我们发现确实拿到了子进程的退出码38signal为0代表成功下面我们故意弄一个异常看看 虽然编译器提示但我们依旧运行最终收到的异常信号为8代表子进程出现异常这种情况退出码是多少就不重要了因为已经异常了。
下面我们验证一下waitpid的三种不同返回情况 我们通过返回值去判断父进程等待失败正在等待以及等待成功三种情况。
下面我们写个程序让父进程在等待子进程的时候可以干一些其他有用的事情
#include stdio.h
#include stdlib.h
#include string.h
#include unistd.h
#include sys/types.h
#include sys/wait.h
//const char* err_string[] {
// success,
// error
//}
//int add_to_top(int top)
//{
// int sum 0;
// for (int i 0;itop;i)
// {
// sumi;
// }
// return sum;
//
//}
#define Task_Num 10
//预设一批任务
void sync_disk()
{printf(这是一个刷新数据的任务!\n);
}
void sync_log()
{printf(这是一个同步日志的任务!\n);
}
void net_send()
{printf(这是一个进行网络发送的任务!\n);
}
//要保存的任务相关的
typedef void (*func_t)(); //将一个函数指针重定义为void,也就是定义了一个函数指针类型
func_t other_task[Task_Num] {NULL}; //函数指针数组
int LoadTask(func_t func)
{int i 0;for (;iTask_Num;i){if (other_task[i]NULL){break;}}if (iTask_Num){return -1;}else{other_task[i]func;}return 0;
}
void InitTask()
{for (int i 0;iTask_Num;i) other_task[i]NULL;LoadTask(sync_disk);LoadTask(sync_log);LoadTask(net_send);
}
void RunTask()
{for(int i 0;iTask_Num;i){if (other_task[i]NULL){continue;}other_task[i]();}
}
int main()
{pid_t id fork();if (id0){//子进程int cnt 5;while (cnt){printf(我是子进程我还要%dSpid:%d,ppid:%d\n,cnt--,getpid(),getppid());sleep(1);// int a 10;// a/0; //子进程必定异常分母为0}exit(38);}InitTask();//父进程while (1){int status 0; pid_t ret_id waitpid(id,status,WNOHANG);if (ret_id0){printf(waitpid error!\n);exit(1);}else if(ret_id0){RunTask();sleep(1);continue;}else{printf(我是父进程等待子进程成功pid:%d,ppid:%d,ret_id:%d,child exit status:%d,child exit signal:%d\n,getpid(),getppid(),ret_id, (status8)0xFF,status 0x7F); break;}}// int status 0;// pid_t ret_id waitpid(id,status,0);// printf(我是父进程等待子进程成功pid:%d,ppid:%d,ret_id:%d,child exit status:%d,child exit signal:%d\n,getpid(),getppid(),ret_id,(status8)0xFF,status 0x7F);// sleep(5);
// printf(hello world);
// sleep(2);
// _exit(39);
// int result add_to_top(100);
// if (result5050)
// {
// return 0;
// }
// else{
// return 1;
// }
// for (int i 0;i200;i)
// {
// printf(%d:%s\n,i,strerror(i));
// //exit(123);
// _exit(123);
// }return 0;
}接下来我们运行起来 通过上图我们发现父进程在等待子进程退出的时候确实可以干一些事情。
下面我们将代码修改一下用WIFEXITED宏获取是否接收信号
WIFEXITED(status): 若为正常终止子进程返回的状态则为真。查看进程是否是正常退出WEXITSTATUS(status): 若WIFEXITED非零提取子进程退出码。查看进程的退出码从上图运行结果来看我们发现确实成功拿到了退出码0。
总结
如果子进程已经退出调用wait/waitpid时wait/waitpid会立即返回并且释放资源获得子进程退出信息。如果在任意时刻调用wait/waitpid子进程存在且正常运行则进程可能阻塞。如果不存在该子进程则立即出错返回。三.进程程序替换
替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。
那么我想问问一下创建子进程的目的是什么呢就是为了让子进程帮我做特定的任务。而这里分为两种情况
1.让子进程执行父进程的一部分代码
2.如果子进程向指向一个全新的程序代码就称为进程的程序替换。
下面我们先看一下什么是程序替换
首先我们要知道程序替换的接口execl我们用man手册打开可以看到 第一个函数后面参数...这里是可变参数列表第一个参数是你要执行谁这里是个路径如果我们将参数传完了必须以NULL结尾。接下来我们先使用一下然后详细的讲解这个函数。
#include stdio.h
#include stdlib.h
#include unistd.h
int main()
{printf(begin.........\n);printf(begin.........\n);printf(begin.........\n);printf(begin.........\n);execl(/bin/ls,ls,-a,-l,NULL);printf(end..........\n);printf(end..........\n);printf(end..........\n);printf(end..........\n);return 0;
}上图是我们所用的演示代码我们可以看到execl这个函数的第一个参数是个路径表示你要执行谁第二个参数是指令表示你要执行什么命令而后面就是指令的选项了记住参数传完后一定要以NULL结尾。 运行后我们发现原先打印的begin end中只剩下begin了这是什么原因呢如下图 也就是说程序替换会直接将原先可执行程序的代码和数据替换为新的代码和数据。下面我们来看一下程序替换的基本原理 那么通过上图我想问一下进程的程序替换有没有创建新的进程呢答案是没有这里的替换还是原先的进程。那么当创建进程的时候先有进程数据结构还是先加载代码和数据呢这个问题的答案其实我们之前回答过一定是先有进程数据结构因为有数据结构才能管理相应的代码和数据。
上面的演示代码我们是用一个进程进行演示的下面我们用父子进程来演示一下
#include stdio.h
#include stdlib.h
#include unistd.h
#include sys/wait.h
//int main()
//{
// printf(begin.........\n);
// printf(begin.........\n);
// printf(begin.........\n);
// printf(begin.........\n);
// execl(/bin/ls,ls,-a,-l,NULL);
// printf(end..........\n);
// printf(end..........\n);
// printf(end..........\n);
// printf(end..........\n);
// return 0;
//}
int main()
{pid_t id fork();if (id0){//子进程printf(我是子进程:%d\n,getpid());execl(/bin/ls,ls,-a,-l,NULL);}sleep(5);//父进程printf(我是父进程:%d\n,getpid());waitpid(id,NULL,0);return 0;
}我们让子进程去进行程序替换父进程等待子进程下面是运行结果 父进程依旧还是运行了说明了程序替换只会影响调用的那个进程。这又验证了进程具有独立性这句话。
那么程序替换会不会失败呢如果失败了该怎么办 我们将execl里的参数修改为错误的然后我们运行一下 可以看到如果程序替换失败了会继续执行之前的代码和数据并且如果失败execl的返回值为-1如下图 我们也可以这样理解execl只要有返回值就失败了不用判断返回值。
当然我们照样可以拿到子进程的退出码如下图 可以看到我们确实拿到了ls指令失败的2号退出码。
下面我们详细的讲解一下execl接口 第一个参数path是要执行指令的路径后面的参数就是如何加载执行这个指令比如ls命令有ls -l ls-l -n等等也就是说我们在命令行怎么执行这个命令就将这个指令一个个的传递给execl即可只是当我们将所有的指令传完后后面必须加上NULL结尾。
接下来我们讲解一下execv这个函数接口 这个接口的第一个参数还是path路径第二个参数argv[]是什么呢最后一个V其实是vector的意思是一个数组意思就是以数组的方式去传指令下面我们演示一下 通过结果我们可以看到execv的结果与execl是一样的。这个就相当于c的函数重载
下面再讲一下execlp接口此接口与execl的不同是第一个参数 我们可以看到第一个参数是file这是什么意思呢其实这个接口就是不需要你在传路径了你直接传你的指令然后系统会帮助你找到路径不需要你在传了用这个接口你的环境变量必须在PATH中或者在PATH中设置过下面我们演示一下 可以看到我们直接传第一个参数ls现在我们运行一下 可以看到运行是没问题的。
接下来我们再讲解一下execle接口 这个接口的第三个参数envp[]是什么意思呢这个参数是自定义环境变量有什么用呢比如上面我们的父子进程子进程的环境变量是继承父进程的而这个参数的意思是如果我们不想要继承父进程的环境变量我们可以自己传环境变量。下面我们演示一下 我们先创建一个.cc文件然后随便写一段代码 然后我们再进入刚刚3-16的文件将环境变量的参数写为刚刚的.cc生成的可执行文件 然后我们运行起来如果能成功的运行other 的代码的话就说明execle这个接口可以将程序替换为自己写的程序 我们可以看到pid相同运行的程序确实不同并且运行了我们刚刚写的程序。接下来我们再演示一下传环境变量 首先将other中的代码修改为取得一个环境变量MYENV如果返回值为NULL说明没取到否则就是取到了 当我们运行起来发现为NULL这是因为并没有MYENV这个环境变量然后我们在刚刚3-16的文件中设置一下这个环境变量 可以看到我们将MYENV设置为youcanseeme然后我们运行起来 这个时候我们看到确实把环境变量传进去了下面我们看看最后一个接口 为什么这个接口不在刚刚那个里面而被单独列出来呢因为这个是真正的系统调用而上面我们讲的都是这个接口的封装这是为了满足各种场景。
下面我们编写一个极简版本的shell(bash)目的是为了较为深刻的理解shell的运行原理。 我们先创建一个shell.sh的文件然后写一段简单的代码 然后我们就可以运行了。
下面我们写一个自动切割字符串的shell
我们先写一个.c文件然后代码如下
#include stdio.h
#include string.h
#include assert.h
#include unistd.h
#include stdlib.h
#define MAX 1024
#define SEP
int split(char* commandstr,char*argv[])
{assert(conmandstr);assert(argv);argv[0] strtok(commandstr,SEP);int i 1;while (1){argv[i] strtok(NULL,SEP);if (argv[i]NULL) break;i;}return 0;
}
void debugprint(char* argv[])
{for (int i 0;argv[i];i){printf(%d:%s\n,i,argv[i]);}
}
int main()
{char commandstr[MAX] {0};while (1){char commandstr[MAX] {0};char* argv[ARGC] {NULL};printf(lisimymachine currpath]# );fflush(stdout);char* s fgets(commandstr,sizeof(commandstr),stdin);assert(s);(void)s; //保证在release方式发布后因为去掉assert了所以s就没有被使用而带来的编译告警什么都没做但是充当依次使用commandstr[strlen(commandstr)-1] \0;int n split(commandstr,argv);if (n!0) continue;debugprint(argv);pid_t id fork();assert(id0);(void)id;if (id0){//子进程exit(0);}int status 0;waitpid(id,status,0);}return 0;
}通过结果我们可以看到确实完成了字符串的切割通过这两个极简版本的shell我们也确实可以深刻的理解了shell 的运行原理。 总结
对于Linux操作系统的学习我们其实已经进入了一个入门的阶段从进程开始的学习是相对比较困难与枯燥的但是我们只要闯过了这一关我们就见到真正的阳光。下一篇是Linux文件描述符相关的学习希望得到大家的支持