操作系统 - 进程与线程、调度、进程间通信

本文为《现代操作系统：原理与实现》（陈海波著）的阅读笔记。

# 1. 进程

# 1.1 fock：进程创建

在linux中，fock会复制一个进程的全部信息，成为一个全新的进程，并返回其PID（两次）。这个过程，这事linux创建进程的唯一方式。其中写时拷贝会优化fock的过程，使其效率更高。

第一个进程怎么创建：

# 1.2 execve：进程的执行

# 1.3 进程树、进程间监控与僵尸进程

linux进程间监控用的是waitpid，由父进程调用waitpid对子进程进行监控。wait不仅有监控的作用，还有释放资源的作用。

如果父进程没有调用waitpid，子进程就结束了，此时资源没有完全释放，这个进程就变成了僵尸进程。

# 1.4 概念：进程组(process)与会话(session)

概念关系：

进程组是进程的集合
会话是进程组的集合

进程组存在的意义：主要是体现在信号的处理上，信号是由软件发出的类似中断的操作。当对一个进程组发出信号时，信号会发送给进程组的每个进程。

会话可以根据进程组的执行状态将其分为“前台进程组”和“后台进程组”。

控制终端进程是会话与外界进行交互的“窗口“，负责接收用户发来的输入。

在一个进程中会有三个标识：

pid：进程号
gid：进程组号
sid：会话号

# 2. 线程

线程出现的原因：

创建进程的开销大，需要创建独立的地址空间。（线程创建速度比进程快10-100倍）
进程间进行数据共享麻烦而且开销大

另外需要注意：线程是操作系统资源调度的基本单位。通常使用超线程技术的CPU可以一个核心同时处理两个线程，因此出现了4核8线程等CPU。

# 2.1 多线程的地址空间

多线程在一个进程内，他们的地址空间有两个重要的特征：

分离的内核栈和用户栈。
共享的其他区域（代码库，用户堆，数据，代码等）

# 2.2 用户态线程与内核态线程

根据由用户态应用还是内核创建，将线程分为用户态线程和内核态线程。

区别：

用户态线程是自己创建的，内核不可见，不接受操作系统调度器直接管理。
用户态线程比内核态线程更加轻量级，创建开销小。
用户态线程的功能受限。

但是有时候需要用户态线程与内核态线程相互协作，所以操作系统会建立两者之间的关系，有三种：

多对一模型
一对一模型（Linux和Windows所采用）
多对多模型（macOS和iOS的调度器GCD采用）

# 2.3 线程控制块与线程本地存储

线程控制块（Thread Control Block, TCB）主要用于保存线程自身的相关信息。

线程本地存储(Thread Local Storage, TLS)可以实现线程内的全局变量。

# 2.4 线程的基本接口：POSIX线程库

这部分参看书籍P95 5.3.4

# 2.5 线程的实现

这部分参照：Leetcode 硬核操作系统指南线程实现 (opens new window)

主要分为两种，在用户空间实现和在内核中实现

# 3. 线程的调度

# 3.1 调度的目标

由于应用种类繁多，调度的目标也各不相同。根据调度任务的不同，总结如下：

# 3.2 调度任务总览

此部分见P116 图6-4，这里有图的过程以及各部分的解释。

# 3.3 调度方法

LeetBook中的分类是按照不同应用来分的，大体如下:

批处理任务调度：

FCFS，先到先服务
最短作业优先（最短任务优先, Shortest Job First, SJF）
最短剩余时间优先（2的抢占式版本，也叫最短完成时间任务优先, Shortest Time-to-Complete First, STCF）

交互式系统的调度：

轮询调度（时间片轮转, Round Robin, RR）
优先级调度
1. 多级队列(MLQ)
2. 多级反馈队列（MLFQ，早期的Linux，Windows，macOS）
公平共享调度策略
1. 彩票调度
2. 步幅调度
最短进程优先
保证调度

实时系统中的调度：

这里只介绍了一下，没有具体方案。

在书中还介绍了多核调度策略，主要内容有：

负载分担
协同调度
两级调度
负载追踪与负载均衡
能耗感知调度

# 4. 进程间通信

# 4.1

编辑

上次更新: 2023/03/02, 12:43:17

进程间通信、同步原语→