操作系统之 虚拟存储概念
为什么需要虚拟存储?
计算机系统常出现内存空间不够用
如何解决内存空间不够用?
- 覆盖(Overlay)
应用程序 手动 把需要的指令和数据保存在内存中 (将代码分成若干模块 彼此无调用关系的 将其附庸到一块区域 需要用户自己来确定何时将其模块加入程序 开发难度高)
- 交换(对换 Swapping)
操作系统 自动 把暂时不能执行的程序保存到外存中 (因为对换的是一个进程的整个地址空间 所以开销会比较大)
- 虚拟存储
在有限容量的内存中 以页为单位自动装入更多更大的程序
覆盖和交换技术
覆盖技术目标
在较小的可用内存中运行较大的程序 (一个程序的运行内存空间都不够)
覆盖技术实现方法
依据程序的逻辑结构 将程序模块划分为若干功能相对独立的模块
将不会同时执行的模块共享同一块内存区域
- 必要部分(常用功能)的代码和数据常驻内存
- 可选部分(非常用功能)放在其他程序模块中 只在需要的时候装入内存
- 不存在调用关系的模块可相互覆盖 共用同一块内存区域
覆盖技术的不足
- 增加编程难度
1
需要程序员 划分功能模块 并确定模块间的覆盖关系
- 增加执行时间
1
从外存 装入覆盖 模块 时间换空间
交换技术目标
增加正在运行或需要运行的程序的内存 (一个程序的运行内存空间足够了 但是想要运行更多的进程)
交换技术实现方法
- 将暂时不能运行的程序放到外存
- 换入换出基本单位 整个进程的地址空间
- 换出(Swap out) 把一个进程的整个地址空间保存到外存
- 换入(Swap in) 把外存中的某进程的地址空间读入到内存
交换技术有什么问题?
- 交换时机
1
当内存不够 或 有不够的可能时换出
- 交换区大小
1
存放所有用户进程的所有内存映像的拷贝
- 程序换入时的重定位 换出时再换入时要放在原处吗?
1
采用动态地址映射的方法
覆盖与交换的比较
- 覆盖
- 只能发生在没有调用关系的模块间
- 程序员必须知道这种逻辑覆盖结构
- 发生在运行程序的内部模块间
- 交换
- 以进程为单位
- 不需要模块间的逻辑覆盖结构
- 发生在内存进程间
虚拟存储 使用的就是 交换的思路 只不过它是以页来做单位 且 是操作系统来完成的交换
局部性原理 (Principle of locality)
程序在执行过程中的一个较短时期 所执行的指令地址和指令的操作数地址 分别局限于一定区域
- 时间局部性
- 一条指令的一次执行和下一次执行 一个数据的一次访问和下次访问 都集中在一个较短时期
- 空间局部性
- 当前指令和邻近的几条指令 当前访问的数据和邻近的几个数据 都集中在一个较小的区域
- 分支局部性
- 一条跳转指令的两次执行 很可能跳转到相同的内存位置
- 局部性原理意义
- 从理论上来说 虚拟存储是能够实现的 并且可以取得满意的成果
不同程序编写方法的局部性特征
例子:页面大小为4K,分配给每个进程的物理页面数为1。在一个进程中,定义了如下的二维数组int A[1024][1024],该数组按行存放在内存,每一行放在一个页面中
1 | 程序编写方法1: |
1 | 程序编写方法2: |
第一种编程方法 按行 清 0 按照题目所说 分配给每个进程的物理页面数为 1 就会产生 1024 x 1024 次缺页异常 因为 不断的在换页
第二种编程方法 按列 清 0 从 0 ~ 1023 都是在同一页 只有换行的时候 才会换页 故会 产生 1024 次 缺页异常
如果物理内存小 这两种编程方法的性能差距是巨大的
虚拟存储
将不常用的部分内存暂存到外存
虚拟存储的目标
- 只把部分程序放到内存中 从而运行比物理内存大的程序
- 由操作系统自动完成
- 在内存与外存之间只交换进程的部分内容
虚拟存储思路
- 加载程序时 只将当前执行所需要的部分页面或段装入内存
- 指令执行时中需要的指令或数据不在内存中时 处理器通知操作系统将相应的页面或段调入内存
- 操作系统将内存中暂时不用的页面或段保存到外存
虚拟存储实现方式
- 虚拟段式存储
- 虚拟页式存储
虚拟存储基本特征
- 不连续性
- 物理内存分配非连续
- 虚拟地址空间使用非连续
- 大用户空间
- 提供给用户的虚拟内存可大于实际的物理内存
- 部分交换
- 虚拟存储只对部分虚拟地址空间的换入和换出
虚拟存储的支持技术
- 硬件
- 页式或短时存储中的地址转换机制 (硬件要知道它在内存里还是在外存里)
- 操作系统
- 管理内存和外存间页面或段的换入换出 (操作系统要知道它要换的页面或段是哪些)
虚拟页式存储
在页式存储管理的基础上 增加请求调页和页面置换
- 思路
- 当用户进程要加载到内存运行时 只装入部分页面 就启动程序运行
- 进程在运行中发现有需要的代码或数据不在内存中 则向系统发起缺页异常请求 然后就进入了 中断服务例程
- 操作系统在处理缺页异常时 将外存的页面调入内存 使进程能够继续运行
虚拟页式存储地址转换
其实和之前 非虚拟页式存储地址转换 是一样的 只不过页表项里会有一个 P 位 表示这个页是否存在 若不存在 就会发起缺页异常中断
1 | 地址转换依然是 逻辑地址的 前 10 位 加上 cr3 寄存器里面的 页目录表基址 找到 PDE |
页表项 结构和之前说的一样
- AVL CPU 不理会这个属性 可以不管 (有可能在32位系统使用大过 4G内存的时候 用到这几位)
- G Global 全局位 表示是否将虚拟地址与物理地址的转换结果缓存到 TLB 中
- D Dirty 脏页位 当 CPU 对这个页进行写操作时 会置 1
- PAT Page Attribute Table 页属性表位 置 0
- A Accessed 访问位 若为 1 则 说明 CPU 访问过了 CPU 会定时清 0 记录被置 1 的频率 当内存不足时 会将 使用频率较低的页面换出到外存 同时将 P位 置 0 下次访问 该页时 会引起 Pagefault 异常 中断处理程序再将此页换上
- PCD Page-level Cache Disable 页级高速缓存位 置 0 即可 读的时候 高速缓存是否有效 若有效则直接从高速缓存中读出 若无效的话 则必须实实在在的从 I/O 端口去读数据
- PWT Page-level Write-Through 页级通写位 控制是先写到高速缓存里再慢慢回写到内存里 还是 直接慢慢写到内存里
- US User/Superviosr 普通用户/超级用户位
- RW Read/Write 读写位
- P Present 存在位 (虚拟页式存储的关键位 若为 0 则发起缺页异常)
缺页异常的处理例程
1 | CPU 执行 Load M |
虚拟页式存储中的外存管理
在何处保存未被映射的页?
- 应能方便地找到在外存中的页面内容 (直接做一个分区做对换区 Linux Unix)
- 交换空间 (磁盘或者文件)
- 采用特殊格式存储未被映射的页面 (用一个文件来存)
虚拟页式存储中的外存怎么选择?
- 代码段 它就是可执行的二进制文件 没必要复制
- 代码加载的共享库程序段 也是不会变的 没必要复制
- 其他段 可以放到交换空间里去
虚拟页式存储管理的性能
有效存储访问时间 (Effective memory access time EAT)
1 | EAT = 访存时间 * (1 - p) + 缺页异常处理时间 * 缺页率p * (1 + 页修改概率q) (若不开启虚拟页式存储 则 EAT = 访存时间) |