基础设施优化

简介

简介
零拷贝
用户态与内核态切换有什么代价呢？

DMA 是一种外设绕开CPU独立直接访问内存的机制，零拷贝是一种绕开CPU 进行用户态和内核态之间数据拷贝的技术，包括mmap+write、sendfile、sendfile+DMA收集、splice等。

零拷贝

把文件内容发送到网络。这个过程发生在用户空间，文件和网络socket属于硬件资源，读取磁盘或者操作网卡都由操作系统内核完成。在操作系统内部，整个过程为:

在Linux Kernal 2.2之后出现了一种叫做“零拷贝(zero-copy)”系统调用机制，就是跳过“用户缓冲区”的拷贝，建立一个磁盘空间和内存空间的直接映射，数据不再复制到“用户态缓冲区”，系统上下文切换减少2次，可以提升一倍性能。

如果网卡支持 SG-DMA（The Scatter-Gather Direct Memory Access）技术，还可以再去除 Socket 缓冲区的拷贝，这样一共只有 2 次内存拷贝。

零拷贝及一些引申内容

用户态与内核态切换有什么代价呢？

用户态的程序只能通过调用系统提供的API/系统调用来申请并使用资源，比如有个read 系统调用用户态程序不能直接调用read，而是要systemcall read系统调用号。为了避免用户态程序绕过操作系统，直接执行对于硬件的控制和操作，操作系统利用CPU所提供的特权机制，封锁一些指令，并且将内存地址进行虚拟化（Ring 3无法执行一些指令，访问一些地址），使得存储有关键数据（比如IO映射）的部分物理内存无法从用户态进程进行访问。PS: 就好像你永远只能给运维提交工单，而不能直接操作一样。

我们的应用程序运行在 Ring 3（我们通常叫用户态，cpu的状态），而操作系统内核运行在 Ring 0（我们通常叫内核态）。所以一次中断调用，不只是“函数调用”，更重要的是改变了执行权限，从用户态跃迁到了内核态。

Understanding User and Kernel Mode

在操作系统中，In Kernel mode, the executing code has complete and unrestricted access to the underlying hardware. It can execute any CPU instruction and reference any memory address. 而用户态可以访问的指令和地址空间是受限的
用户态和内核态的切换通常涉及到内存的复制，比如内核态read 得到的数据返回给用户态，因为用户态访问不了内核态的read 返回数据。
jvm 则再插一腿，因为jvm 数据不仅在用户态，jvm 还希望数据是由jvm heap管理，所以对于read 操作来讲，数据从内核态 ==> 用户态 ==> jvm heap 经历了两次复制，netty 中允许使用堆外内存（对于linux来说，jvm heap和堆外内存都在进程的堆内存之内）减少一次复制
linux 和jvm 都可以使用 mmap来减少用户态和内核态的内存复制，但一是应用场景有限，二是代码复杂度提升了好多。

Technology

Lifestyle

Architecture

Product

Container 23

Concurrency 14

Life 40

Tool 8

Algorithm 8

JVM 10

Go 18

Kubernetes 49

Other 5

Network 15

Python 1

Java 20

Spring 17

Netty 10

Storage 20

Distribute 10

MQ 8

WEB 5

Linux 11

Scala 1

Code 9

MachineLearning 41

Practice 18

RPC 6

Compute 10

Architecture 23

DDD 4

Reactive 5

Basic 12

Product 3

Monitor 7

CPP 2

Mesh 12

基础设施优化

简介

零拷贝

用户态与内核态切换有什么代价呢？