用户请求 (UDP)
                           │
                           ▼
                  ┌─────────────────┐
                  │   网卡          │  10Gbps
                  │   RX 接收队列    │
                  └────────┬────────┘
                           │
                           ▼
                  ┌─────────────────┐
                  │   内核协议栈      │  解析 UDP 包
                  │   Socket 接收    │  → 投递到 btvdp 进程
                  └────────┬────────┘
                           │
                           ▼
                  ┌─────────────────┐
                  │   btvdp 进程     │  解析请求：用户要哪个视频片段？
                  │  （应用层逻辑）   │
                  └────────┬────────┘
                           │
                  ┌────────┴────────┐
                  │  查找数据在哪里？  │
                  └────────┬────────┘
                           │
             ┌─────────────┼─────────────┐
             ▼             ▼              ▼
      ┌────────────┐ ┌──────────┐  ┌──────────┐
      │ L1: 进程内  │ │ L2: Page │  │ L3: 磁盘  │
      │ 用户态缓存  │ │  Cache   │  │  (SSD)   │
      │  (~20GB/   │ │ (内核管理│  │          │
      │   进程)    │ │  ~12GB)  │  │          │
      └─────┬──────┘ └────┬─────┘  └────┬─────┘
            │             │              │
        命中直接返回    命中：内存     未命中：
        零拷贝发送     拷贝，快      触发磁盘读
            │             │              │
            │             │              ▼
            │             │     ┌──────────────────┐
            │             │     │ 磁盘I/O子系统      │
            │             │     │                   │
            │             │     │ 应用 read()/mmap()│
            │             │     │      ↓            │
            │             │     │ VFS → 文件系统     │
            │             │     │      ↓            │
            │             │     │ Block Layer       │
            │             │     │ (I/O调度，合并)    │
            │             │     │      ↓            │
            │             │     │ SCSI/SATA驱动     │
            │             │     │      ↓            │
            │             │     │ 物理SSD读取        │
            │             │     │ (~0.5ms/请求)     │
            │             │     └────────┬─────────┘
            │             │              │
            │             │         数据读入内存
            │             │              │
            └─────────────┼──────────────┘
                          │
                          ▼
                 ┌─────────────────┐
                 │  数据在内存中了   │
                 │      │
                 │  UDP 响应包      │
                 └────────┬────────┘
                          │
                          ▼
                 ┌─────────────────┐
                 │  Socket 发送缓冲区│ ← 如果满了，UdpSndbufErrors++
                 └────────┬────────┘       （丢包就发生在这里！）
                          │
                          ▼
                 ┌─────────────────┐
                 │  内核协议栈       │
                 │  添加UDP/IP头    │
                 └────────┬────────┘
                          │
                          ▼
                 ┌─────────────────┐
                 │  网卡 TX 发送队列 │
                 │  DMA 发送        │
                 └────────┬────────┘
                          │
                          ▼
                     发给用户 📡

关键问题在 L3 磁盘读取这一步。如果用户请求到达内容没有命中内存的话，就需要去磁盘里面调度，这就造成了额外的开销，想CDN服务器，比如说抖音这种，大量的用户发起随机的UDP包，对磁盘的读取速度就造成了非常大的压力。单位时间内没有能从磁盘调度出来的数据，就在Socket发送缓冲区被丢弃了