体系结构

计算存储分离

  1. 传统虚拟化
    • 对单一物理机器资源的纵向分割,计算、存储、网络等能力都是一台物理机的子集,可伸缩性有较大局限
  2. 云虚拟机
    • 云端有大规模的专属硬件高速的内部网络
    • 除了核心的 CPU内存仍属于同一台宿主机外,硬盘网络等可以享受云端的基础设施
    • 可扩展性(硬盘、网卡、公网 IP)和故障隔离方面,有很大优势
    • 名称
      • 阿里云:ECS - Elastic Compute Service
      • AWS:EC2 - Elastic Compute Cloud
      • Azure:Virtual Machines
      • 腾讯云:CVM - Cloud Virtual Machine

vm-01

网络安全组

Network Security Group

  1. 网络安全组:一层覆盖在虚拟机之外的网络防火墙,能够控制虚拟机入站流量出站流量
  2. 网络安全组并不工作在 OS 层,是额外的一层防护,非法流量不会到达 OS 的网络堆栈,不会影响 VM 的性能
  3. 网络安全组是一种可复用的配置,可以同时应用于多个虚拟机,软件定义网络
  4. 网络安全组非常灵活,规则会动态生效

类型规格

类型

具有同一类设计目的或者性能特点的虚拟机类别:通用均衡型计算密集型内存优化型图形计算型

重要指征:vCPU : Memory,在主流云计算平台上,通常使用字母缩写来表达虚拟机类型

类型 vCPU : Memory 用途
通用均衡型 1:4 建站、应用后端
计算密集型 1:2 ~ 1:1 科学计算、视频编码、代码编译
内存优化型 > 1:8 数据库、缓存服务、大数据分析
图形计算型(GPU) AI(机器学习、深度学习等)
本地存储型
带有高性能大容量的本地存储

Generation

用来标识该类型下的第几代机型

  1. 同类型虚拟机更新换代,首先是 CPU 的换代提升
  2. 新机型的推出,云厂商会详细说明背后支撑的硬件详细信息
  3. 由于虚拟机所采用的物理 CPU不断更新,因此云上虚拟机的单核性能未必相同
    • Azure 引入 ACU(Azure Compute Unit),用来帮助量化不同 CPU 的单核性能
  4. 虚拟化技术也会不断改进,如 AWS Nitro System(类似:阿里的神龙架构)
    • 将许多原本占用宿主机资源虚拟化管理工作进行了剥离
    • 并将部分工作负载,通过 Nitro Card专用硬件进行硬件化
    • 进而达到最大化计算资源利用率的效果
  5. 买新不买旧
    • 新一代的型号,对应着全新的特制底层物理服务器虚拟化设施,能够提供更高的性能价格比

规格

mediumlargexlarge

  1. large = 2vCPU
  2. xlarge = 4vCPU
  3. nxlarge = n × 4 vCPU

vCPU 是更合适的表达方式(超线程,HyperThreading,一个 Core 能虚拟出两个 vCPU算力

裸金属:云厂商尽最大可能地将物理裸机云产品方式暴露出来的实例
主要用于一些追求极致性能,或者需要在非虚拟化环境下运行软件的场景

命名规则

利用三个维度(类型Generation规格),按照某种顺序排列的组合

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
$ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 16
On-line CPU(s) list: 0-15
Thread(s) per core: 2
Core(s) per socket: 8
Socket(s): 1
NUMA node(s): 1
Vendor ID: GenuineIntel
CPU family: 6
Model: 85
Model name: Intel(R) Xeon(R) Platinum 8163 CPU @ 2.50GHz
Stepping: 4
CPU MHz: 2500.018
BogoMIPS: 5000.03
Hypervisor vendor: KVM
Virtualization type: full
L1d cache: 32K
L1i cache: 32K
L2 cache: 1024K
L3 cache: 33792K
NUMA node0 CPU(s): 0-15

成本

可组合使用

降本方式 代价
Package 固定时长 + 预付费,牺牲采购的灵活性
Spot 拍卖 + 随时被回收,牺牲稳定性
Burstable Performance 积分机制,牺牲性能
ARM 生态 + 兼容性

Package

提前预估好虚拟机的使用时间,并提前支付,一般能获得 3~7

  1. 一般无法提前取消,或者需要扣除部分费用后才能提前取消
  2. 繁琐的续费管理(忘记续费,过了缓冲期后,虚拟机会被自动关闭,进而影响业务的连续性

Spot

AWS 首创,能提供大幅折扣1~2 折)

  1. 基本原理:将云数据中心上闲置的机器资源进行公开的拍卖,价高者得
  2. 主要限制:当数据中心的闲置资源不足时,随时可能被回收,牺牲了稳定性
  3. Spot Instances 也是按运行时长付费,可随时启停
  4. 适合场景:无状态可中断的工作(后台批计算、性能测试等)

竞价方式:设定可接受的最高价;根据市场价格波动,自动出价

Burstable Performance

6 折或更低

  1. Burstable Performance Instances 的成本显著降低
  2. Burstable Performance Instances 的 CPU 性能表现,采用积分制
    • 积分随着时间的推移匀速累加,也会随着算力的输出而不断消耗
  3. 积分充裕时,CPU 可以按需跑满,达到 CPU 性能的 100%,但积分也会快速消耗
  4. 积分不足时,CPU 只能发挥出标称值的一小部分性能性能基准
    • 性能基准:与积分匀速累加的速度一致(即以该算力持续输出,积分会一直持平
    • 性能基准一般为性能峰值5% ~ 40%
  5. 积分的积累存在上限(一般足够全速计算数小时
  6. 适合符合流量自然特征互联网业务

image-20230522233236813

ARM

低功耗 + 高性价比(输出同样性能,可节约 30 ~ 40 % 的成本)

ARM 是一个相对开放的架构,云厂商会基于 ARM 来自建芯片(进一步降低单位算力的成本

ARM 在服务器端的软件生态,相对于 x86,还有待加强