体系结构

计算存储分离

传统虚拟化
- 对单一物理机器资源的纵向分割，计算、存储、网络等能力都是一台物理机的子集，可伸缩性有较大局限
云虚拟机
- 云端有大规模的专属硬件和高速的内部网络
- 除了核心的 CPU 和内存仍属于同一台宿主机外，硬盘和网络等可以享受云端的基础设施
- 在可扩展性（硬盘、网卡、公网 IP）和故障隔离方面，有很大优势
- 名称
  - 阿里云：ECS - Elastic Compute Service
  - AWS：EC2 - Elastic Compute Cloud
  - Azure：Virtual Machines
  - 腾讯云：CVM - Cloud Virtual Machine

vm-01

网络安全组

Network Security Group

网络安全组：一层覆盖在虚拟机之外的网络防火墙，能够控制虚拟机入站流量和出站流量
网络安全组并不工作在 OS 层，是额外的一层防护，非法流量不会到达 OS 的网络堆栈，不会影响 VM 的性能
网络安全组是一种可复用的配置，可以同时应用于多个虚拟机，软件定义网络
网络安全组非常灵活，规则会动态生效

类型规格

类型

具有同一类设计目的或者性能特点的虚拟机类别：通用均衡型、计算密集型、内存优化型、图形计算型

重要指征：vCPU : Memory，在主流云计算平台上，通常使用字母缩写来表达虚拟机类型

类型	`vCPU : Memory`	用途
通用均衡型	`1:4`	建站、应用后端
计算密集型	`1:2` ~ `1:1`	科学计算、视频编码、代码编译
内存优化型	> `1:8`	数据库、缓存服务、大数据分析
图形计算型（GPU）		AI（机器学习、深度学习等）
本地存储型带有`高性能`或`大容量`的本地存储

Generation

用来标识该类型下的第几代机型

同类型虚拟机更新换代，首先是 CPU 的换代提升
新机型的推出，云厂商会详细说明背后支撑的硬件详细信息
由于虚拟机所采用的物理 CPU 在不断更新，因此云上虚拟机的单核性能未必相同
- Azure 引入 ACU（Azure Compute Unit），用来帮助量化不同 CPU 的单核性能
虚拟化技术也会不断改进，如 AWS Nitro System（类似：阿里的神龙架构）
- 将许多原本占用宿主机资源的虚拟化管理工作进行了剥离
- 并将部分工作负载，通过 Nitro Card 等专用硬件进行硬件化
- 进而达到最大化计算资源利用率的效果
买新不买旧
- 新一代的型号，对应着全新的特制底层物理服务器和虚拟化设施，能够提供更高的性能价格比

规格

medium、large、xlarge

large = 2vCPU
xlarge = 4vCPU
nxlarge = n × 4 vCPU

vCPU 是更合适的表达方式（超线程，HyperThreading，一个 Core 能虚拟出两个 vCPU 的算力）

裸金属：云厂商尽最大可能地将物理裸机以云产品方式暴露出来的实例
主要用于一些追求极致性能，或者需要在非虚拟化环境下运行软件的场景

命名规则

利用三个维度（类型、Generation、 规格），按照某种顺序排列的组合

$ lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                16
On-line CPU(s) list:   0-15
Thread(s) per core:    2
Core(s) per socket:    8
Socket(s):             1
NUMA node(s):          1
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 85
Model name:            Intel(R) Xeon(R) Platinum 8163 CPU @ 2.50GHz
Stepping:              4
CPU MHz:               2500.018
BogoMIPS:              5000.03
Hypervisor vendor:     KVM
Virtualization type:   full
L1d cache:             32K
L1i cache:             32K
L2 cache:              1024K
L3 cache:              33792K
NUMA node0 CPU(s):     0-15

成本

可组合使用

降本方式	代价
Package	`固定时长 + 预付费`，牺牲`采购的灵活性`
Spot	`拍卖 + 随时被回收`，牺牲`稳定性`
Burstable Performance	`积分机制`，牺牲`性能`
ARM	`生态` + `兼容性`

Package

提前预估好虚拟机的使用时间，并提前支付，一般能获得 3~7 折

一般无法提前取消，或者需要扣除部分费用后才能提前取消
繁琐的续费管理（忘记续费，过了缓冲期后，虚拟机会被自动关闭，进而影响业务的连续性）

Spot

AWS 首创，能提供大幅折扣（1~2 折）

基本原理：将云数据中心上闲置的机器资源进行公开的拍卖，价高者得
主要限制：当数据中心的闲置资源不足时，随时可能被回收，牺牲了稳定性
Spot Instances 也是按运行时长付费，可随时启停
适合场景：无状态、可中断的工作（后台批计算、性能测试等）

竞价方式：设定可接受的最高价；根据市场价格波动，自动出价

Burstable Performance

6 折或更低

Burstable Performance Instances 的成本显著降低
Burstable Performance Instances 的 CPU 性能表现，采用积分制
- 积分随着时间的推移而匀速累加，也会随着算力的输出而不断消耗
当积分充裕时，CPU 可以按需跑满，达到 CPU 性能的 100%，但积分也会快速消耗
当积分不足时，CPU 只能发挥出标称值的一小部分性能（性能基准）
- 性能基准：与积分匀速累加的速度一致（即以该算力持续输出，积分会一直持平）
- 性能基准一般为性能峰值的 5% ~ 40%
积分的积累存在上限（一般足够全速计算数小时）
适合符合流量自然特征的互联网业务