Cloud Computing - Virtual machine
体系结构
计算存储分离
- 传统虚拟化
- 对单一物理机器资源的
纵向分割,计算、存储、网络等能力都是一台物理机的子集,可伸缩性有较大局限
- 对单一物理机器资源的
- 云虚拟机
- 云端有
大规模的专属硬件和高速的内部网络 - 除了核心的
CPU和内存仍属于同一台宿主机外,硬盘和网络等可以享受云端的基础设施 - 在
可扩展性(硬盘、网卡、公网 IP)和故障隔离方面,有很大优势 - 名称
- 阿里云:ECS - Elastic Compute Service
- AWS:EC2 - Elastic Compute Cloud
- Azure:Virtual Machines
- 腾讯云:CVM - Cloud Virtual Machine
- 云端有
网络安全组
Network Security Group
- 网络安全组:一层覆盖在虚拟机之外的
网络防火墙,能够控制虚拟机入站流量和出站流量 - 网络安全组并不工作在
OS层,是额外的一层防护,非法流量不会到达 OS 的网络堆栈,不会影响 VM 的性能 - 网络安全组是一种
可复用的配置,可以同时应用于多个虚拟机,软件定义网络 - 网络安全组非常
灵活,规则会动态生效
类型规格
类型
具有同一类
设计目的或者性能特点的虚拟机类别:通用均衡型、计算密集型、内存优化型、图形计算型
重要指征:
vCPU : Memory,在主流云计算平台上,通常使用字母缩写来表达虚拟机类型
| 类型 | vCPU : Memory |
用途 |
|---|---|---|
| 通用均衡型 | 1:4 |
建站、应用后端 |
| 计算密集型 | 1:2 ~ 1:1 |
科学计算、视频编码、代码编译 |
| 内存优化型 | > 1:8 |
数据库、缓存服务、大数据分析 |
| 图形计算型(GPU) | AI(机器学习、深度学习等) | |
| 本地存储型 带有 高性能或大容量的本地存储 |
Generation
用来标识该
类型下的第几代机型
- 同类型虚拟机更新换代,首先是
CPU的换代提升 - 新机型的推出,云厂商会详细说明背后支撑的
硬件详细信息 - 由于虚拟机所采用的
物理 CPU在不断更新,因此云上虚拟机的单核性能未必相同- Azure 引入
ACU(Azure Compute Unit),用来帮助量化不同 CPU 的单核性能
- Azure 引入
虚拟化技术也会不断改进,如AWS Nitro System(类似:阿里的神龙架构)- 将许多原本
占用宿主机资源的虚拟化管理工作进行了剥离 - 并将
部分工作负载,通过Nitro Card等专用硬件进行硬件化 - 进而达到
最大化计算资源利用率的效果
- 将许多原本
买新不买旧- 新一代的型号,对应着全新的
特制底层物理服务器和虚拟化设施,能够提供更高的性能价格比
- 新一代的型号,对应着全新的
规格
medium、large、xlarge
large = 2vCPUxlarge = 4vCPUnxlarge = n × 4 vCPU
vCPU 是更合适的表达方式(
超线程,HyperThreading,一个Core能虚拟出两个vCPU的算力)
裸金属:云厂商
尽最大可能地将物理裸机以云产品方式暴露出来的实例
主要用于一些追求极致性能,或者需要在非虚拟化环境下运行软件的场景
命名规则
利用三个维度(
类型、Generation、规格),按照某种顺序排列的组合
1 | $ lscpu |
成本
可组合使用
| 降本方式 | 代价 |
|---|---|
| Package | 固定时长 + 预付费,牺牲采购的灵活性 |
| Spot | 拍卖 + 随时被回收,牺牲稳定性 |
| Burstable Performance | 积分机制,牺牲性能 |
| ARM | 生态 + 兼容性 |
Package
提前
预估好虚拟机的使用时间,并提前支付,一般能获得3~7折
- 一般
无法提前取消,或者需要扣除部分费用后才能提前取消 - 繁琐的
续费管理(忘记续费,过了缓冲期后,虚拟机会被自动关闭,进而影响业务的连续性)
Spot
AWS 首创,能提供
大幅折扣(1~2折)
- 基本原理:将云数据中心上
闲置的机器资源进行公开的拍卖,价高者得 - 主要限制:当数据中心的闲置资源不足时,
随时可能被回收,牺牲了稳定性 - Spot Instances 也是按
运行时长付费,可随时启停 - 适合场景:
无状态、可中断的工作(后台批计算、性能测试等)
竞价方式:设定
可接受的最高价;根据市场价格波动,自动出价
Burstable Performance
6折或更低
- Burstable Performance Instances 的
成本显著降低 - Burstable Performance Instances 的 CPU 性能表现,采用
积分制- 积分随着
时间的推移而匀速累加,也会随着算力的输出而不断消耗
- 积分随着
- 当
积分充裕时,CPU 可以按需跑满,达到 CPU 性能的100%,但积分也会快速消耗 - 当
积分不足时,CPU 只能发挥出标称值的一小部分性能(性能基准)性能基准:与积分匀速累加的速度一致(即以该算力持续输出,积分会一直持平)- 性能
基准一般为性能峰值的5% ~ 40%
- 积分的积累存在
上限(一般足够全速计算数小时) - 适合符合
流量自然特征的互联网业务
ARM
低功耗+高性价比(输出同样性能,可节约 30 ~ 40 % 的成本)
ARM 是一个
相对开放的架构,云厂商会基于 ARM 来自建芯片(进一步降低单位算力的成本)
ARM 在
服务器端的软件生态,相对于 x86,还有待加强
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.













