k8s中的HorizontalPodAutoscaler和VerticalPodAutoscaler使用案例恒星 – 网站运维分享-IT技术资源教程-运维成长之路-个人随笔-恒星个人博客网站恒星

HorizontalPodAutoscaler（HPA）

原理：通过调整Pod的副本数量（水平扩展）来应对负载变化。
核心指标：基于CPU、内存、自定义指标（如请求延迟、队列长度）或外部指标（如Prometheus数据）。
适用场景：

应对流量波动明显的服务（如Web应用、API服务）。
需要快速弹性伸缩的场景，特别是在云环境中节省成本。

使用案例

示例1：电商促销期间的Web服务

场景：电商网站在“黑色星期五”期间面临突发流量，需自动扩容Pod以维持响应速度。

配置：

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: web-server-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: web-server
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70

效果：当CPU使用率超过70%时，HPA自动增加Pod数量，最高扩展到10个副本；流量下降后缩容至2个副本。

示例2：基于自定义指标的自动扩缩

场景：消息处理服务根据队列中堆积的消息数量扩容。

配置：使用Prometheus监控队列长度，通过HPA触发扩缩容。

metrics:
- type: External
  external:
    metric:
      name: queue_messages
      selector:
        matchLabels:
          queue: my-queue
    target:
      type: AverageValue
      averageValue: 100

VerticalPodAutoscaler（VPA）

原理：调整Pod的CPU/内存请求和限制（垂直扩展），优化资源利用率。
更新模式：

Auto：自动应用推荐值（可能重启Pod）。
Initial：仅初始化时设置资源。
Off：仅提供建议，不自动应用。
适用场景：
资源需求随时间变化的服务（如批处理作业、周期性任务）。
避免资源浪费或优化长期运行服务的资源分配。

使用案例

示例1：优化批处理作业资源

场景：数据分析任务启动时需要高内存，运行后需求下降，避免资源浪费。

配置：

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: batch-job-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind: Deployment
    name: batch-job
  updatePolicy:
    updateMode: Auto

效果：VPA根据实时使用情况动态调整内存请求，初始分配4Gi，运行后降至2Gi。

示例2：避免内存不足导致Pod崩溃

场景：某服务偶发内存峰值，导致Pod被OOM Kill。

配置：VPA监控内存使用并自动增加请求值。

resourcePolicy:
  containerPolicies:
  - containerName: '*'
    minAllowed:
      cpu: 100m
      memory: 256Mi
    maxAllowed:
      cpu: 2
      memory: 8Gi

HPA vs VPA对比

特性	HPA	VPA
扩缩方向	水平（调整Pod数量）	垂直（调整Pod资源）
主要指标	CPU、内存、自定义/外部指标	实际资源使用情况
资源影响	增加节点压力（更多Pod）	可能影响调度（单个Pod资源变化）
适用场景	突发流量、无状态服务	资源需求波动、优化利用率
Pod重启	无	更新资源时可能需要重启

注意事项

HPA与VPA共存：
同时使用时需谨慎，可能引发资源冲突。建议分开使用或通过策略协调（如HPA基于CPU，VPA优化内存）。
VPA限制：
- 某些模式（如Auto）会触发Pod重启，影响服务可用性。
- 不支持StatefulSet（截至最新版本）。
依赖组件：
- HPA需要Metrics Server或自定义指标适配器。
- VPA需要单独安装VPA组件（包括Admission Controller）。