如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容
如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容
Kubernetes 的 Horizontal Pod Autoscaler(HPA)不仅支持基于 CPU 和内存的自动扩缩容,还支持基于自定义指标的自动扩缩容。自定义指标可以是应用的业务指标,例如每秒请求数(QPS)、消息队列长度、数据库连接数等。通过自定义指标,HPA 可以更灵活地根据业务需求调整 Pod 的副本数。
本文将详细介绍如何在 Kubernetes 中配置和使用自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。
1. 自定义指标的工作原理
HPA 的自定义指标功能依赖于 Kubernetes 的 Custom Metrics API。Custom Metrics API 允许用户将自定义指标暴露给 Kubernetes,HPA 可以通过这些指标动态调整 Pod 的副本数。
1.1 核心组件
- Prometheus:用于收集和存储自定义指标。
- Prometheus Adapter:将 Prometheus 的指标暴露给 Kubernetes 的 Custom Metrics API。
HPA:根据自定义指标调整 Pod 的副本数。
1.2 工作流程
- Prometheus 收集应用的业务指标(如 QPS)。
- Prometheus Adapter 从 Prometheus 中读取指标,并通过 Custom Metrics API 暴露给 Kubernetes。
- HPA 从 Custom Metrics API 获取指标值,并根据目标值调整 Pod 的副本数。
2. 前提条件
在配置自定义指标的 HPA 之前,请确保您的 Kubernetes 集群满足以下条件:
- 安装 Prometheus
- 使用 Helm 或手动部署 Prometheus。
- 确保 Prometheus 能够收集应用的业务指标。
- 安装 Prometheus Adapter
Prometheus Adapter 是连接 Prometheus 和 Kubernetes Custom Metrics API 的桥梁。
使用以下命令安装 Prometheus Adapter:
kubectl apply -f https://github.com/kubernetes-sigs/prometheus-adapter/releases/latest/download/components.yaml
配置资源请求
HPA 需要 Pod 配置资源请求(requests),例如 CPU 和内存。如果未配置资源请求,HPA 将无法正常工作。
3. 配置自定义指标的 HPA
3.1 部署示例应用
首先,我们部署一个示例应用,并确保 Prometheus 能够收集该应用的指标。以下是一个简单的 Nginx Deployment 示例:
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.14.2
resources:
requests:
cpu: "200m"
memory: "128Mi"
使用以下命令创建 Deployment:
kubectl apply -f nginx-deployment.yaml
3.2 配置 Prometheus Adapter
Prometheus Adapter 需要配置规则,以将 Prometheus 的指标暴露给 Kubernetes。以下是一个示例配置:
rules:
- seriesQuery: 'http_requests_total{namespace!="",pod!=""}'
resources:
overrides:
namespace: {resource: "namespace"}
pod: {resource: "pod"}
name:
matches: "^(.*)_total"
as: "${1}_per_second"
metricsQuery: 'sum(rate(<<.Series>>{<<.LabelMatchers>>}[2m])) by (<<.GroupBy>>)'
- seriesQuery:查询 Prometheus 中的指标。
- resources:将 Prometheus 的标签映射到 Kubernetes 资源。
- name:将 Prometheus 的指标名称转换为 Kubernetes 可识别的名称。
- metricsQuery:定义如何计算指标值。
kubectl apply -f prometheus-adapter-config.yaml
3.3 创建基于自定义指标的 HPA
以下是一个基于自定义指标(每秒请求数)的 HPA 示例:
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: custom-metric-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: nginx-deployment
minReplicas: 2
maxReplicas: 10
metrics:
- type: Pods
pods:
metric:
name: http_requests_per_second
target:
type: AverageValue
averageValue: 100
- metric.name:自定义指标的名称(与 Prometheus Adapter 配置中的名称一致)。
- target.type:指标的目标类型,可以是 AverageValue 或 Value。
- target.averageValue:目标值,表示每个 Pod 的平均指标值。
使用以下命令创建 HPA:
kubectl apply -f custom-metric-hpa.yaml
3.4 验证 HPA
创建 HPA 后,可以通过以下命令查看 HPA 的状态:
kubectl get hpa
输出示例:
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
custom-metric-hpa Deployment/nginx-deployment 100/100 2 10 2 1m
- TARGETS:当前指标值与目标值的比率。
- REPLICAS:当前的 Pod 副本数。
4. 测试自定义指标的 HPA
4.1 增加负载
使用 kubectl run 创建一个临时的 Pod 来模拟负载:
kubectl run -i --tty load-generator --image=busybox --restart=Never -- /bin/sh -c "while true; do wget -q -O- http://nginx-deployment; done"
4.2 观察 HPA 变化
通过以下命令观察 HPA 的变化:
kubectl get hpa -w
当每秒请求数超过目标值(100)时,HPA 会自动增加 Pod 的副本数。
4.3 减少负载
停止负载生成 Pod:
kubectl delete pod load-generator
当负载降低后,HPA 会自动减少 Pod 的副本数。
5. 最佳实践
5.1 合理选择自定义指标
- 选择与业务需求密切相关的指标,例如 QPS、队列长度等。
- 避免选择过于频繁变化的指标,以免导致频繁扩缩容。
5.2 配置冷却时间
- 通过调整 HPA 的冷却时间,避免频繁扩缩容。
- 扩容冷却时间默认 3 分钟,缩容冷却时间默认 5 分钟。
5.3 监控 HPA 行为
- 使用 Prometheus 和 Grafana 监控 HPA 的行为,确保其按预期工作。
- 定期检查 HPA 的状态和日志,及时发现和解决问题。
6. 总结
通过自定义指标的 HPA,Kubernetes 可以根据业务需求动态调整 Pod 的副本数,从而实现更灵活的自动扩缩容。本文介绍了如何配置基于自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。