【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

前言

前面 Kubernetes入门系列，我们学习了k8s的基础知识和简单用法，今天开始我们继续进一步学习，了解一些复杂和高级用法。本文我们学习pod水平自动扩缩容即hpa。

hpa全称是Horizontal Pod Autoscaler，可以基于CPU的利用率或其它指标自动伸缩replication controller、deployment和 replica set 中的 pod 数量。

我们可以根据标准应用系统的CPU等指标的周期性变化情况，通过HPA进行动态扩缩容以此来提高集群的资源利用率。

准备

hpa通过

，监控集群运行指标触发扩缩容的，使用前需要先确保metrics-server是可用状态。

minikube addons list

【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

观察metrics-server是否是可用状态，如果是disabled。则需要执行以下命令开启。

minikube addons enable metrics-server

此时执行kubectl top命令即可查看pod、node的cpu、memory的使用消耗情况。

如果想禁用metrics-server，disable即可

minikube addons disable metrics-server

启动应用并暴露服务

我们参考官方demo，使用PHP提供http服务，进行CPU密集型计算。观察CPU和pod自动扩缩容情况。

准备镜像

这里创建一个CPU密集型PHP脚本，并打成镜像。

也可以直接用我打好的镜像 registry.cn-hangzhou.aliyuncs.com/larswang/php-hpa:1.0，跳过这一步，直接看Deployment。

文件及源码地址见：

AloofJr

# Dockerfile
FROM php:7.4.6-apache
ADD index.php /var/www/html/index.php
RUN chmod a+rx index.php

// index.php
<?php
  $x = 0.0001;
  for ($i = 0; $i <= 1000000; $i++) {
    $x += sqrt($x);
  }
  echo "OK!";
?>

Deployment

apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-hpa-deployment
  labels:
    app: php-hpa
spec:
  replicas: 1
  selector:
    matchLabels:
      app: php-hpa
  template:
    metadata:
      labels:
        app: php-hpa
    spec:
      containers:
      - name: php-hpa
        image: registry.cn-hangzhou.aliyuncs.com/larswang/php-hpa:1.0
        ports:
        - containerPort: 80
        resources:
          requests:
            cpu: 200m

Service 暴露服务

apiVersion: v1
kind: Service
metadata:
  name: php-hpa-service
spec:
  type: ClusterIP
  selector:
    app: php-hpa
  ports:
    - port: 80

HPA

创建HPA

创建hpa设置pod扩缩最多和最少的数量以及执行扩缩容的条件。

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: php-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-hpa-deployment
  minReplicas: 1 #pod最小数量
  maxReplicas: 10 #pod最大数量
  targetCPUUtilizationPercentage: 10 #cpu使用率超过10%进行扩容，小于10%缩容

观察HPA运行情况

kubectl get hpa

可以看到以下指标

TARGETS：目前CPU使用率是0%，10%是我们设置的扩缩容阙值。

MINPODS：pod最小数量

MAXPODS：pod最大数量

REPLICAS：当前副本数，因为我们的cpu使用率是0%，当前副本数是1。

增加负载

我们使用busybox，不断的对php-hpa-service发起http调用，增加服务端压力。

# 使用busybox并进入容器
kubectl run  -i --rm  --tty load-generator --image=busybox /bin/sh

# 不断发起http请求
while true; do wget -q -O- http://php-hpa-service; done

查看hpa情况

cpu利用率143%了，此时REPLICAS还是1，再等一会儿

可以看到REPLICAS已经扩到了10个pod，cpu负载平均到了35%，虽然比我们配置的10%高，但是扩到了最多MAXPODS 10个，所以不会继续扩容了

降低负载

停掉load-generator发压，等几分钟（可以通过--horizontal-pod-autoscaler-downscale-stabilization设置缩容冷却时间，默认五分钟）。

可以看到REPLICAS缩到了1个pod。

总结

上面介绍了根据CPU利用率进行HPA的操作，其实在实际工作中，HPA是一个非常复杂的课题，因为影响应用运行状态的不单单是CPU，会和内存、ERROR数、线程数等多项指标相关。

在扩容时，还要考虑资源额度、数据库连接数等。

在缩容时则需要更小心了，要时刻关注应用的运行状态，是很容易引发容量故障的。

更复杂的还有，应用系统是否非标、是CPU密集型还是内存密集型应用、系统的流量变化周期、如何应对突发流量等等。

欢迎感兴趣或有实战经验的大神们来交流探讨。

文件用到的yaml配置可以在

找到。

【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

前言

准备

启动应用并暴露服务

准备镜像

Deployment

Service 暴露服务

HPA

创建HPA

观察HPA运行情况

增加负载

降低负载

总结

更多文章

继续阅读

Apache配置SSLApache配置SSL

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

MySQL的4种隔离级别？出现问题

配置apache支持PHP（win7）

ACS基本配置-权限等级管理

XX系统实施过程问题总结

无组件上传图片到数据库中，最完整解决方案

【MySQL数据库】数据库索引事务1.索引2.事务

neo4j之cypher使用文档

Cloud Studio初体验

NOSQL安全攻击

mybatis_入门程序Mybatis入门

php 去掉字符串的最后一个字符及截取原字符串1,2,3,4,5,6,

登录plsql 报错 the account is locked --用户被锁

php——水印

SequoiaDB巨杉数据库C++驱动概述