k8s 的監控
k8s 預設以及推薦的監控體系是它自己的一套東西:Heapster + cAdvisor + Influxdb + Grafana,具體可以看
這裡。
包括 k8s 自身的 HPA (Horizontal Pod Autoscaler),預設從 Heapster 中擷取資料 進行自動伸縮。(順便提一句,當你部署完 k8s 叢集之後,如果從 Dashboard 中看不到監控資料,往往就是因為你沒有部署 Heapster,或者網絡層有問題, Dashboard 無法通路 Heapster。)
那,這跟我們介紹的 Prometheus 有什麼關系?
首先,它們都是一套監控解決方案,而 k8s 沒有把 Prometheus 作為預設監控,是以,如果你想直接使用 HPA,你還是需要部署 Heapster。
其次,kubelet 中的 cAdvisor 其實是支援 Prometheus 作為存儲的後端的,隻是相對于 Prometheus 自己的 SD 解決方案來說,太弱了點。
最後,k8s 1.6 之後,在 annotations 中配置 custom metrics 的方式已經被移除了,而根據
Prometheus 的監控資料來進行自動伸縮還是很有可操作性的。
部署
其實部署很簡單,關鍵是配置,是以這裡着重介紹下,如何配置。
Relabel
首先,先來了解下,什麼是
relabel_config就如字面意思而言,它的作用是 Prometheus 抓取 metrics 之前,就将對象相關的 labels 重寫。下面是它幾個重要的 label:
- __address__:預設為 host:port,也是之後抓取之後 instance 的值;
- __scheme__:http or https ?;
- __metrics_path__:就是 metrics path,預設為 /metrics;
- __param_${name}:用來作為 URL parameter,比如 http://…/metrics?name=value;
- __meta_:這個開頭的配置都是 SD 相關的配置;
Kubernetes SD
其次,上次提到,我們可以用到 Service Discovery 這個功能,其中就包含
它包含四種角色:
- node
- service
- pod
- endpoints
由于篇幅所限,這裡隻是簡單介紹下其中的 node 還有 pod 角色:
- job_name: 'kubernetes-nodes'
scheme: https
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
kubernetes_sd_configs:
- role: node
relabel_configs:
# 即從 __meta_kubernetes_node_label_<labelname> 這個配置中取出 labelname 以及 value
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
# 配置 address 為 k8s api 的位址,相關的 ca 證書以及 token 在上面配置
- target_label: __address__
replacement: kubernetes.default.svc:443
# 取出所有的 node,然後設定 /api/v1/nodes/<node_name>/proxy/metrics 為 metrics path
- source_labels:
- __meta_kubernetes_node_name
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
接下來的這個 pod 角色挺重要:
- job_name: 'kubernetes-pods'
kubernetes_sd_configs:
- role: pod
relabel_configs:
- source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]
action: keep
regex: true
- source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]
action: replace
target_label: __metrics_path__
regex: (.+)
- source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
action: replace
regex: ([^:]+)(?::\d+)?;(\d+)
replacement: $1:$2
target_label: __address__
- action: labelmap
regex: __meta_kubernetes_pod_label_(.+)
- source_labels: [__meta_kubernetes_namespace]
action: replace
target_label: kubernetes_namespace
- source_labels: [__meta_kubernetes_pod_name]
action: replace
target_label: kubernetes_pod_name
在定義了這個角色之後,你隻要在你部署的應用 Pod 描述中,加入以下 annotations 就能讓 Prometheus 自動發現此 Pod 并采集監控資料了:
annotations:
prometheus.io/scrape: "true"
prometheus.io/port: "<your app port>"
其它詳細配置請看
https://blog.xizhibei.me/2017/08/19/deploy-prometheus-in-k8s/#Kubernetes-Deployment Kubernetes Deployment
最後,部署 Prometheus,需要注意的是,我們已經在 k8s 之外單獨部署了一套,為了統一處理,在這裡是打算作為中轉的。
apiVersion: v1
kind: ConfigMap
metadata:
name: prometheus
namespace: kube-system
labels:
app: prometheus
data:
prometheus.yml: |-
# 省略,在這裡定義你需要的配置
---
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
name: prometheus
namespace: kube-system
spec:
replicas: 1
template:
metadata:
labels:
app: prometheus
spec:
containers:
- name: prometheus
image: prom/prometheus:latest
args:
- '-config.file=/prometheus-data/prometheus.yml'
# 顯然,這裡沒有用 `Stateful Sets`,存儲時間不用太長
- '-storage.local.retention=48h0m0s'
ports:
- name: prometheus
containerPort: 9090
volumeMounts:
- name: data-volume
mountPath: /prometheus-data
volumes:
- name: data-volume
configMap:
name: prometheus
---
# 簡單處理,直接使用 NodePort 暴露服務,你也可以使用 Ingress
apiVersion: v1
kind: Service
metadata:
name: prometheus
namespace: kube-system
spec:
selector:
app: prometheus
ports:
- name: prometheus
protocol: TCP
port: 9090
nodePort: 30090
type: NodePort
Prometheus Federate
而在我們外部單獨的 Prometheus 中,需要配置
Federate,将 k8s 中 Prometheus 采集的 metrics 全部同步出來。
- job_name: 'federate'
scrape_interval: 15s
honor_labels: true
metrics_path: '/federate'
params:
'match[]':
- '{job=~".+"}' # 取 k8s 裡面部署的 Prometheus 中所有的 job 資料
static_configs:
- targets:
- '<k8s-node1>:30090'
- '<k8s-node2>:30090'
- '<k8s-node3>:30090'
本文轉自CSDN-
在 k8s 中部署 Prometheus