「译文」什么是 SRE(站点可靠性工程师)?SRE 是做什么的? 什么是SRE(站点可靠性工程师)?SRE是做什么的? 2022-10-11 Observability #DevOps #译文 #Monitoring #Observability #SRE #云 #SLA #SLO #SLI
七步成诗 - 快速创建有效 SLO 之前的文章介绍了一些常用的各类 SLO, 但是在实际制定 SLO 过程中,并不一定适合实际业务需求。本次介绍如何 7 步创建有效的 SLO 2022-10-11 Observability #Monitoring #公有云 #Observability #云 #SLA #SLO #SLI #云计算
K8s 如何启用 cgroup2 支持? K8s 1.25 版本以后 cgroup2 特性正式 GA, 那么如何启用cgroup2支持? 2022-10-10 CloudNative #K8S #最佳实践 #容器 #Pod #containerd #cgroup2
Containerd 如何配置 Proxy? containerd 如何配置 proxy 或 如何通过代理 pull 镜像? 2022-10-10 CloudNative #K8S #最佳实践 #proxy #容器 #Pod #containerd #镜像
K8S Pod Sidecar 应用场景之一 - 加入 NGINX Sidecar 做反代和 web 服务器 K8S Pod Sidecar 应用场景之一-加入 NGINX Sidecar 做反代和 web 服务器 2022-10-08 CloudNative #Nginx #K8S #最佳实践 #proxy #容器 #Pod #web #Sidecar
如何通过 kubectl 进入 node shell 如何通过 kubectl 进入 node shell? 本质上是利用容器(runC)的弱隔离(共享内核,Cgruop 等实现进程隔离)实现的权限逃逸。 2022-10-03 CloudNative #K8S #安全 #容器 #Linux #CLI #实用工具 #krew #Lens #kubectl
Prometheus 性能调优 - 水平分片 Prometheus 性能调优专题 - 水平分片,当 targets 过多导致样本量巨大,但是我又不想直接放弃监控这些 targets,就可以采用水平分片的方式进行性能调优。 2022-10-03 Observability #K8S #CloudNative #Monitoring #Observability #Grafana #Prometheus #性能调优 #troubleshooting
Prometheus AlertManager 生产实践 - 直接根据 to_email label 发 alert 到对应邮箱 用过 Prometheus Alertmanager 的都知道,正常的 AlertManager 处理告警,是要经过 Alerts -> Route -> Receivers 这么一个步骤的。假如我在 Alerts 里自带收件人信息(如邮箱),能不能直接使用?可以!通过模板实现这个需求。Let's GO! 2022-10-03 Observability #K8S #CloudNative #Monitoring #Observability #Prometheus #AlertManager #Template
如何精简 Prometheus 的指标和存储占用 随着 Prometheus 监控的监控项越来越多,Prometheus 的性能会有一定程度的下降,存储占用也会越来越多。如何根据实际的使用情况精简 Prometheus 的指标和存储占用? 2022-09-22 Observability #K8S #CloudNative #Monitoring #Observability #最佳实践 #Operator #Grafana #Prometheus #Mimir #性能优化
通过 Traefik Hub 暴露家里的网络服务 Traefik 近期新出了一个叫做 Traefik Hub 的边缘网关 SaaS 服务,很有意思。可以很轻松地把家里位于 nat 后面的 IP 地址和服务暴露出来。今天刚试了下把 NAS UI 和 Jellyfin 暴露出来,效果不错。👍️👍️👍️ 2022-09-19 CloudNative #K8S #安全 #https #K3S #IoT #Edge #Traefik