背景 通过监控看到弹性云用户平台后端程序kube-odin的内存使用量在稳定增加,每次上线完又会恢复,可以判断出kube-odin中存在内存泄
现象 线上程序一直报错,错误信息:lock failed: context deadline exceeded, retry 排查过程 异常对应代码位置 很明显的是获取锁超时了,由于用的etcd的分布式锁,就怀疑是etc
测试环境 10.0.13.19 部署harbor,单点,docker-compose的方式部署 4核8G 10.0.13.22 dragonfly的supernode节点 16核64G do
kubernetes设置 k8s 1.10之前需要在kube-apiserver、kube-controller-manager、kube-sche
看了一篇文章,里面涉及到了一些golang程序监控的问题,回过头总结了一下实现方式,简单介绍一下 expvar go自带的runtime包拥有各种功能,包
公司采用Prometheus来采集Kubernetes集群的性能指标数据,之前对性能数据采集这方面没有关注过,但是实际生产环境下有很多此类需