路灯
To be free and unafraid
精选文章
按住 Shift 横向滚动
K8S 生产环境实战:滚动更新零停机、一键回滚与 CrashLoopBackOff 排查手册

K8S 生产环境实战:滚动更新零停机、一键回滚与 CrashLoopBackOff 排查手册

在凯泵智联(KiCloud)项目中,我们将微服务从 Docker Compose 迁移到了 Kubernetes 集群。本文记录生产环境中的部署策略设计、一次真实的回滚操作,以及 CrashLoopBackOff 排查的系统方法论。 一、从 Docker Compose 到 K8S 1.1 迁移动机

工业物联网时序数据库选型实战:同一团队为什么在两个项目中选了不同的数据库

工业物联网时序数据库选型实战:同一团队为什么在两个项目中选了不同的数据库

凯士比数字工厂(KiPlant)用了 TDEngine,凯泵智联(KiCloud)用了 TrendDB。不是随便选的,也不是"哪个新用哪个"——两个项目的数据特征和业务需求有本质差异,选型过程中的每一个权衡都值得记录。 一、两个项目的数据画像 在做选型之前,我先梳理了两个项目的数据特征,这是选型决策

从零搭建工业级监控告警体系:告警规则设计、分级策略与告警风暴治理

从零搭建工业级监控告警体系:告警规则设计、分级策略与告警风暴治理

在凯泵智联(KiCloud)云平台中,我搭建了 Prometheus + Alertmanager + Grafana 的全链路监控告警体系,覆盖了 120+ 企业客户的设备监控服务。本文记录告警规则怎么设计才不会"狼来了"、分级策略怎么让值班人员不崩溃、以及告警风暴的工程化治理方案。 一、为什么要