路灯
To be free and unafraid
精选文章
按住 Shift 横向滚动
synchronized 与 ReentrantLock:从原理到实战选型的深度总结

synchronized 与 ReentrantLock:从原理到实战选型的深度总结

本文结合社交平台高并发抢票与工业物联网设备监控两个真实项目,聊聊这两把锁到底该怎么选。 一、问题的起点 在做兴趣社交平台"趣玩搭"的高并发抢票模块时,热门活动上线瞬间会涌入数千并发请求争抢有限名额;而在此前的凯泵智联项目中,设备状态数据会被监控采集线程、诊断分析线程、大屏展示线程同时读写。两个场景都

一次 Full GC 引发的生产事故:从定位到根治的 JVM 调优全记录

一次 Full GC 引发的生产事故:从定位到根治的 JVM 调优全记录

记录在工业数字工厂项目中,一次周期性接口延迟的排查过程,涵盖问题发现、工具使用、根因分析和最终方案。 一、故障现象 1.1 背景 我所负责的凯士比数字工厂(KiPlant)是一个覆盖生产全流程的 SaaS 平台,基于 Spring Cloud Alibaba 构建。其中的 APS(高级计划排程)模块

APS 生产计划、三维工厂孪生体与设备 TPM 闭环管理

APS 生产计划、三维工厂孪生体与设备 TPM 闭环管理

一、APS 生产计划模块的痛点与落地 1. 当时的业务痛点 KiPlant 的客户是中小制造企业,排产方式普遍很原始。具体痛点有三个: 痛点一:Excel排产,响应滞后。 大部分工厂的生产计划员用 Excel 手动排产,一条产线几十道工序、十几台设备,排一份周计划要半天。更大的问

KiPlant 智慧工厂数字孪生平台——微服务架构搭建与多租户慢SQL治理

KiPlant 智慧工厂数字孪生平台——微服务架构搭建与多租户慢SQL治理

一、项目背景与当时的痛点 1. 业务背景 KiPlant 是一个面向制造业的 SaaS 化数字孪生平台,核心功能是把工厂的产线设备、生产计划、工单执行、质量检测等数据实时汇聚,通过数字孪生体可视化呈现,帮助工厂管理层做 OEE(设备综合效率)分析和生产决策。客户是中小型制造企业,一个平台实例要同时承

KiCloud SaaS 可用性保障——线程池隔离、限流降级与 MTTR 闭环机制

KiCloud SaaS 可用性保障——线程池隔离、限流降级与 MTTR 闭环机制

一、单设备影响线程池的雪崩场景 1. 故障还原 上线后第三周遇到的一次真实事故。某化工客户的一台离心泵的振动传感器固件出了 bug,正常情况下每秒上报 2 条数据,故障后变成了每秒上报 200 条——相当于单台设备的数据量暴增了 100 倍。 这台设备的数据进入 device-monitor 服务后

KiCloud 凯泵智联——云平台监控体系、振动分析与销售瞭望台

KiCloud 凯泵智联——云平台监控体系、振动分析与销售瞭望台

一、项目背景与我的角色 1. 业务背景 KiCloud 是凯泵集团的工业设备智联云平台,核心客户是使用凯泵泵类设备(离心泵、往复泵、螺杆泵等)的企业。这些泵广泛用于石油化工、水处理、矿业等场景,设备分散在全国各地的客户工厂里。凯泵需要一个云平台来远程监测这些设备的运行状态,提供预防性维护服务,同时支

一台故障设备拖垮整个平台:SaaS 系统中"线程池雪崩"的排查与根治

一台故障设备拖垮整个平台:SaaS 系统中"线程池雪崩"的排查与根治

在凯泵智联(KiCloud)项目中,一台客户设备的异常响应,差点让整个 SaaS 平台瘫痪。这篇文章记录从故障发现、根因分析到"限流+降级+削峰"组合方案的完整过程。 一、故障现场 1.1 背景 凯泵智联是一个面向旋转类设备的远程监测与运维管理云平台,服务 120+ 家企业客户。系统通过 RESTf