路灯
To be free and unafraid
精选文章
按住 Shift 横向滚动
大模型应用开发学习:智能客服 & RAG 知识库为案例

大模型应用开发学习:智能客服 & RAG 知识库为案例

1. 为什么 Java 开发者需要了解 AI 工程 很多同学觉得 AI 是算法工程师的事,Java 开发者只需要"调 API"就行了。这个认知在 2023 年之前是对的,但现在已经不够用了。 现实情况是:LLM API 调用只是最简单的部分,真正让 AI 功能稳定运行在生产环境,需要解决一系列纯工程

RAG垂直知识库+AI智能客服项目

RAG垂直知识库+AI智能客服项目

Q1:从0到1的搭建AIGC 智能客服系统 业务场景 趣玩搭平台日活1000+、日订单500+,用户咨询主要集中在三类问题:活动规则(时间地点人数变更)、退票退款流程、会员积分权益。之前靠2个客服人工回复,高峰期(周五晚到周日)响应经常超过10分钟,用户投诉率比较高。老板要求把重复性问题交给AI,人

从 Function Calling 到 MCP:企业级 AI 智能体的工具调用架构与 Fallback 策略

从 Function Calling 到 MCP:企业级 AI 智能体的工具调用架构与 Fallback 策略

在趣玩搭平台中,我基于 Spring AI 开发了一个"AI 主理人"智能体,它不仅能回答问题,还能实际操作业务系统——查订单、退款、改活动信息。本文记录 Tool Calling 和 MCP 的落地实践,以及工具调用失败时的 Fallback 设计。 一、业务需求:从"会聊天"到"会干活"

关键技术方案:抢票秒杀、门票候补与钱包对账

关键技术方案:抢票秒杀、门票候补与钱包对账

一、抢票秒杀方案 1.1 业务挑战 热门活动上架瞬间(跨年露营、音乐节等)可能产生数千并发抢票请求。核心矛盾是:高并发下防止超卖、保证库存一致性、用户体验流畅不卡顿。 这三个目标天然存在冲突——强一致性意味着串行化,串行化意味着慢。我们的策略是用五层防线逐层削峰,把真正打到核心库存操作上的请求量降低

知识库 5 分钟同步生效:文档增量更新、向量热替换与版本回滚的工程实现

知识库 5 分钟同步生效:文档增量更新、向量热替换与版本回滚的工程实现

运营同事改了一条退款政策,5 分钟后智能客服就能按新政策回答用户。这个"5 分钟"背后不是简单的全量重建,而是一套增量更新 + 向量热替换的工程方案。 一、为什么"5 分钟"很重要 1.1 业务驱动 趣玩搭作为一个社交活动平台,业务规则变更非常频繁。运营团队

大模型回答准确率从 65% 到 95%:评估数据集构建与量化指标体系

大模型回答准确率从 65% 到 95%:评估数据集构建与量化指标体系

"准确率提升了 30 个百分点"——这个数字不是拍脑袋说的,背后有一套完整的评估方法。本文记录趣玩搭智能客服的评估数据集是怎么构建的、用了哪些指标、以及如何通过评估驱动 RAG 系统的持续优化。 一、为什么必须建立评估体系 1.1 没有评估的窘境</

从零搭建企业级 RAG 系统:文档切分、Embedding 选型到检索重排的全链路实践

从零搭建企业级 RAG 系统:文档切分、Embedding 选型到检索重排的全链路实践

在趣玩搭社交平台中,我基于 Spring AI + Milvus 构建了一套垂直领域的 RAG(检索增强生成)知识库系统,用于支撑 AIGC 智能客服的精准问答。本文记录 RAG Pipeline 每个环节的设计决策——不是照搬论文的理论最优解,而是在 20 人初创团队、月均 AI 预算 8000