Full-stack Systems
在广联达负责成本测算等复杂 B/S 业务模块,从工程数据计算、WebSocket 流式回传到 SQL 与前端性能优化,积累端到端交付能力。
I build observable, production-oriented AI Agent systems.
我构建可观测、可调试、可工程化落地的 AI Agent 系统。 4 年研发经验,曾负责 MindStudio Insight 三大核心模块,现自主构建 LumiAgent。
我是一名面向 AI Agent 与 LLM 应用基础设施方向的工程师,关注如何让 Agent 不只是“能跑”,而是可观察、可调试、可评估、可持续迭代。
在广联达负责成本测算等复杂 B/S 业务模块,从工程数据计算、WebSocket 流式回传到 SQL 与前端性能优化,积累端到端交付能力。
负责 MindStudio Insight Timeline / Memory / Operator 三大模块,处理 GB 级 Profiling 数据解析与大规模可视化。
将性能调优工具中的可观测性思维迁移到 LumiAgent,围绕 Trace、Token、工具调用链、RAG 召回和评估闭环构建 Agent 框架。
用 6 个能力面支撑 AI Agent / LLM 应用工程师定位:框架、可观测性、RAG、工具、大模型性能和全栈交付。
熟悉 ReAct、Plan-and-Execute、Reflection 等 Agent 范式,并在 LumiAgent 中实践 Agent Core、Memory、Tool Layer 与 LLM Router。
受 MindStudio Insight 性能可视化经验启发,关注 Agent 执行过程中的 Trace、Token、工具调用链、失败回退与评估闭环。
掌握 Loader、Splitter、Embedding、ChromaDB、Reranker、Context Builder 等 RAG 工程链路,关注召回质量与端到端效果评估。
熟悉 Function Calling、Tool Use 与 MCP 工具接入,关注工具热插拔、权限边界、失败处理和调用链追踪。
理解大模型训练/推理中的算子分布、KV Cache、Prefill / Decode 阶段耗时,可迁移至 LLM 应用延迟分析。
具备 Python、C++、TypeScript、React、WebSocket、JupyterLab Extension 等全栈能力,能独立完成工具型产品交付。
内置可观测性的轻量级开源 Agent 框架
很多 Agent Demo 只能证明“能跑”,却很难解释执行过程中发生了什么:为什么调用这个工具?Token 花在哪里?RAG 是否召回正确?失败后如何回退?LumiAgent 的目标是让 Agent 可观察、可调试、可评估、可持续优化。
从平台接入到 RAG 全链路,每层职责单一可独立替换
回答质量 / 工具准确率 / RAG 召回 / 记忆一致性 / 安全 / 延迟
符合协议的工具服务可热插拔接入 Agent 执行链
OpenAI / Anthropic / DeepSeek 等 Provider 的路由与故障转移
首页只突出 LumiAgent、MindStudio Insight 与 JupyterLab Extension,其他项目作为工程能力补充。
Observable AI Agent Framework
多平台 AI Agent 框架,6 层分层架构,受 MindStudio Insight 启发把 Tracing / Token / 失败回退当一等公民。
Large-scale AI Profiling Visualization Tool
MindStudio Insight 大模型性能调优工具。我作为 Timeline / Memory / Operator 三大模块 Owner,覆盖算子时序、显存占用、算子耗时可视化。
Remote AI Profiling in Jupyter
作为唯一贡献者独立完成 JupyterLab 插件形态,让算法工程师在远程训练服务器上无需本地 GUI 即可查看性能数据。
时间轴 · 4 年研发,从 NLP 到性能调优工具到 Agent 框架。
MindStudio Insight · 源码 — 面向 AI 开发全流程的可视化性能调优工具,帮助开发者定位大模型训练/推理过程中的性能瓶颈。
成本测算 / 收支通 — 轻量级工程 ERP 平台核心业务模块的全栈研发与性能优化。
灯塔 NLP 算法平台 — 集团公共数据分析平台的算法接口研发,早期 NLP 经验为后续转向 LLM/Agent 奠定基础。
这些文章是网站的技术深度入口,用来支撑面试中关于 Agent 工程化、框架取舍和性能优化的追问。
从 MindStudio Insight 到 LumiAgent:Agent 系统除了日志和接口耗时,还需要观察 Prompt、Token、思考步骤、工具调用链和 RAG 召回。
拆解 Platform Adapter、Agent Core、LLM Router、MCP Bridge、RAG Layer、Evaluator 与 Trace 的设计取舍。
从抽象层级、状态管理、RAG、Tool Calling、可观测性和生产落地复杂度对比主流框架。
对 AI Agent 工程化、可观测性与 LLM 应用基础设施感兴趣的团队,欢迎来聊。
请复制邮箱联系我;如需完整简历,可在邮件中说明来意。
查看开源项目与代码活动。
期望职位:AI Agent 应用开发工程师 / LLM 应用工程师 · 期望城市:杭州