Stone 发布的文章

前面整理这套 vLLM 私有源部署方案时,我把重点放在了思路复盘上。这次换个更直接的版本:不改原始脚本文件,只做脱敏,把服务端部署脚本和客户端部署脚本的可公开版本贴出来,方便自己归档,也方便后续复用。

先说明一下边界:仓库里的原始脚本我没有修改,这篇文章里的代码块是单独整理出来的脱敏版本。处理方式主要是把内网 IP、固定端口、默认账号、硬编码 API Key 以及过于贴近生产环境的目录替换成占位写法,保留脚本结构和部署逻辑。

阅读剩余部分

前段时间接连看了几部和山有关的片子,心里一直没有完全平下来。Free Solo登山家珠峰女王,还有关于泰国洞穴救援的纪录片,它们拍的并不是同一种人,也不是同一种处境,可看完之后,心里总会被同一种东西反复碰到。

那不是单纯的壮观,也不只是危险,而是一种人在边界处显露出来的样子。到那种地方以后,很多平时被语言包裹得很厚的东西都会突然变得非常直接:恐惧是真实的,判断是真实的,体能是真实的,人与人之间的信任也是真实的。山从来不负责解释什么,但它会把人身上那些最软和最硬的部分,一起照出来。

阅读剩余部分

这些年慢慢觉得,很多人嘴里讲“禅”和“道”,其实讲到最后,常常都只剩下两个方向:一个是把它说得太玄,一个是把它说得太满。好像一旦提到这些字眼,就非得离日常很远,离烟火很远,离人的真实处境也很远。

可我越来越觉得,真正有用的东西,往往不会离生活太远。它未必能替人解决问题,却会悄悄改变人看问题的方式。禅也好,道也好,若最后不能落回一顿饭、一段路、一场沉默、一次起心动念,那多半只是概念,不是体会。

阅读剩余部分

很多人用 AI coding 一段时间之后,都会遇到同一个问题:刚开始很好用,但项目一复杂、上下文一长、对话一断开,体验就迅速下滑。模型并不是突然变笨了,而是项目本身没有把“该知道的事情”沉淀下来,导致每次协作都像重新开工。

所以,AI coding 真正要解决的,不只是提示词怎么写,而是怎样把项目知识、约束、流程和工具组织进仓库里,让 AI 不再严重依赖即时上下文。换句话说,重点不是“如何喂更多上下文”,而是“如何让项目自己带着上下文”。

阅读剩余部分

很多团队在谈 AI Agent 落地时,最先想到的往往是“接一个大模型,再连几个工具”。但真正做进本地环境以后,很快就会发现问题不在于模型会不会回答,而在于这套系统能不能接进真实工作流:能不能接 IM,能不能调本地工具,能不能访问内网资源,能不能区分开发、测试、生产环境,能不能把动作和审计收进现有运维体系。

所以,本地化 AI Agent 建设真正要解决的,不是“让模型更像人”,而是把模型、工具、上下文、权限、执行和观测拼成一条可持续运行的链路。只有当 Agent 能稳定接入模型服务、MCP、技能包、工具包和企业内部平台,它才会从一个 Demo 变成一套基础设施。

阅读剩余部分