2026年3月

从点状工具到体系协同：一套运维体系化建设思路

作者: Stone
时间: 2026-03-16
分类: 筑码
暂无评论

很多团队在运维建设早期，往往都是“先把工具装起来”：日志上 ELK，可视化上 Grafana，指标监控上 Zabbix，网络流量用 sFlow，配置备份交给 Oxidized，资产管理再补一个 NetBox。单看每个工具都没问题，但真正到了线上，最常见的问题反而不是“工具不够多”，而是这些工具彼此之间没有形成闭环。

体系化建设的关键，不是再继续加工具，而是先回答清楚三个问题：什么是权威数据源，什么负责实时观测，什么负责变更留痕。只有资产、日志、指标、流量、配置和告警被串成一条统一链路，运维平台才会从“工具集合”变成“可持续运转的系统”。

阅读剩余部分

用 Oxidized 自动备份网络设备配置文件

作者: Stone
时间: 2026-03-15
分类: 筑码
暂无评论

网络设备的配置备份，最怕的不是“没有工具”，而是设备数量慢慢变多以后，备份动作开始依赖人工记忆：有人改了交换机配置却忘了留档，有人调了防火墙策略却没有版本记录，真到回滚和排障的时候，才发现手上没有一份可信的基线。

Oxidized 这类工具的价值，就在于把这件事做成一条自动化流水线：定时登录设备、抓取 running-config、检测变更、写入 Git 仓库，并通过 Web 界面或 API 做统一查看。对中小规模网络来说，它足够轻，落地成本也很低。

阅读剩余部分

用 Nginx 给 vLLM 做动态负载均衡

作者: Stone
时间: 2026-03-14
分类: 筑码
暂无评论

在多台 vLLM 推理节点同时提供服务时，最直接的做法通常是先在前面放一层 Nginx 做转发，再由上游节点共同承接请求。

但如果只是静态轮询，实际效果往往并不理想。因为大模型服务的负载并不均匀，某一台节点可能已经接近 KV Cache 极限、出现等待队列，甚至开始发生 preemption，而另一台节点却还比较空闲。这个时候，负载均衡如果不能感知后端状态，就容易把请求继续打到“已经很忙”的节点上。

阅读剩余部分

在本地部署 MiniMax 大模型服务

作者: Stone
时间: 2026-03-14
分类: 筑码
暂无评论

这篇文章记录的是在本地 GPU 服务器上部署 MiniMax 大模型服务的一套实践流程，目标是把模型稳定跑起来，并以 OpenAI 兼容接口的方式提供调用能力。

整体过程包括模型下载、运行环境准备、systemd 托管、接口验证，以及用 vLLM 自带工具做一轮基础压测。重点不在概念，而在于把一套可复用的部署链路整理清楚。

阅读剩余部分

2026年3月

从点状工具到体系协同：一套运维体系化建设思路

用 Oxidized 自动备份网络设备配置文件

用 Nginx 给 vLLM 做动态负载均衡

在本地部署 MiniMax 大模型服务

最新文章

分类

归档