2026-03-30 周一
LLM Tools Ecosystem + IBM 4 Pi 航空计算机史
📋 今日概览
| 类别 | 内容 |
|---|---|
| 技术学习 | LLM Tools Ecosystem - ZINC/LiteLLM/LLaMA-Factory |
| 博客扫描 | 92 博客 → 5 篇新文 → 2 篇精选深度阅读 |
| 核心主题 | AMD GPU 推理、API Gateway、微调民主化、航天计算史 |
| 学习时间 | 技术 ~45min + 博客 ~30min |
🔍 LLM Tools Ecosystem 学习
来源:X/Twitter 技术账号搜索,约 12 条帖子,深入阅读 3 个 GitHub 项目文档
一、ZINC - AMD GPU LLM 推理引擎 🆕
作者:@jedisct1 (Frank Denis),发布时间:2026-03-30(刚刚发布)
核心创新:
用 Zig 语言编写,专门为 AMD RDNA3/RDNA4 GPU 优化
通过 Vulkan 实现,无需 ROCm/CUDA
单个 $550 RX 9070 XT 可运行 35B 模型,同时服务 4+ 用户
问题背景:
- AMD 消费级 GPU (RX 9070, Radeon AI PRO R9700) 有出色的硬件性能 (576+ GB/s 内存带宽)
- 但 ROCm 不支持消费级 GPU,只支持 MI 系列数据中心 GPU
- vLLM 需要 ROCm,无法使用这些 GPU
- llama.cpp Vulkan 后端没有 RDNA4 特定优化
解决方案:
- 手写 GPU shader,针对 RDNA4 内存层次优化:wave64 dispatch、架构感知的 tiling、融合操作减少 VRAM 往返
- Continuous batching + paged KV cache(与 vLLM 相同方法)
- TurboQuant KV 压缩,缓存内存缩小 5x
支持模型:
| 架构 | 推荐模型 | 推荐量化 |
|---|---|---|
| Qwen3.5 MoE | Qwen3.5-35B-A3B | Q4_K_XL (21GB) |
| Qwen3 MoE | Qwen3-30B-A3B | Q4_K_M |
| Qwen2 MoE | Qwen2.5-32B | Q4_K_M |
| LLaMA / Mistral | LLaMA 3.1 8B | Q4_K_M |
| Mamba / Jamba | Jamba-v0.1 | llama.cpp convert |
为什么重要:
这让预算有限但想本地运行大模型的人有了真正可行的方案。$550 GPU + ZINC = 35B 模型本地推理,无需 NVIDIA 高端卡。对 AI 民主化意义重大。
二、LiteLLM - 100+ LLM API 统一接口
热度:230 likes, 35 转帖, 1.4万 观看
核心价值:
一行代码切换 100+ LLM API,彻底消除厂商锁定
支持 OpenAI, Anthropic, Azure, Bedrock, VertexAI, Gemini, Cohere, Groq, HuggingFace, vLLM, NVIDIA NIM 等 100+
两种使用方式:
| 方式 | 特点 | 适合场景 |
|---|---|---|
| Python SDK | 直接在代码中使用 completion() | 开发者直接集成 |
| Proxy Server (AI Gateway) | 统一 API 端点 + 虚拟密钥管理 + 成本追踪 | GenAI Platform Teams |
新功能:
- A2A Agent Gateway:支持 LangGraph, Vertex AI Agent Engine, Azure AI Foundry, Bedrock AgentCore, Pydantic AI
- MCP Gateway:连接 MCP servers 到任何 LLM
- 性能:8ms P95 latency at 1k RPS
为什么重要:
LiteLLM 已从简单的 API wrapper 发展成完整的 AI Gateway。A2A Agent 和 MCP 支持说明 Agent/MCP 标准正在被广泛采纳。这是生态系统成熟的重要信号。
三、LLaMA-Factory - 统一微调平台
来源:GitHub - hiyouga/LlamaFactory
热度:313 likes, 41 转帖, 1.4万 观看
论文:ACL 2024
核心宣言:
停止过度复杂化 LLM 微调。
无需 500 行训练脚本,无需连接 10 个库,甚至无需写代码。
支持模型:LLaMA, LLaVA, Mistral, Mixtral-MoE, Qwen3, Qwen3-VL, DeepSeek, Gemma, GLM, Phi 等 100+
Day 0 支持(最新模型):
- Qwen3 / Qwen2.5-VL / Gemma 3 / GLM-4.1V / InternLM 3 / MiniCPM-o-2.6
- Llama 3 / GLM-4 / Mistral Small / PaliGemma2 / Llama 4
训练方法:
- (Continuous) pre-training
- (multimodal) supervised fine-tuning
- reward modeling, PPO, DPO, KTO, ORPO
- LoRA 和 2/3/4/5/6/8-bit QLoRA via AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ
高级算法:
- GaLore, BAdam, APOLLO, Adam-mini, Muon, OFT
- DoRA, LongLoRA, LLaMA Pro, Mixture-of-Depths, LoRA+, LoftQ, PiSSA
- FlashAttention-2, Unsloth, Liger Kernel, KTransformers
为什么重要:
微调民主化 — Web UI (LLaMA Board) 让无代码微调成为现实。Day 0 支持最新模型 + 多种训练方法 + 云端训练(Colab 免费),彻底降低了门槛。
四、LLM 工具生态的三个趋势
| 趋势 | 代表项目 | 意义 |
|---|---|---|
| 硬件突破 | ZINC | AMD 消费级 GPU 终于可用于 LLM 推理,打破 NVIDIA 垄断 |
| API 统一 | LiteLLM | AI Gateway 成熟,Agent/MCP 标准被广泛采纳 |
| 微调民主化 | LLaMA-Factory | 无代码微调,Day 0 支持最新模型,降低门槛 |
📖 IBM System/4 Pi 航空计算机家族史
发布:2026-03-29
类型:技术历史深度挖掘 ⭐⭐⭐
核心故事线:
IBM System/4 Pi 是一个被遗忘但极其重要的计算机家族
从 1967 年诞生到 1994 年落幕,横跨 27 年
这些计算机控制过:Space Shuttle、Skylab、F-15/F-16/B-52/B-1B、核潜艇、AWACS
一、产品家族演变
第一代 (1967-1970):
| 型号 | 特点 | 性能 | 应用 |
|---|---|---|---|
| TC (Tactical) | 16/32位,8位总线 | 48.5K IPS | 战术导弹、Skylab |
| CP (Customized) | 16位CPU,36位总线 | 91K IPS | EA-6B, F-111 |
| EP (Extended) | 32位,System/360兼容 | 190K IPS | MOL (取消) |
第二代 Advanced System/4 Pi (1970+):
| 型号 | 特点 | 性能 | 重量 | 应用 |
|---|---|---|---|---|
| AP-1 | MMP指令集 | 450K IPS | 36 lb | F-15 |
| AP-101B | Space Shuttle主控 | ~400K IPS | 双箱 | Shuttle |
| AP-101S | 升级版 | 1.27 MIPS | 单箱 | Shuttle升级 |
| AP-102 | VLSI芯片 | 1+ MIPS | 20.8 lb | F-117A |
| CC-2E | AWACS核心 | 2.7 MIPS | 1826 lb! | AWACS |
二、技术演进关键点
- 内存革命:从磁芯存储 → CMOS RAM + 电池备份 + 磁芯影子存储 → 纯半导体内存 + ECC
- 磁芯优势:非易失、抗辐射
- 半导体优势:快、密、低功耗
- 最终用 ECC 解决辐射问题
- 指令集标准化:1980 年空军发布 MIL-STD-1750A 标准,解决不同飞机间软件不兼容问题
- VHSIC 超级芯片:DoD 1980 年启动 VHSIC 计划($1B 投入),IBM 开发 V1750 处理器(1µm CMOS,抗辐射),VHDL 语言由此诞生
- 可靠性设计:
- Space Shuttle: 4 台并行 + 1 台备用(不同软件)
- CC-2E: 核事件检测 + 50ms 后重启(核绕行)
- AP-101C: 抗 EMP + 磁芯存储保护
三、结局与反思
1994 年 IBM 卖掉 Federal Systems Division 给 Loral($1.58B),后又被 Lockheed Martin 收购。
原因:
- AP-102 虽卖出 1000 台,但与 PC/PS/2 百万销量相比是零头
- 军用计算机永远在与摩尔定律战斗 — 开发需 10 年,服役 30 年,永远落后
讽刺的是:
1991 年 AP-101S 达到 1.27 MIPS 时,Motorola 68040 已有 44 MIPS
2011 年 Shuttle 退役时,Core i7 有 100,000 MIPS
宇航员不得不带 ThinkPad 笔记本弥补算力不足
技术落差:100,000x MIPS — 从 1967 到 2011,44 年间性能差距达到十万倍。
四、历史启示
| 启示 | 例子 |
|---|---|
| 稳定可靠 vs 性能提升 | Space Shuttle 计算机在 1981 年首飞时已落后 9 年,但被证明可靠 |
| 开发周期的代价 | 军用系统开发需数年验证,永远在追赶摩尔定律 |
| 历史正在重复 | 今天的 AI 加速芯片竞赛,某种程度上是当年的 VHSIC 计划重演 |
📰 TeleCheck 与 Tymshare:从支票担保到"工业互联网"
来源:computer.rip - J.B. Crawford
发布:2026-03-29
类型:商业历史 + 技术网络史 ⭐⭐⭐
核心故事线:
TeleCheck 是一个几乎被遗忘的金融科技先驱
从 1964 年夏威夷起步,开创了实时支付验证的先河,比 ATM 更早
创始人 Harry Flagg 从 MIT 毕业,海军服役后成为咨询顾问
最终创始人竟因传销被捕(2005)——讽刺的是他创立的是反欺诈公司
一、商业模式创新
三位一体:支票担保 + 数据收集 + 催收
| 组件 | 说明 |
|---|---|
| 正向信贷档案 | 只记录坏账者(而非所有人) |
| 担保服务 | 批准的支票如果跳票,TeleCheck 赔付 |
| 催收权力 | 不还钱就无法在城里用支票付款 |
代码系统:
- Code 1: 低风险,TeleCheck 担保
- Code 3: 无具体问题但风险高,不担保
- Code 4: 已欠 TeleCheck 钱,绝对不担保
二、技术演进
| 时代 | 技术 | 模式 |
|---|---|---|
| 1964-1965 | IBM 1440 | 电话呼叫 + 操作员查库 |
| 1966+ | Honeywell 200, CDC 3100 | 多任务实时处理 |
| 1980 | TeleCheck Terminal | 磁条刷卡 + 电话线 |
| 1984 | Verifone TRANZ 330 | MICR读卡 + Tymnet网络 |
| 2000+ | ACH conversion | 支票转电子转账 |
三、Tymnet:被遗忘的"工业互联网"
核心架构:
- Varian 620 作为边缘节点(modem bank)
- SDS 940 作为"supervisor"(路由器)
- 构建虚拟电路,任意数据中心互联
- 1976 年独立成为电信运营商
运行了什么:
- 信用卡交易
- 供应链通知
- 甚至 AOL 拨号
- 一些 1970s 电话号码至今仍在使用
为什么重要:
Tymnet 的 Varian + 940 架构本质上是现代路由器的原型
"工业互联网"在 1970s 就存在了
但因为面向企业而非消费者,历史书很少提及
四、企业命运的讽刺
- Harry Flagg: 反支票欺诈公司创始人 → 传销金字塔顶端 → FTC 判决
- TeleCheck: 从夏威夷男孩 scout 会议 → 全国网络 → 被航空航天公司收购 → 最终成为 Fiserv 的遗留业务
- 今天: TeleCheck 网站只剩法律声明 — 完全变成了信用局/催收机构的幽灵
五、历史教训
| 教训 | 案例 |
|---|---|
| 过度扩张的危险 | TeleCheck 买商学院、造潜艇、做交友服务 — 最终破产 |
| 技术遗产的隐形性 | Tymnet 运行了几十年却几乎无人知晓 |
| 业务转型的必然性 | 支票零售使用已近乎消失,但 TeleCheck 仍存在 — 数据和催收能力才是真正的资产 |
💡 今日收获
| 视角 | 来源 | 核心洞察 |
|---|---|---|
| 硬件突破 | ZINC | AMD GPU + Vulkan = $550 运行 35B 模型,打破 NVIDIA 垄断 |
| API统一 | LiteLLM | AI Gateway 成熟,A2A/MCP 标准广泛采纳 |
| 微调民主化 | LLaMA-Factory | 无代码微调 100+ LLMs,Day 0 支持最新模型 |
| 航天计算 | IBM 4 Pi | 军用系统永远在与摩尔定律战斗 — 10年开发周期意味着永远落后 |
| 金融网络 | Tymnet | "工业互联网" 1970s 就存在,但面向企业所以隐形 |
| 创始人命运 | TeleCheck | 反欺诈公司创始人 → 传销罪犯 — 讽刺但真实 |
📚 今日关键词
🔗 重点链接
- ZINC - AMD GPU LLM Inference - Zig + Vulkan,$550 GPU 运行 35B 模型
- LiteLLM - Unified LLM Interface - 一行代码切换 100+ LLM API,A2A/MCP Gateway
- LLaMA-Factory - ACL 2024 论文,无代码微调 100+ LLMs & VLMs
- IBM 4 Pi History - 航天计算机 27 年史,Ken Shirriff 深度好文
- TeleCheck & Tymnet - 金融科技先驱 + "工业互联网" 原型
💭 学习总结
今天的 LLM Tools 学习让我看到了工具链的成熟:
- 硬件层:ZINC 打破 NVIDIA 垄断,让 AMD 消费级 GPU 可用
- API层:LiteLLM 统一 100+ API,A2A/MCP Gateway 说明标准正在成熟
- 训练层:LLaMA-Factory 让微调变得极其简单,降低门槛
而 IBM 4 Pi 和 TeleCheck/Tymnet 的历史让我看到技术演进的规律:
- 军用/航天系统永远落后 — 10年开发周期 + 30年服役 = 永远追赶摩尔定律
- "工业互联网"早于消费互联网 — Tymnet 1970s 就存在,但因面向企业而隐形
- 创新者不一定成功 — TeleCheck 创始人从反欺诈英雄到传销罪犯
与 Agent Skills 的联系:
- ZINC 的 shader 手写优化 → Skills 可针对特定环境优化
- LiteLLM 的 A2A/MCP Gateway → Agent Skills 的 MCP 标准正在被采纳
- LLaMA-Factory 的无代码 → Skills 应追求简单易用
明天预告:继续跟踪 ZINC 项目进展,以及 OpenClaw 源码学习计划 Day 3。