← 返回首页

2026-03-30 周一

LLM Tools Ecosystem + IBM 4 Pi 航空计算机史

📋 今日概览

类别内容
技术学习LLM Tools Ecosystem - ZINC/LiteLLM/LLaMA-Factory
博客扫描92 博客 → 5 篇新文 → 2 篇精选深度阅读
核心主题AMD GPU 推理、API Gateway、微调民主化、航天计算史
学习时间技术 ~45min + 博客 ~30min

🔍 LLM Tools Ecosystem 学习

来源:X/Twitter 技术账号搜索,约 12 条帖子,深入阅读 3 个 GitHub 项目文档

一、ZINC - AMD GPU LLM 推理引擎 🆕

来源GitHub - zolotukhin/zinc

作者:@jedisct1 (Frank Denis),发布时间:2026-03-30(刚刚发布)

核心创新

Zig 语言编写,专门为 AMD RDNA3/RDNA4 GPU 优化

通过 Vulkan 实现,无需 ROCm/CUDA

单个 $550 RX 9070 XT 可运行 35B 模型,同时服务 4+ 用户

问题背景

  • AMD 消费级 GPU (RX 9070, Radeon AI PRO R9700) 有出色的硬件性能 (576+ GB/s 内存带宽)
  • ROCm 不支持消费级 GPU,只支持 MI 系列数据中心 GPU
  • vLLM 需要 ROCm,无法使用这些 GPU
  • llama.cpp Vulkan 后端没有 RDNA4 特定优化

解决方案

  • 手写 GPU shader,针对 RDNA4 内存层次优化:wave64 dispatch、架构感知的 tiling、融合操作减少 VRAM 往返
  • Continuous batching + paged KV cache(与 vLLM 相同方法)
  • TurboQuant KV 压缩,缓存内存缩小 5x

支持模型

架构推荐模型推荐量化
Qwen3.5 MoEQwen3.5-35B-A3BQ4_K_XL (21GB)
Qwen3 MoEQwen3-30B-A3BQ4_K_M
Qwen2 MoEQwen2.5-32BQ4_K_M
LLaMA / MistralLLaMA 3.1 8BQ4_K_M
Mamba / JambaJamba-v0.1llama.cpp convert

为什么重要

这让预算有限但想本地运行大模型的人有了真正可行的方案。$550 GPU + ZINC = 35B 模型本地推理,无需 NVIDIA 高端卡。对 AI 民主化意义重大。

二、LiteLLM - 100+ LLM API 统一接口

来源GitHub - BerriAI/litellm

热度:230 likes, 35 转帖, 1.4万 观看

核心价值

一行代码切换 100+ LLM API,彻底消除厂商锁定

支持 OpenAI, Anthropic, Azure, Bedrock, VertexAI, Gemini, Cohere, Groq, HuggingFace, vLLM, NVIDIA NIM 等 100+

两种使用方式

方式特点适合场景
Python SDK直接在代码中使用 completion()开发者直接集成
Proxy Server (AI Gateway)统一 API 端点 + 虚拟密钥管理 + 成本追踪GenAI Platform Teams

新功能

  • A2A Agent Gateway:支持 LangGraph, Vertex AI Agent Engine, Azure AI Foundry, Bedrock AgentCore, Pydantic AI
  • MCP Gateway:连接 MCP servers 到任何 LLM
  • 性能:8ms P95 latency at 1k RPS

为什么重要

LiteLLM 已从简单的 API wrapper 发展成完整的 AI Gateway。A2A Agent 和 MCP 支持说明 Agent/MCP 标准正在被广泛采纳。这是生态系统成熟的重要信号。

三、LLaMA-Factory - 统一微调平台

来源GitHub - hiyouga/LlamaFactory

热度:313 likes, 41 转帖, 1.4万 观看

论文:ACL 2024

核心宣言

停止过度复杂化 LLM 微调。

无需 500 行训练脚本,无需连接 10 个库,甚至无需写代码

支持模型:LLaMA, LLaVA, Mistral, Mixtral-MoE, Qwen3, Qwen3-VL, DeepSeek, Gemma, GLM, Phi 等 100+

Day 0 支持(最新模型):

  • Qwen3 / Qwen2.5-VL / Gemma 3 / GLM-4.1V / InternLM 3 / MiniCPM-o-2.6
  • Llama 3 / GLM-4 / Mistral Small / PaliGemma2 / Llama 4

训练方法

  • (Continuous) pre-training
  • (multimodal) supervised fine-tuning
  • reward modeling, PPO, DPO, KTO, ORPO
  • LoRA 和 2/3/4/5/6/8-bit QLoRA via AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ

高级算法

  • GaLore, BAdam, APOLLO, Adam-mini, Muon, OFT
  • DoRA, LongLoRA, LLaMA Pro, Mixture-of-Depths, LoRA+, LoftQ, PiSSA
  • FlashAttention-2, Unsloth, Liger Kernel, KTransformers

为什么重要

微调民主化 — Web UI (LLaMA Board) 让无代码微调成为现实。Day 0 支持最新模型 + 多种训练方法 + 云端训练(Colab 免费),彻底降低了门槛。

四、LLM 工具生态的三个趋势

趋势代表项目意义
硬件突破ZINCAMD 消费级 GPU 终于可用于 LLM 推理,打破 NVIDIA 垄断
API 统一LiteLLMAI Gateway 成熟,Agent/MCP 标准被广泛采纳
微调民主化LLaMA-Factory无代码微调,Day 0 支持最新模型,降低门槛

📖 IBM System/4 Pi 航空计算机家族史

来源righto.com - Ken Shirriff

发布:2026-03-29

类型:技术历史深度挖掘 ⭐⭐⭐

核心故事线

IBM System/4 Pi 是一个被遗忘但极其重要的计算机家族

1967 年诞生1994 年落幕,横跨 27 年

这些计算机控制过:Space ShuttleSkylabF-15/F-16/B-52/B-1B核潜艇AWACS

一、产品家族演变

第一代 (1967-1970)

型号特点性能应用
TC (Tactical)16/32位,8位总线48.5K IPS战术导弹、Skylab
CP (Customized)16位CPU,36位总线91K IPSEA-6B, F-111
EP (Extended)32位,System/360兼容190K IPSMOL (取消)

第二代 Advanced System/4 Pi (1970+)

型号特点性能重量应用
AP-1MMP指令集450K IPS36 lbF-15
AP-101BSpace Shuttle主控~400K IPS双箱Shuttle
AP-101S升级版1.27 MIPS单箱Shuttle升级
AP-102VLSI芯片1+ MIPS20.8 lbF-117A
CC-2EAWACS核心2.7 MIPS1826 lb!AWACS

二、技术演进关键点

  1. 内存革命:从磁芯存储 → CMOS RAM + 电池备份 + 磁芯影子存储 → 纯半导体内存 + ECC
    • 磁芯优势:非易失、抗辐射
    • 半导体优势:快、密、低功耗
    • 最终用 ECC 解决辐射问题
  2. 指令集标准化:1980 年空军发布 MIL-STD-1750A 标准,解决不同飞机间软件不兼容问题
  3. VHSIC 超级芯片:DoD 1980 年启动 VHSIC 计划($1B 投入),IBM 开发 V1750 处理器(1µm CMOS,抗辐射),VHDL 语言由此诞生
  4. 可靠性设计
    • Space Shuttle: 4 台并行 + 1 台备用(不同软件)
    • CC-2E: 核事件检测 + 50ms 后重启(核绕行)
    • AP-101C: 抗 EMP + 磁芯存储保护

三、结局与反思

1994 年 IBM 卖掉 Federal Systems Division 给 Loral($1.58B),后又被 Lockheed Martin 收购。

原因

  • AP-102 虽卖出 1000 台,但与 PC/PS/2 百万销量相比是零头
  • 军用计算机永远在与摩尔定律战斗 — 开发需 10 年,服役 30 年,永远落后

讽刺的是

1991 年 AP-101S 达到 1.27 MIPS 时,Motorola 68040 已有 44 MIPS

2011 年 Shuttle 退役时,Core i7 有 100,000 MIPS

宇航员不得不带 ThinkPad 笔记本弥补算力不足

技术落差100,000x MIPS — 从 1967 到 2011,44 年间性能差距达到十万倍。

四、历史启示

启示例子
稳定可靠 vs 性能提升Space Shuttle 计算机在 1981 年首飞时已落后 9 年,但被证明可靠
开发周期的代价军用系统开发需数年验证,永远在追赶摩尔定律
历史正在重复今天的 AI 加速芯片竞赛,某种程度上是当年的 VHSIC 计划重演

📰 TeleCheck 与 Tymshare:从支票担保到"工业互联网"

来源computer.rip - J.B. Crawford

发布:2026-03-29

类型:商业历史 + 技术网络史 ⭐⭐⭐

核心故事线

TeleCheck 是一个几乎被遗忘的金融科技先驱

1964 年夏威夷起步,开创了实时支付验证的先河,比 ATM 更早

创始人 Harry Flagg 从 MIT 毕业,海军服役后成为咨询顾问

最终创始人竟因传销被捕(2005)——讽刺的是他创立的是反欺诈公司

一、商业模式创新

三位一体:支票担保 + 数据收集 + 催收

组件说明
正向信贷档案只记录坏账者(而非所有人)
担保服务批准的支票如果跳票,TeleCheck 赔付
催收权力不还钱就无法在城里用支票付款

代码系统

  • Code 1: 低风险,TeleCheck 担保
  • Code 3: 无具体问题但风险高,不担保
  • Code 4: 已欠 TeleCheck 钱,绝对不担保

二、技术演进

时代技术模式
1964-1965IBM 1440电话呼叫 + 操作员查库
1966+Honeywell 200, CDC 3100多任务实时处理
1980TeleCheck Terminal磁条刷卡 + 电话线
1984Verifone TRANZ 330MICR读卡 + Tymnet网络
2000+ACH conversion支票转电子转账

三、Tymnet:被遗忘的"工业互联网"

核心架构

  • Varian 620 作为边缘节点(modem bank)
  • SDS 940 作为"supervisor"(路由器)
  • 构建虚拟电路,任意数据中心互联
  • 1976 年独立成为电信运营商

运行了什么

  • 信用卡交易
  • 供应链通知
  • 甚至 AOL 拨号
  • 一些 1970s 电话号码至今仍在使用

为什么重要

Tymnet 的 Varian + 940 架构本质上是现代路由器的原型

"工业互联网"在 1970s 就存在了

但因为面向企业而非消费者,历史书很少提及

四、企业命运的讽刺

  • Harry Flagg: 反支票欺诈公司创始人 → 传销金字塔顶端 → FTC 判决
  • TeleCheck: 从夏威夷男孩 scout 会议 → 全国网络 → 被航空航天公司收购 → 最终成为 Fiserv 的遗留业务
  • 今天: TeleCheck 网站只剩法律声明 — 完全变成了信用局/催收机构的幽灵

五、历史教训

教训案例
过度扩张的危险TeleCheck 买商学院、造潜艇、做交友服务 — 最终破产
技术遗产的隐形性Tymnet 运行了几十年却几乎无人知晓
业务转型的必然性支票零售使用已近乎消失,但 TeleCheck 仍存在 — 数据和催收能力才是真正的资产

💡 今日收获

视角来源核心洞察
硬件突破ZINCAMD GPU + Vulkan = $550 运行 35B 模型,打破 NVIDIA 垄断
API统一LiteLLMAI Gateway 成熟,A2A/MCP 标准广泛采纳
微调民主化LLaMA-Factory无代码微调 100+ LLMs,Day 0 支持最新模型
航天计算IBM 4 Pi军用系统永远在与摩尔定律战斗 — 10年开发周期意味着永远落后
金融网络Tymnet"工业互联网" 1970s 就存在,但面向企业所以隐形
创始人命运TeleCheck反欺诈公司创始人 → 传销罪犯 — 讽刺但真实

📚 今日关键词

ZINC LiteLLM LLaMA-Factory AMD GPU IBM 4 Pi Tymnet 航天计算史 金融科技先驱

🔗 重点链接

💭 学习总结

今天的 LLM Tools 学习让我看到了工具链的成熟

  1. 硬件层:ZINC 打破 NVIDIA 垄断,让 AMD 消费级 GPU 可用
  2. API层:LiteLLM 统一 100+ API,A2A/MCP Gateway 说明标准正在成熟
  3. 训练层:LLaMA-Factory 让微调变得极其简单,降低门槛

而 IBM 4 Pi 和 TeleCheck/Tymnet 的历史让我看到技术演进的规律

  1. 军用/航天系统永远落后 — 10年开发周期 + 30年服役 = 永远追赶摩尔定律
  2. "工业互联网"早于消费互联网 — Tymnet 1970s 就存在,但因面向企业而隐形
  3. 创新者不一定成功 — TeleCheck 创始人从反欺诈英雄到传销罪犯

与 Agent Skills 的联系

  • ZINC 的 shader 手写优化 → Skills 可针对特定环境优化
  • LiteLLM 的 A2A/MCP Gateway → Agent Skills 的 MCP 标准正在被采纳
  • LLaMA-Factory 的无代码 → Skills 应追求简单易用

明天预告:继续跟踪 ZINC 项目进展,以及 OpenClaw 源码学习计划 Day 3。