关键要点:
- DeepSeek V4 2-bit 量化版运行所需显存低于 90 GB
- 在 Buterin 的测试中,苹果硬件达到每秒 35 个 token,而 AMD 仅为 7 个
- Buterin 将本地 AI 与私有 RPC 读取及 ZK 驱动的 LLM 支付联系起来
关键要点:

Vitalik Buterin 表示,DeepSeek V4 的本地 AI 进展可以加强以太坊的隐私基础设施,他将该模型的 2-bit 量化版本与私有 RPC 访问及零知识支付联系了起来。
"实际上,'CROPS 以太坊访问层'与'CROPS AI'之间有很多交叉点,"以太坊联合创始人 Buterin 在 5 月 28 日详细说明其本地 LLM 测试的一篇帖子中表示。
Buterin 称,2-bit 量化的 DeepSeek V4 运行所需显存约为 90 GB,在苹果硬件上每秒可处理约 35 个 token,而在 AMD GPU 上仅约每秒 7 个 token——他将这一差距描述为真正的 CROPS AI 与被描述为去中心化 AI 的系统之间的区别。DeepSeek V4 Pro 模型采用混合专家架构,拥有 1.6 万亿总参数和 490 亿活跃参数,支持 100 万 token 的上下文窗口。
这种交叉之所以重要,是因为以太坊用户通过公共 RPC 端点查询钱包和合约时,仍然会泄露敏感元数据。私有 RPC 读取以及针对远程 LLM 调用的 ZK 支付层,可以让用户和 AI 代理在不向基础设施提供商暴露身份或使用数据的情况下与以太坊进行交互。
Buterin 还强调,针对特定应用进行微调的模型是隐私与安全路线图的关键组成部分。他提到了 Mistral 的 Leanstral,称其在 AMD 硬件上使用不到 70 GB 显存即可达到约每秒 38 个 token。"这类东西对于编写更安全的代码来说是一个巨大的福音,"Buterin 表示,并补充说以太坊生态系统"应该拥有针对以太坊相关用例进行微调的模型",以帮助开发者在主网上线之前发现智能合约和协议代码中的缺陷。
他的本地 AI 测试还涵盖了多个基础设施项目。Buterin 表示,他的消息守护进程项目现已支持 Telegram alpha 版本,并指出 Lucebox Hub 是一个很有前途的工具,可以更高效地运行 Qwen 27B 等密集模型,在其 5090 笔记本电脑上实现约两倍于 Llama.cpp 的 token 吞吐量。
在以太坊推动本地 AI 之际,该网络正面临更广泛的市场压力。截至最新数据,ETH 交易价格约为 2,063.92 美元。CryptoQuant 报告称,交易失败数量上升且交易所流入量增加,该分析公司认为这种组合"短期内对该资产可能偏空"。
本文仅供信息参考,不构成投资建议。