주요 요점:
- 딥시크 V4 2비트 양자화 버전, 90GB VRAM 내에서 구동
- 부테린 테스트 결과, Apple 하드웨어에서 초당 35토큰 vs AMD 7토큰
- 부테린, 로컬 AI와 프라이빗 RPC 읽기 및 ZK 기반 LLM 결제 연결
주요 요점:

비탈릭 부테린은 딥시크 V4의 로컬 AI 발전이 이더리움의 프라이버시 인프라를 강화할 수 있다고 밝히며, 해당 모델의 2비트 양자화 버전을 프라이빗 RPC 접근 및 제로나우리지 결제와 연결지었다.
"'CROPS 이더리움 접근 레이어'와 'CROPS AI' 사이에는 실제로 많은 교차점이 존재한다"고 이더리움 공동 창시자 부테린이 자신의 로컬 LLM 테스트를 상세히 설명한 5월 28일 게시물에서 말했다.
부테린은 2비트 양자화된 딥시크 V4가 약 90GB의 VRAM 내에서 구동되며, Apple 하드웨어에서는 초당 약 35토큰, AMD GPU에서는 초당 약 7토큰의 속도를 기록했다고 밝혔다. 그는 이러한 격차를 진정한 CROPS AI와 단지 분산형 AI라고만 설명되는 시스템 간의 차이로 규정했다. 딥시크 V4 프로 모델은 1조 6000억 개의 총 파라미터와 490억 개의 활성 파라미터를 갖춘 MoE(Mixture-of-Experts) 아키텍처를 사용하며, 100만 토큰 컨텍스트 윈도우를 지원한다.
이러한 교차점이 중요한 이유는 이더리움 사용자들이 공개 RPC 엔드포인트를 통해 지갑과 컨트랙트를 조회할 때 여전히 민감한 메타데이터를 유출하기 때문이다. 프라이빗 RPC 읽기와 원격 LLM 호출을 위한 ZK 기반 결제 레이어는 사용자와 AI 에이전트가 인프라 제공자에게 신원이나 사용 데이터를 노출하지 않고 이더리움과 상호작용할 수 있게 해준다.
부테린은 또한 프라이버시 및 보안 로드맵의 핵심 요소로 애플리케이션 특화 파인튜닝 모델을 강조했다. 그는 AMD 하드웨어에서 70GB 미만의 VRAM을 사용해 초당 약 38토큰의 속도를 낸다고 언급한 Mistral의 Leanstral을 예로 들었다. "이러한 것들은 더 안전한 코드를 작성하는 데 엄청난 도움이 된다"고 부테린은 말했으며, 이더리움 생태계는 "이더리움 관련 사용 사례에 맞춰 파인튜닝된 모델을 보유해야" 개발자들이 메인넷 배포 전에 스마트 컨트랙트와 프로토콜 코드의 결함을 발견할 수 있다고 덧붙였다.
그의 로컬 AI 테스트는 여러 인프라 프로젝트도 포함했다. 부테린은 자신의 메시징 데몬 프로젝트가 현재 알파 버전의 텔레그램 지원을 갖추고 있으며, Qwen 27B와 같은 고밀도 모델을 더 효율적으로 실행하기 위한 유망한 도구로 Lucebox Hub를 지목했다. 그는 자체 5090 노트북에서 Lucebox Hub가 Llama.cpp보다 약 2배의 토큰 처리량을 제공한다고 전했다.
이더리움의 로컬 AI 추진은 네트워크가 광범위한 시장 압력에 직면한 상황에서 이루어지고 있다. ETH는 최신 데이터 기준 약 $2,063.92에 거래되었으며, CryptoQuant는 실패한 트랜잭션 증가와 거래소 유입 증가를 보고했다. 분석 회사는 이러한 조합이 "단기적으로 해당 자산에 다소 약세"일 수 있다고 설명했다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.