Mã bị rò rỉ cho thấy GPT-5.4 sở hữu cửa sổ ngữ cảnh 2 triệu token
Một kỹ sư của OpenAI đã vô tình gửi mã vào một kho lưu trữ GitHub công khai, tiết lộ tên gọi "gpt-5.4", làm dấy lên suy đoán rộng rãi về việc phát hành sắp tới của nó. Rò rỉ này được củng cố bởi các ảnh chụp màn hình của một điểm cuối "alpha-gpt-5.4" lan truyền trên mạng xã hội. Phản ứng nhanh chóng của OpenAI—xóa các bài đăng gốc và ghi đè mã thành "gpt-5.3-codex"—đã được các nhà quan sát thị trường giải thích là xác nhận về một sự tiết lộ không chủ ý chứ không phải là một lỗi đơn giản.
Các chi tiết bị rò rỉ cho thấy một bước ngoặt chiến lược từ việc cải thiện hiệu suất theo từng bước. Tính năng nổi bật là cửa sổ ngữ cảnh 2 triệu token được đồn đại, một sự mở rộng lớn, khi kết hợp với "AI có trạng thái" (Stateful AI), sẽ cấp cho mô hình khả năng bộ nhớ bền vững. Điều này cho phép nó duy trì quy trình làm việc và lịch sử dự án qua các phiên, biến trải nghiệm người dùng từ một loạt các cuộc trò chuyện rời rạc thành một mối quan hệ đối tác nhận thức liên tục. Các rò rỉ thêm chỉ ra khả năng thị giác được cải thiện có thể xử lý các byte hình ảnh thô độ phân giải đầy đủ, cho phép phân tích chính xác từng pixel của các sơ đồ thiết kế và kỹ thuật chi tiết.
Kiến trúc mô hình mới sẽ khơi mào 'cuộc chiến bộ nhớ' trong lĩnh vực phần cứng
Việc chuyển đổi sang một mô hình với cửa sổ ngữ cảnh rộng lớn và bộ nhớ trạng thái bền vững sẽ tạo ra những thay đổi đáng kể về nhu cầu trong thị trường bán dẫn và phần cứng. Kiến trúc này đòi hỏi sự gia tăng bùng nổ về kích thước của bộ đệm Key-Value (KV), đặt ra yêu cầu cực đoan về băng thông bộ nhớ. Do đó, thị trường bộ nhớ băng thông cao (HBM) và RAM tĩnh (SRAM) dự kiến sẽ tăng mạnh khi các thành phần này rất quan trọng để quản lý các yêu cầu bộ nhớ khổng lồ của mô hình.
Sự phát triển phần mềm này trực tiếp chuyển thành một thách thức phần cứng, đẩy giới hạn của cơ sở hạ tầng hiện tại. Nhu cầu quản lý luồng dữ liệu lớn một cách hiệu quả cũng đang thúc đẩy quá trình chuyển đổi từ các khái niệm lý thuyết sang triển khai thực tế cho các công nghệ như kết nối quang học. Động thái của OpenAI cho thấy họ có thể đã đảm bảo được kiến trúc phần cứng cơ bản để hỗ trợ bước nhảy vọt thế hệ này, định vị các đối tác phần cứng của họ để đạt được tăng trưởng đáng kể khi ngành công nghiệp làm theo.