Mô hình Gemini 3.5 Flash mới của Google nhằm mục tiêu định nghĩa lại ranh giới hiệu quả AI, nhưng một startup mới có thể đã đánh bại nó về mặt chi phí.
Mô hình Gemini 3.5 Flash mới của Google nhằm mục tiêu định nghĩa lại ranh giới hiệu quả AI, nhưng một startup mới có thể đã đánh bại nó về mặt chi phí.

Google đang đẩy mạnh cuộc chạy đua vũ trang AI với trọng tâm là tốc độ và sức mạnh sáng tạo, thông qua việc công bố mô hình Gemini 3.5 Flash và công cụ tạo video mới Gemini Omni tại hội nghị I/O 2026. Động thái này diễn ra khi công ty đang nỗ lực bảo vệ vị thế trước OpenAI và Anthropic, trong khi các đối thủ cạnh tranh mới với hiệu quả cực cao đang xuất hiện để thách thức cấu trúc chi phí của ngành.
Google cho biết về dòng mô hình 3.5 mới trong thông báo của mình: "Đây là một bước tiến lớn trong việc xây dựng các tác nhân thông minh và có khả năng hơn". Công ty khẳng định Gemini 3.5 Flash đạt được hiệu suất hàng đầu trong khi vẫn duy trì tốc độ cao cần thiết cho các quy trình làm việc của tác nhân và phục vụ các nhóm tác nhân phụ, trực tiếp nhắm vào nhu cầu của thị trường doanh nghiệp về AI có khả năng mở rộng.
Các thông báo này là một phần của chiến dịch tấn công rộng rãi nhằm nhúng Gemini vào hệ sinh thái của Google, hiện đang phục vụ hơn 900 triệu người dùng hàng tháng, tăng từ mức 400 triệu của năm trước. Cùng với các mô hình mới, Google đã tiết lộ ứng dụng Gemini được làm mới và "Daily Brief", một tính năng AI chủ động dành cho những người đăng ký, có khả năng quét hộp thư đến và lịch của người dùng để sắp xếp ngày làm việc của họ.
Điều cốt yếu là vị thế dẫn đầu trong một lĩnh vực công nghệ được định nghĩa bởi tốc độ đổi mới không ngừng và chi phí vốn khổng lồ. Trong khi các mô hình mới của Google nhằm mục đích cân bằng giữa hiệu suất và tốc độ, sự xuất hiện của các mô hình siêu hiệu quả từ các công ty nhỏ hơn đang đặt ra câu hỏi về tính kinh tế lâu dài đối với khách hàng doanh nghiệp, có khả năng chuyển đổi cơ sở cạnh tranh từ năng lực thuần túy sang chi phí trên mỗi truy vấn.
Gemini 3.5 Flash được định vị là mô hình nhanh nhất và hiệu quả nhất về chi phí của Google cho đến nay, được thiết kế để trở thành mặc định trên nhiều dịch vụ của hãng. Công ty tuyên bố nó vượt trội hơn so với phiên bản tiền nhiệm, Gemini 3.1 Pro, trên các tiêu chuẩn về mã hóa và tác nhân quan trọng mà không làm giảm trí thông minh. Mô hình này đã có sẵn ngay lập tức trong ứng dụng Gemini và thông qua AI Mode trong Google Search, với phiên bản Gemini 3.5 Pro mạnh mẽ hơn dự kiến sẽ ra mắt vào tháng tới.
Thông báo gây ngạc nhiên hơn là Gemini Omni, một mô hình đa phương thức tạo ra video từ bất kỳ sự kết hợp nào của đầu vào, bao gồm văn bản, hình ảnh, âm thanh và các video khác. Điều này tiến xa hơn một bước so với mô hình văn bản-sang-video trước đó của Google là Veo 3, bằng cách cho phép người dùng chỉnh sửa và chuyển đổi các phương tiện hiện có thông qua các lệnh trò chuyện. Omni sẽ có sẵn cho những người đăng ký Google AI trong ứng dụng Gemini và Google Flow, đồng thời sẽ được cung cấp miễn phí cho những người sáng tạo YouTube Shorts. Để giải quyết các lo ngại về an toàn, Google đang nhúng hình mờ kỹ thuật số SynthID trong tất cả các video do Omni tạo ra.
Ngay khi Google trình bày chi tiết về thế hệ mô hình tiếp theo của mình, Perceptron Inc., một startup mới hai năm tuổi, có thể đã định nghĩa lại ranh giới hiệu quả. Công ty đã ra mắt Mk1, mô hình phân tích video hàng đầu của mình, với mức giá API thấp hơn 80-90% so với các mô hình hàng đầu thế hệ hiện tại của Google, OpenAI và Anthropic.
Mk1 của Perceptron có giá chỉ 0,15 USD cho mỗi triệu token đầu vào và 1,50 USD cho mỗi triệu token đầu ra. Theo các tiêu chuẩn của công ty, nó tương đương hoặc vượt qua hiệu suất của các mô hình như Gemini 3.1 Pro và GPT-5 trong các tác vụ suy luận không gian và video quan trọng. Trên VSI-Bench về suy luận thời gian, Mk1 đạt 88,5 điểm, cao nhất trong số các mô hình được so sánh. Sự kết hợp giữa hiệu suất cao với mức chi phí thấp hơn đáng kể nhắm trực tiếp vào thị trường công nghiệp và doanh nghiệp cho các ứng dụng như robot, an ninh và kiểm soát chất lượng.
Sự tồn tại của một đối thủ cạnh tranh như Perceptron làm nổi bật thách thức quan trọng đối với những gã khổng lồ như Google. Trong khi các mô hình tiên phong chiếm lĩnh các dòng tiêu đề, cuộc chiến giành sự chấp nhận rộng rãi của doanh nghiệp có thể được quyết định bởi nhà cung cấp nào có thể mang lại trí thông minh "đủ tốt" với chi phí suy luận thấp nhất. Đối với các nhà đầu tư, bối cảnh đang chuyển dịch từ một cuộc đua hiệu suất thuần túy sang một phương trình phức tạp hơn, nơi hiệu quả và khả năng tiếp cận cũng quan trọng không kém, ảnh hưởng đến định giá và tiềm năng doanh thu của toàn bộ lĩnh vực AI.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.