Qwen 3.5 Omni xử lý video nhanh hơn 800% so với đối thủ
Alibaba đã phát hành mô hình Qwen 3.5 Omni vào ngày 30 tháng 3 năm 2026, đánh dấu lần ra mắt AI lớn thứ hai của họ chỉ trong sáu tuần. Đổi mới chính của mô hình là kiến trúc "đa phương thức" nguyên bản của nó, cho phép nó xử lý đồng thời văn bản, hình ảnh, âm thanh và video trong một lần duy nhất. Được đào tạo trên hơn 100 triệu giờ dữ liệu âm thanh-hình ảnh, Qwen tránh được các quy trình làm việc nhiều bước, chậm hơn được sử dụng bởi các đối thủ. Trong một cuộc trình diễn, Qwen 3.5 Omni đã phân tích một clip video YouTube trong khoảng một phút. Ngược lại, một hệ thống không đa phương thức như ChatGPT 5.4 yêu cầu chín phút để hoàn thành cùng một nhiệm vụ bằng cách ghép nối các công cụ riêng biệt để nhận diện hình ảnh, phiên âm âm thanh và nhận dạng văn bản.
Mô hình mới đánh bại ElevenLabs trên 20 ngôn ngữ
Qwen 3.5 Omni giới thiệu một số khả năng mới nhắm mục tiêu vào các phân khúc thị trường cụ thể. Tính năng nhân bản giọng nói cho phép mô hình sao chép giọng nói của người dùng từ một mẫu, đặt nó vào cạnh tranh trực tiếp với các nền tảng chuyên biệt như ElevenLabs. Trên các điểm chuẩn ổn định giọng nói đa ngôn ngữ, Qwen 3.5 Omni-Plus đã vượt trội hơn ElevenLabs và GPT-Audio trên 20 ngôn ngữ khác nhau. Khả năng nhận dạng giọng nói của mô hình cũng đã mở rộng đáng kể để bao gồm 113 ngôn ngữ và phương ngữ, tăng từ 19 trong phiên bản trước. Hơn nữa, nó hiện tích hợp tìm kiếm web thời gian thực và một tính năng "Mã hóa cảm xúc âm thanh-hình ảnh" mới lạ, cho phép nó viết mã chức năng chỉ dựa trên việc quan sát ghi lại màn hình của một tác vụ.
Alibaba tăng tốc phát hành sản phẩm khi đối thủ tập trung vào chính sách
Lịch trình phát hành sản phẩm tích cực của Alibaba nêu bật một sự phân kỳ chiến lược trên thị trường AI toàn cầu. Trong khi các đối thủ như OpenAI và Anthropic đang công khai tập trung vào việc phát triển các khuôn khổ đạo đức và tài liệu quản trị, chẳng hạn như "Thông số kỹ thuật mô hình" và "Hiến pháp Claude", Alibaba đang thực hiện một chiến lược nhanh chóng, do sản phẩm dẫn đầu. Bằng cách ra mắt hai mô hình tiên tiến trong vòng chưa đầy hai tháng, công ty đang ưu tiên triển khai các tính năng hữu hình và cải thiện hiệu suất để chiếm thị phần. Cách tiếp cận này tương phản với các cuộc thảo luận mang tính triết học và chính sách hơn đang chiếm ưu thế trong diễn ngôn của một số đối thủ chính của họ tại Hoa Kỳ, báo hiệu một con đường khác trong cuộc đua giành quyền thống trị AI.