商湯科技(SenseTime)の新しい SenseNova U1 モデルは、ほぼすべての主要な画像生成システムで使用されているコアコンポーネントである VAE を排除しました。この根本的なアーキテクチャの転換により、コスト削減と視覚的なアーティファクトの低減が期待されます。
戻る
商湯科技(SenseTime)の新しい SenseNova U1 モデルは、ほぼすべての主要な画像生成システムで使用されているコアコンポーネントである VAE を排除しました。この根本的なアーキテクチャの転換により、コスト削減と視覚的なアーティファクトの低減が期待されます。

SenseNova U1 のリリースにより、中国の AI 企業である商湯科技(SenseTime、00020.HK)は、最新の画像生成モデルの大部分が採用している基盤アーキテクチャに挑戦しています。同社は、20 億パラメータのプレビュー版モデルをオープンソース化しました。これは NEO-Unify アーキテクチャに基づいて構築されており、ピクセル上で直接動作し、Stable Diffusion から Google の Flux に至るまでのシステムで使用されている変分オートエンコーダ(VAE)を廃止しています。このアプローチにより、VAE の圧縮ステップを回避することで、推論のオーバーヘッドを大幅に削減し、画像の再現性を向上させることができる可能性があります。
商湯科技の徐立(Xu Li)会長は 2026 年 3 月に、「将来の AI 製品については、トークン消費量ではなく、問題解決の結果に基づいて課金するつもりだ」と述べており、この哲学は、このより効率的なアーキテクチャのコスト削減の可能性と一致しています。
モデルカードによると、20 億パラメータのプレビューモデルは、画像再構成において 31.56 のピーク信号対雑音比(PSNR)を達成しています。これは、独立した VAE を必要とせずに、はるかに大規模な Flux モデルの 32.65 PSNR に迫るスコアです。このモデルは南洋理工大学の S-Lab と共同開発され、4 月 26 日に Hugging Face で公開されました。80 億パラメータのベースモデルの登場も確認されています。
開発者や企業ユーザーにとって、今回のリリースは、よりシンプルで効率的な AI スタックへの移行を意味します。VAE を排除することで、視覚的なアーティファクトの主な原因がなくなり、大幅なチューニングを必要とするコンポーネントが取り除かれます。これにより、高品質な画像生成パイプラインを構築するための参入障壁が下がり、本番システムの運用コストが削減される可能性があり、Midjourney や OpenAI といった欧米ベンダーの API ベースのビジネスモデルを直接的に脅かすことになります。
変分オートエンコーダは、長い間、根本的な必要性ではなく実務上の必要性から使われてきました。高解像度の画像を、拡散プロセスが発生する、より小さく計算管理可能な潜在空間に圧縮します。しかし、この圧縮は不可逆的であり、細かいディテールを損なわせ、開発者が修正のために多大なエンジニアリング時間を費やすアーティファクトを導入してしまいます。SenseNova の NEO-Unify アーキテクチャは、このステップを完全にバイパスします。
視覚データと言語データが最初から深く相関しているものとして扱うことで、モデルはピクセル上で直接生成することを学習します。2 段階の学習戦略により、モデルは事前学習済みの大規模言語モデルからの言語推論を統合しながら、視覚的な知覚をゼロから構築することができます。理解と生成のためのこの統合されたパスは、あるドメインでの向上が別のドメインの能力を低下させてしまうという、マルチモーダルモデルの学習をしばしば悩ませてきたパフォーマンスのトレードオフを回避します。
SenseNova U1 は、DeepSeek、アリババの Qwen、InternVL プロジェクトなどの企業による注目すべきリリースに続き、中国から登場している一連の競争力のあるオープンウェイトモデルの最新版です。この迅速なアーキテクチャ実験とオープンソースリリースの組み合わせは、OpenAI、Google、Anthropic などの閉鎖的な米国中心のモデルや、Meta などの欧米企業のオープンウェイトモデルに対する有力な代替手段となる、強固な開発者エコシステムを構築しています。
特にデータ主権やローカルインフラが鍵となる市場の企業バイヤーにとって、これらのモデルはますます有力な選択肢となっています。商湯科技はすでに国内のチッププロバイダーとの統合を深めており、これは Nvidia の GPU サプライチェーンに影響を与える米国の輸出規制から開発パイプラインを守る動きです。アーキテクチャの革新、オープンソース戦略、そしてサプライチェーンの回復力の組み合わせは、断片化するグローバル市場における中国の AI セクターの地位を強化しています。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。