Googleの新しいGemini Sparkエージェントは、チャットを超えて、ユーザーに代わって購入を行うなど、エコシステム全体でタスクを自律的に完了することを目指しています。
Googleの新しいGemini Sparkエージェントは、チャットを超えて、ユーザーに代わって購入を行うなど、エコシステム全体でタスクを自律的に完了することを目指しています。

Googleは、人工知能の未来は質問に答えることではなく、タスクを完了することにあると考えています。同社はI/O 2026カンファレンスで、Gemini Sparkを中心とした一連の新製品を発表しました。Gemini Sparkは、ユーザーがオフラインの時でもGoogleのサービス全体で動作するように設計された常駐型のAIエージェントであり、自律型システムの領域へのこれまでで最も野心的な取り組みとなります。
「私たちは、人々が日常的に使用する製品に真の価値を求めているサイクルの段階にいます」と、GoogleおよびAlphabetのCEOであるサンダー・ピチャイ氏は説明会で述べました。彼は、Sparkの価値はGoogleのクラウドで24時間体制で稼働するエージェントから得られるものであり、「実行されていることを確認するためにラップトップを開いたままにしておく必要はありません」と主張しました。
このエージェントは、Googleの新しいGemini 3.5 Flashモデルを搭載し、Antigravityと呼ばれるフレームワーク内で実行されるため、Gmail、ドキュメント、カレンダーなどのアプリケーション間でマルチステップのワークフローを実行できます。このサービスは、新しいGoogle AI Ultraプランの加入者が利用でき、Proプランの5倍の使用制限と20TBのストレージを備え、月額100ドルから提供されます。
今回の発表により、GoogleはMicrosoft、OpenAI、Anthropicとの決定的なAIエージェント構築に向けた激しい競争に突入します。同社は、消費者向けサービスとの深い統合と、今年予定されている1800億ドルから1900億ドルに及ぶ巨額の設備投資計画が、対話型AIから自律型アクションへとシフトする市場において決定的な優位性をもたらすと確信しています。
エージェントが真に有用になるためには、現実の世界、特にコマースとやり取りする必要があります。Googleはこれに対応するため、2つの新しいプロトコル、Agent Payments Protocol (AP2) と Universal Commerce Protocol (UCP) を導入しました。AP2は、AIエージェントがユーザーが定義した範囲内で安全に購入できるように設計されたシステムであり、Googleはその安全策を、ティーンエイジャーに最初のデビットカードを与えることに例えています。
このシステムは、ユーザー、加盟店、決済処理業者の間に検証可能なリンクを作成します。これは今年初めに発表されたオープンソース標準であるUCPに基づいて構築されており、エージェントとコマースシステムに共通の言語を提供します。UCP技術評議会には現在、Amazon、Meta、Microsoftなどのライバルも含まれており、エージェント主導のコマースのための共有フレームワークの必要性について、業界内で幅広い合意があることを示唆しています。Googleはまた、この夏、検索、Gemini、YouTube、Gmailで価格やセールを追跡するユニバーサルカートを導入する予定です。
エージェントに焦点を当てた発表に加え、GoogleはAIをコンテンツ制作によりアクセスしやすくするためのツールもリリースしました。新しいデザインおよび画像生成アプリであるGoogle Picsは、CanvaやAnthropicのClaude Designと直接競合するように位置付けられています。Nano Banana 2モデルを搭載したPicsでは、Googleドキュメントと同様に、簡単なテキストプロンプトを使用したり、画像要素に直接コメントを残したりすることで、複雑なグラフィックを生成および編集できます。
動画については、GoogleはGemini OmniモデルをYouTube Shortsに統合しています。この機能により、クリエイターはテキスト、画像、音声のプロンプトを使用して動画を生成およびリミックスできます。システムは、シーン全体でキャラクターの一貫性を維持しながら、複雑な編集を自動的に処理するように設計されています。YouTubeは、透かしやAI生成のリミックスに対するオプトアウト制御など、クリエイターの保護を強調しました。
SparkによるGoogleの戦略は競合他社とは異なります。OpenAIのエージェントは主にブラウザを使用し、AnthropicのClaude Coworkはユーザーのデスクトップ上で動作しますが、SparkはGoogle自身のWorkspaceアプリやサードパーティサービスとの構造化されたAPI統合を通じて動作します。このアプローチは、画面の読み取りよりも信頼性と速度が高いことを約束しますが、Sparkの機能が当初はGoogleが接続されているエコシステム内に限定されることも意味します。
これらの自律型システムの信頼性は、業界全体にとって依然として重要な課題です。ユーザーの意図を誤解するエージェントは重大な結果を招く可能性があり、Googleはリリースの際、あらゆる金融取引に対してユーザーの明示的な承認を求めることで、このリスクを軽減しています。Gemini Sparkの真の試練は、それが仕事をこなせるかどうかではなく、ユーザーがそれを許可するほど信頼するかどうかにあります。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。