北京時間5月15日未明、グーグルは年間I/O開発者大会を開催した。外部の予想通り、人工知能は今回の大会の核心的な内容となった。発表会の公式統計によると、2時間の開発者大会では「人工知能(AI)」に121回言及した。会議でグーグルはAIに関する多くの製品とサービスを発表し、AI「ファミリーバケツ」の革新性はどうなのか、注目を集めた。
具体的には、グーグルは傘下のAI大モデル双子座(Gemini)に対して理解可能な情報量を倍増させるための重要なアップグレードを行い、グーグルはまたデータとアルゴリズムの改善を通じて双子座大モデルのコード生成、論理推理と計画、多ラウンド対話及び音声と画像理解能力を強化した。グーグルが発表したAIアシスタントProject Astraは、ビデオとオーディオで識別でき、リアルタイムの会話だけでなく、ビデオチャットでユーザーと対話することもできる。同時に、グーグルも独自の動画生成モデルVeoを発表し、文字、画像、動画のヒントに基づいて、さまざまなスタイルの高品質な動画を生成することができ、Soraの新たな強敵になるだろう。また、グーグルは第6世代Tensorプロセッサユニット(TPU)チップTrilliumを発表し、グーグルのサンダル・ピチャイ最高経営責任者(CEO)は、新製品のコンピューティングパフォーマンスが4.7倍向上したと述べた。
グーグルは今回、AI機能を検索エンジンやオフィス分野に深く組み込んだ。発表会が終わると、グーグルの検索エンジンは米国で「AI概要」機能を発売し、検索エンジンに多段推論の能力と計画能力を与える。双子座の大モデルもグーグルメールサービスGmailにアクセスし、メールの内容をまとめるだけでなく、文脈の文脈に合わせてスマートに返信内容を提供することができます。携帯電話端末では、グーグルも最新発表のAndroid 15システムに双子座の大モデルを加え、より多くのAIサービスを提供することを明らかにした。
ビッグモデルから人工知能アシスタント、アプリケーションからチップまで、グーグルはAI「ファミリーバケツ」を全面的にアップグレードした。グーグルは検索を核心とし、アンドロイドシステムを根拠地として、全面的で豊富なAI製品マトリックスを構築すると同時に、メモリ容量と全体システム帯域幅のアップグレードを通じてTPU性能を高め、AI応用に支持を提供する。
グーグルが開発者大会を開催する前日、OpenAIは新製品発表会を開催し、GPT-4 oという人工知能モデルを発売した。既存のモデルと比較して、テキスト、画像、オーディオなどを同時に理解し、それらの任意の組み合わせを入出力として使用することができます。新しいモデルは人の感情を読み取ることもでき、人間のインタラクションにおける体験はよりスムーズになる。
OpenAIとグーグルは相次いで新製品を発売しており、2つの製品は比較されざるを得ない。発表会から見ると、具体的な製品にはそれぞれ長所があるようだ。今回注目を集めたAIアシスタントを例にとると、アストラの視覚理解能力は優れているが、インタラクティブ体験ではGPT-4 oリアルタイムプレゼンテーションよりも劣っている。全体的なイノベーションの方向性を見ると、これまでOpenAIはAI技術のブレークスルーとイノベーションに重点を置いてきたが、グーグルは生態系の深化と統合に重点を置いてきたが、両社の技術的な差は縮小しており、またAIのより広範なシーンへの応用を推進するために努力している。GPT-4 oの30分未満の発表会に比べて、グーグルは驚きに欠けているが、生態やユーザーの蓄積から、グーグルは依然として先天的な優位性を持っているとのコメントがある。新製品が次々と登場し、生成式AIをめぐる競争も激しくなっている。
責任編集:劉琰(EN 004)