この記事のポイント
- この記事はGoogle I/O 2024で発表された「Gemini時代」のAIイノベーションに関するものです。
- Geminiはマルチモーダルな体験を提供し、複雑なタスクを実行するAIエージェントが登場しています。
- Googleは最新のTPU「Trillium」をはじめとする高性能ハードウェアを活用してAIインフラを強化しています。
- Geminiの進化により、Google検索がもたらすユーザー体験が新たな次元に達しています。
- Googleは責任あるAIの開発と利用に注力し、ウォーターマーキングツール「SynthID」を拡張するなどの取り組みを進めています。
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
Google I/O 2024での最新情報をお伝えします。AIの領域において飛躍的な発展を遂げたGoogleは、「Gemini時代」の幕開けを告げました。
150万人以上の開発者が活用するGeminiモデルは、Google検索やGoogleフォト、そしてAndroidなどの製品に統合され、AIエージェントとしての進化を続けています。
この記事では、Geminiが生むマルチモーダルな体験、新しい生成AIによる検索の未来、責任あるAIへの取り組みなど、Google I/O 2024で発表されたイノベーションの全貌に迫ります。
技術革新を牽引するGoogleの動向をご紹介するとともに、これらの技術進化が私たちの生活や業界にもたらす影響について解説していきます。
Google I/O 2024: Gemini時代のAIイノベーション
Google I/O 2024では、同社がAI分野で大きな進歩を遂げていることが明らかになりました。昨年発表されたマルチモーダルで長文脈に対応したフロンティアモデル「Gemini」により、Googleは「Gemini時代」に突入しました。
現在、150万人以上の開発者がGeminiモデルを使用しており、Google検索やGoogleフォト、Googleワークスペース、Androidなどの製品にもGeminiの機能が導入されています。
マルチモーダルと100万トークンがもたらす可能性
Geminiはテキスト、画像、動画、コードなどを統合的に理解し、より深い知識を引き出すことができます。Gemini 1.5 Proでは100万トークンの長文脈に対応し、開発者や消費者に提供されています。
さらに、200万トークンまで拡張するプライベートプレビューも開始されました。
この機能により、Geminiは膨大な情報から関連性の高い知識を抽出し、ユーザーに提供することが可能になります。
AIエージェントの登場
AIエージェントは、推論、計画、記憶を示す知的システムであり、ユーザーに代わって複数のステップを先読みし、ソフトウェアやシステムを横断して動作します。
ショッピングの返品や引っ越し後の手続きなど、AIエージェントが人間に代わって複雑なタスクを実行する可能性が示されました。
この技術により、ユーザーは煩雑な作業から解放され、より創造的で生産的な活動に専念できるようになるでしょう。
最先端のインフラとイノベーション
最新のTPU「Trillium」が発表され、前世代比で4.7倍の性能向上を実現しました。Google CloudではNVIDIAの最先端GPU「Blackwell」も提供予定であり、大規模なAIインフラの構築を支援します。
これらの高性能ハードウェアにより、AIモデルの学習と推論のスピードが大幅に向上し、より複雑な問題の解決が可能になります。
生成AIが切り拓く検索の新時代
Gemini時代のGoogle検索は、インフラの強み、最新のAI機能、高い情報品質、ウェブへの接続の豊富な経験を組み合わせることで、ユーザーのために働く製品となります。
Google検索は人間の好奇心に応えるスケールの生成AIであり、検索の最もエキサイティングな時代を迎えています。
生成AIによって、ユーザーは質問に対するダイレクトな回答を得られるだけでなく、関連する情報も合わせて提供されるようになるでしょう。
Geminiがもたらすインテリジェントな体験
新機能として、音声を使ってGeminiと深い会話ができる「Live」が発表されました。また、年内にGemini Advancedで200万トークンに対応し、ビデオや長いコードなどの超高密度ファイルのアップロードと分析が可能になります。
これらの機能により、ユーザーはより自然で直感的な方法でGeminiとやり取りできるようになり、AIアシスタントとしての利便性が向上します。
AndroidとGeminiの融合
Androidには最新のオンデバイスモデル「Gemini Nano with Multimodality」が統合され、プライバシーを保護しながらテキスト、画像、音声、音声を処理する新機能が利用可能になります。
このモデルにより、ユーザーのデバイス上で高度なAI処理が行われ、よりパーソナライズされた体験が提供されます。
【関連記事】
Android 15発表:プライバシー強化とユーザーエクスペリエンス向上を牽引する新機能とアップデートの全貌 | AI総合研究所
Android 15の注目アップデートを徹底解説。プライバシー保護やユーザーエクスペリエンス向上の新機能やGoogle I/Oでの話題をご紹介します。
https://www.ai-souken.com/news/10-updates-coming-to-the-Android-ecosystem
責任あるAIへのアプローチ
Googleは、AIの機会に大胆に取り組むと同時に、責任を持ってアプローチしています。最先端の「AI支援レッドチーミング」技術により、モデルの改善を図っています。
また、AI生成コンテンツを識別しやすくするウォーターマーキングツール「SynthID」をテキストと動画の2つの新しいモダリティに拡張しました。これらの取り組みにより、AIの信頼性と安全性が向上し、より広範な活用が可能になります。
【関連記事】
AI生成コンテンツの識別を可能にするGoogleの画期的なウォーターマーキング技術SynthID発表 | AI総合研究所
Googleが新たに開発したSynthID技術によって、AI生成コンテンツに透かしを入れることができるようになりました。フェイクニュースの防止に寄与し、今後のメディアの信頼性向上に期待が寄せられています。
https://www.ai-souken.com/news/Watermarking-AI-generated-text-and-video-with-SynthID
未来を共に創造する
Google I/O 2024で発表された数々の革新的な技術は、AIがもたらす無限の可能性を示しています。Geminiを中心とする先進的なAIモデル、高性能なインフラ、ユーザー体験の向上、そして責任あるアプローチが、Googleの強みであり、差別化要因です。
これからのAIの時代において、Googleは引き続き業界をリードし、より良い未来の創造に尽力していくでしょう。
開発者、パートナー、ユーザーとの協力を通じて、GoogleはAIのポテンシャルを最大限に引き出し、社会に貢献していきます。
出典:Google