この記事のポイント
Google AI Studioは、Googleの生成AIモデル「Gemini」をブラウザ上で試せる開発環境
プロンプト作成、モデルチューニング、動画分析、音声会話、API利用などが可能
多様なGeminiモデル(1.5 Pro, 1.5 Flash, 2.0 Flash等)や、Gemma, LearnLMを利用可能
無料プランと従量課金プランがあり、用途に応じて選択可能
Vertex AIとの連携で、プロトタイピングから本番環境へのデプロイまでをサポート

監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
GoogleのAI技術は進化を続け、様々なモデルが登場していますが、「どのモデルを選べば良いか分からない」「APIの使い方が難しそう」といった悩みを持つ方も多いのではないでしょうか。
そのような課題を解決するのが、Googleが提供する「Google AI Studio」です。
本記事では、この「Google AI Studio」について、基礎から応用までをわかりやすく解説します。
Google AI Studioの概要、できること、利用可能なモデル、料金体系、そして具体的な使い方まで、幅広く網羅的に説明します。
Google AI Studioとは
Google AI Studioは、Googleが提供する生成AIモデル「Gemini」をブラウザ上で簡単に試せる開発環境です。
プロンプトの作成・テスト、モデルのチューニング、APIの利用などが可能で、初心者から上級者まで幅広いユーザーが利用できます。
Google AI Studioを使うと、以下のようなことが可能です。
- Geminiモデルへのプロンプト送信とレスポンスの確認
- モデルのチューニング
- 動画分析・文字起こし
- リアルタイムでの音声会話
つまり、Google AI Studioは、Geminiモデルを試したり、Geminiモデルを使ったアプリケーションを開発したりするための、統合的な環境と言えます。
Google AI StudioとVertex AIの関係
Google AI Studioは、Google CloudのVertex AIと密接に関連しています。Vertex AIは、機械学習モデルの構築、デプロイ、管理を行うための、Google Cloudの統合されたプラットフォームです。
Google AI Studioは、Vertex AIの機能をより簡単に利用できるようにするための、いわば「入り口」のような役割を果たしています。
Google AI Studioで作成したプロンプトやモデルは、Vertex AIに簡単に移行することができ、プロトタイピングから本番環境へのデプロイまで、シームレスに移行できます。
Google AI Studioでできること
Google AI Studioは、最新のGeminiモデルを活用して、多様なAI機能を簡単に試したり、アプリに統合したりできるプラットフォームです。
Google AI Studioを活用することで、AIの最新技術を簡単に試しながら、実際のアプリケーションに応用することができます。
なお、詳細な使い方は、後述の Google AI Studioの使い方 で解説します。
多様なAIモデルとのチャット - Create Prompt
対話型AIを活用し、ユーザーの質問や指示に応じて適切なレスポンスを生成できる機能です。
OepnAIによるChatGPTに近いサービスです。
機能:
- Create Prompt:テキスト入力を基にAIと対話を行い、様々なタスクを実行。
活用例:
- 文章生成、翻訳、要約、アイデア出しなど、AIを活用したコンテンツ作成
音声会話・画面共有 - Stream Realtime
リアルタイムの音声会話や、画面共有を活用したインタラクティブな対話が可能にする機能です。
機能:
- Stream Realtime:音声認識やストリーミング機能を活用し、リアルタイムの会話を支援。
活用例:
- AIによるリアルタイム通訳
- オンライン会議の要約・議事録作成
- 画面共有と組み合わせたプレゼン支援
動画分析・文字起こし - Video Analyzer
動画データを解析し、音声から自動でテキストを抽出したり、映像の内容を理解したりできます。
機能:
- Starter Apps → Video Analyzer:動画をアップロードして、内容を自動解析。
活用例:
- 動画の文字起こし(字幕生成)
- 映像のシーン解析、ハイライト抽出
- 特定のキーワードや人物の検出
ファインチューニング - Tune a Model
Google AI Studioでは、ファインチューニングを行う機能も併せ持っています。
ファインチューニングとは、既存のAIモデルに特定のデータを学習させ、特定の用途向けにAIモデルをカスタマイズし、より適した出力を得るためのカスタマイズ手法です。
機能:
- Tune a Model:事前学習済みのモデルをチューニングし、目的に最適化。
活用例:
- 業界特化型のカスタムAI作成
- 企業向けのFAQ応答モデル
- 特定のデータセットを使った精度向上
空間認識(2D・3D) - Spatial Understanding
物理的な空間や物体の位置関係を理解し、2D・3D環境でのAI処理を可能にする機能です。
機能:
- Starter Apps → Spatial Understanding:空間データを分析し、視覚的な情報を理解。
活用例:
- AR(拡張現実)/VR(仮想現実)アプリ開発
- ロボットのナビゲーションや物体認識
- 3Dマッピングと空間データ解析
Google AI Studioで利用可能なモデル
Google AI Studioでは、さまざまな用途に応じた最新のGeminiモデルを利用できます。
それぞれのモデルは、用途や処理能力に応じて選択できるよう設計されており、文章生成、コード作成、データ解析、対話型AI、マルチモーダル処理など、幅広い分野で利用可能です。
【Google AI Studioで利用可能なモデルの一覧表】
モデル名 | 用途 | 主な特徴 | 主な活用例 |
---|---|---|---|
Gemini 1.5 Pro | 高度な推論・長文処理・マルチモーダル分析 | 長文理解・高度な推論・マルチモーダル処理 | 研究論文要約・コード生成・データ分析 |
Gemini 1.5 Flash (8B) | 高速応答・リアルタイム対話型AI | 軽量で高速・リアルタイム応答に最適 | カスタマーサポート・チャットボット |
Gemini 2.0 Flash | 軽量で高速なAI処理・対話型アプリ | より高精度な回答・チャットアプリ向け | スマートデバイス・企業向けAIアシスタント |
Gemini 2.0 Flash Lite | 超軽量AI・モバイル向けアプリ | エッジデバイス向け・低消費電力 | ウェアラブルデバイス・音声認識アプリ |
Gemini 2.0 Flash Thinking | 高速かつ論理的推論・戦略的思考 | 論理的推論・戦略的思考に優れる | ビジネス戦略支援・論理的推論タスク |
Gemini 2.0 Pro | マルチモーダル処理・クリエイティブ生成 | テキスト・画像・音声を統合的に処理 | AIデザイン・ビジネスレポート作成 |
Gemma | オープンソース向け軽量LLM | 開発者向けカスタマイズ可能なLLM | オープンソースプロジェクト・AI研究 |
LearnLM 1.5 | 教育分野特化AI・学習支援 | 対話型学習支援・教育向け | 教育支援AI・学習アシスタント |
Gemini 1.5 Pro
- 用途: 高度な推論、複雑なタスク処理
- コンテキスト長: 最大 2,097,152トークン(約200万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 動画 最大2時間、音声 約19時間
Gemini 1.5シリーズの中核を担うモデルで、長文の処理や多様なタスクに適応可能。コード生成やデータ分析にも優れています。
Gemini 1.5 Flash
- 用途: 高速な推論、リアルタイム応答
- コンテキスト長: 最大 1,048,576トークン(約100万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 動画 最大1時間、音声 約9.5時間
応答速度を重視したタスクに最適で、軽量ながら十分な性能を持っている、バランスの取れたタイプです。
Gemini 1.5 Flash-8B
- 用途: 低インテリジェンスタスク向け
- コンテキスト長: 最大 1,048,576トークン(約100万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 動画 最大1時間、音声 約9.5時間
軽量モデルでありながら、効率的な処理が可能です。
Gemini 2.0 Flash
- 用途: 高速処理、短文対話
- コンテキスト長: 最大 1,048,576トークン(約100万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 未公開
特に対話型アプリケーションやチャットボット向けに設計され、処理速度と精度のバランスが取れているのが特徴的です。
Gemini 2.0 Flash Lite
- 用途: 超軽量推論、エッジデバイス向け
- コンテキスト長: 最大 1,048,576トークン(約100万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 未公開
リソース制限のある環境でも動作可能な、コストパフォーマンスに優れたモデルです。
Gemini 2.0 Flash Thinking
- 用途: 高速かつ論理的な推論
- コンテキスト長: 未公開
- 入出力形式: 未公開
- カットオフ: 未公開
論理的な分析や問題解決を求められるシナリオに適したモデルといえます。
Gemini 2.0 Pro
- 用途: マルチモーダル処理、クリエイティブなタスク
- コンテキスト長: 最大 2,097,152トークン(約200万トークン)
- 入出力形式: テキスト、音声、画像、動画対応(出力はテキスト)
- カットオフ: 未公開
Gemini 1.5 Proの進化版で、テキストだけでなく画像や動画などのマルチモーダルデータを統合的に処理できるモデルです。生成AIの最先端モデルはこちらが採用されています。
その他のモデル
Gemma
- 用途: オープンソース向けの軽量LLM
Googleが提供する軽量な大規模言語モデル(LLM)です。
開発者が独自のアプリケーションに組み込むことを想定されているため。自由にカスタマイズできるのが特徴で、小規模なAIアプリケーション向けに最適です。
LearnLM 1.5
- 用途: 教育分野特化AI
教育向けに最適化されたモデルで、学習コンテンツの生成や質問応答に優れています。
特に、対話型学習を支援するAIアシスタントとしての役割を果たします。
Google AI Studioの料金
Google AI Studioでは、無料版と従量課金版の2種類の料金プランが用意されています。それぞれの特徴と料金体系について解説します。
無料プラン
- ウェブ上の Google AI Studio で直接利用
- テキスト入力と画像解析などが可能
- 料金:無料
- レート制限あり(一定のリクエスト制限)
なお、こちらはGemini 2.0 Flashの無料版で使用できる範囲です。
項目 | 内容 |
---|---|
料金 | 無料 |
利用可能な機能 | テキスト入力・画像解析など |
モデル | Gemini 2.0 Flash |
レート制限 (RPM) | 15 RPM |
レート制限 (TPM) | 1,000,000 TPM |
レート制限 (RPD) | 1,500 RPD |
Google検索補強 | 利用不可 |
データの利用 | 製品の改善に使用される |
従量課金プラン(API利用)
- Google AI Studio の API を利用する場合
- Gemini モデルを活用した高度なアプリ開発向け
- トークン数に応じた従量課金
以下は、Gemini 2.0 Flashにおける従量課金制度を示しています。
項目 | 料金(100万トークンあたり) |
---|---|
入力(テキスト / 画像 / 動画) | $0.10 |
入力(音声) | $0.70 |
出力(テキスト) | $0.40 |
コンテキストキャッシュ保存(テキスト / 画像 / 動画) | $0.025 |
コンテキストキャッシュ保存(音声) | $0.175 |
コンテキストキャッシュストレージ | $1.00 / 時間 |
Tierに応じた料金種別
レート制限、Google検索によるリクエスト数の制限は、Tier 1とTier 2の2種類があり、利用量に応じて異なります。
レート制限(API利用)
ティア | 1分あたりのリクエスト(RPM) | 1分あたりのトークン(TPM) |
---|---|---|
Tier 1 | 2,000 RPM | 4,000,000 TPM |
Tier 2 | 10,000 RPM | 10,000,000 TPM |
Google検索によるグラウンディング(検索補強)
ティア | 1日あたりの最大リクエスト数 | 料金 |
---|---|---|
Tier 1 | 最大 5,000件 | 1日あたり最初の 1,500件無料 |
Tier 2 | 最大 10,000件 | 追加リクエスト: 1,000件あたり $35 |
どのプランを選ぶべき?
Google AI Studioでは、無料枠を超えた場合、トークン数に応じた従量課金が適用されます。
Google検索補強は最初の1,500件が無料ですが、それを超えると1,000件ごとに$35の追加料金が発生するため注意が必要です。
コンテキストキャッシュの保存とストレージには別途料金が発生します。
これらの特徴を踏まえて、目的に応じて適切なプランを選びましょう。
利用目的 | おすすめプラン |
---|---|
試しに使ってみたい | 無料プラン |
API を利用した開発を行いたい | 従量課金プラン |
高性能 AI モデルを使いたい | Gemini 1.5 Pro など |
高速な処理が必要 | Gemini 1.5 Flash |
Google AI Studioの使い方
基本操作
Creat Promptを使うと、従来の対話型AIと同じようにチャット機能を使うことができます。
使い方も簡単なのでぜひ試してみてください。
今回は、Google AI Studioについての質問をしてみます。
-
アカウントの作成・ログイン
- Google AI Studio にアクセスし、Googleアカウントでログインします。
- Google AI Studio にアクセスし、Googleアカウントでログインします。
-
チャットしたい内容を記入
質問内容を記入した状態- デフォルトではチャット機能がトップページに表示されるため、下部のテキストボックスに行いたい対話の内容を記述します。
- 今回は試験的に、Google AI Studioとはどんなものなのかの解説をお願いしてみます。
-
チャット機能の利用
実際に質問をして得られた返答- 対話が始まります。内容に応じて引き続き質問をすることができます。
- APIリクエストの例や、モデルの応答のカスタマイズも可能です。
- 今回は以下のような返答が返ってきました。
回答
Google AI Studioは、Googleが提供するプロトタイピングツールで、生成AIモデルを簡単に試したり、プロトタイプを作成したり、APIキーを取得してアプリケーションに組み込んだりすることができます。
より具体的に言うと、以下のようなことができます。
様々なGoogleの生成AIモデルを試す: PaLM 2、Geminiなどの強力な大規模言語モデル (LLM) を、テキスト生成、画像生成、コード生成など、様々なタスクで試すことができます。
プロンプトを設計・テスト: モデルに指示を与えるためのプロンプトを、簡単に作成、編集、テストできます。さまざまなプロンプトを試して、目的に最適な出力を得られるように調整できます。
AIアプリケーションのプロトタイプを構築: 簡単なインターフェースを使って、AIを活用したアプリケーションのプロトタイプを迅速に作成できます。チャットボット、コンテンツ生成ツール、その他様々なアイデアを試せます。
APIキーの取得と統合: プロトタイプが完成したら、APIキーを取得して、それを自身のアプリケーションに組み込むことができます。これにより、GoogleのAIモデルを自分のプロジェクトで利用できるようになります。
無償枠: Google AI Studioには無償枠があり、一定の範囲内で無料で利用できます。
主な特徴:
使いやすさ: プログラミングの経験が浅い人でも扱いやすいように設計されています。
迅速なプロトタイピング: 短時間でAIアプリケーションのアイデアを形にできます。
幅広いモデルのサポート: Googleの最新のAIモデルをすぐに利用できます。
API統合の簡素化: プロトタイプを実際のアプリケーションに組み込むための手順が簡略化されています。
誰にとって役立つか:
AI開発初心者: 生成AIの基本的な使い方を学びたい人
開発者: AIを活用したアプリケーションのアイデアを試したい人
プロダクトマネージャー: 新しいAI機能の可能性を探りたい人
研究者: AIモデルの挙動を実験したい人
Google AI Studioは、AIの可能性を探求し、革新的なアプリケーションを開発するための強力なツールです。
より詳しい情報は、Google AI Studioの公式ドキュメントを参照してください。
Google AI Studio: https://ai.google.dev/
この情報がお役に立てば幸いです。
- 出力の調整
ここからモデル選択やトークン数の確認が可能です
- さらに適した出力を行うため、画面右側に表示されるバーで調整が可能です
- modelでは、出力に使用されるモデルを選ぶことができます。今回はデフォルトであるGemini 2.0 Flashを使用しました。
音声会話機能(Stream Realtime)の使い方
Google AI Studioでは、Stream Realtime機能を使ってリアルタイム音声会話を行うことができます。
今回はGoogle AI Studioの使い方、日本語での応答可否について質問してみました。
Talk to Geminiを使ってみる
まず、主要機能であるTalk to Geminiを使ってみます。
-
Stream Realtimeを選択
- Google AI Studioにログインし、Stream Realtimeを選択します。
- Google AI Studioにログインし、Stream Realtimeを選択します。
-
モードを選択
残りの機能についても簡単に後述します- 3つの機能が実装されているので、好みに応じて選択します。
- 今回はTalk to Geminiを選択しました。
-
音声入力の有効化
マイクを使用していいかの許可を問う画像が表示されます- マイクのアクセスを許可します。
- マイクのアクセスを許可します。
-
会話の開始
- マイクを使って会話を行います。
- 入力した音声に対して、AIが即座に応答を返します。
- 自然な会話が可能で、出力された音声は大まかに書き起こされています。
現状、日本語での会話は実装されていないため、注意が必要です。
Show Gemini
Show Geminiとは、ウェブカメラを通じて見ているものをリアルタイムでGeminiに送信し、応答を得られる機能です。
Share your screen
Share your screenを有効にすることで、リアルタイム音声会話や画面を他のユーザーと共有できます。
使い方も簡単なのでぜひ試してみてくださいね。
- Share your screenを選択
- 共有するウィンドウを選択
- 共有の開始
- 画面下部から共有の終了
動画分析(文字起こし)の使い方
Google AI Studioの Video Analyzer を利用すると、動画ファイルから音声を抽出し、文字起こし(Speech-to-Text)が可能です。
使用手順
-
Video Analyzerを選択
Starter Appsの初期画面- Google AI Studioにログインし、Starter Appsを選択します。
-
動画をアップロード
左下の+ボタンをクリックして動画を追加- Video Analyzerを選択し、動画ファイルをアップロード。
-
言語の選択
- 文字起こしする言語(例:日本語、英語)を指定。
-
解析の実行
- 「開始」ボタンを押すと、動画の音声がテキストに変換される。
-
結果の確認
- 文字起こし結果が画面上に表示され、テキストデータをコピー・ダウンロード可能。
APIキーを使用する
Google AI Studioでは、APIキーを取得し、実際のアプリケーションに組み込むことも可能です。
Google AI StudioでAPIキーを取得する手順
-
Google AI Studioにアクセス
Google AI Studio にアクセスします。 -
APIキーの発行
- 画面左側のメニューから「API keys」を選択します。
- 「Create API Key」ボタンをクリックします。
- 新しいAPIキーが生成されます。
-
APIキーをコピー
- 生成されたAPIキーが表示されるので、コピーして保存してください。
- APIキーは安全に管理し、第三者と共有しないようにしてください。
-
APIキーを使用
- APIキーを使って、Gemini APIなどのGoogleのAIサービスを呼び出すことができます。
APIキーの利用方法(Pythonの例)
APIキーを取得したら、GoogleのGemini APIを利用できます。
以下のPythonコードを参考にしてください。
import google.generativeai as genai
# 取得したAPIキーを設定
genai.configure(api_key="YOUR_API_KEY")
# モデルの初期化
model = genai.GenerativeModel("gemini-pro")
# プロンプトを入力して生成
response = model.generate_content("AIについて教えて")
print(response.text)
まとめ
Google AI Studioは、Googleの最新生成AIモデル Gemini を簡単に試し、開発できるブラウザベースのプラットフォームです。
初心者から上級者まで幅広く利用でき、プロンプト作成、モデルのチューニング、API活用など、多様なAI機能を提供します。
技術の進化によってさらに機能が追加される可能性もあるので、今後の動向からも目が離せません!
AI総合研究所では、記事に合わせて多彩な実績と知見を活かしたカリキュラム設計から実機演習、研修後のフォローアップまで一貫してサポートいたします。
企業規模や業種に合わせたカスタムプランもご用意しておりますので、ぜひお気軽にご相談ください。