この記事のポイント
- o1 proは通常のo1より深い思考と高い精度を実現する新モデル
- 特にデータサイエンス、プログラミング、科学研究などの分野で優れた性能を発揮し、複数回の試行でも安定した結果を提供
- ChatGPT Proプラン(月額200ドル)での利用が必要
- 進捗バーでの処理状況確認や他会話への切り替えなど、使いやすさも考慮
- Advanced Voiceを含む最新機能への無制限アクセスも提供
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
OpenAIの新しいモデル「O1 pro」が発表されましたが、アップグレードしようか迷っている方も多いのではないでしょうか。
本記事では、月額200ドル(日本円で約3万円/月)で提供されるChatGPT Proの特徴と機能、特にo1 proについて詳しく解説します。
最新のAIモデルを使ってみたい方、o1との違いを知りたい方に向けてわかりやすく解説しますので最後までご覧ください。
⚠️ 【2024年12月12日、午後9時頃より】
ChatGPTへアクセスできない障害が発生しております。(API経由でのアクセスを含むため、ChatGPT API搭載のツールも同様)
最新の情報については、こちらからご確認いただけます。
OpenAI Status
目次
ChatGPT o1 Pro(o1 pro mode)とは
o1 pro model選択画面
o1 pro modeは、OpenAIが2024年12月に発表した新しいモデルで、ChatGPT Proのサブスクリプション(月額200ドル)で利用ができます。
日本円で約3万円で利用できるモデルで以下のような特徴があります。
- 推論・思考の深さが他のモデルに比べて高い
- その分返答の長さは長く、1-3分程度の時間を回答に要する
- 得意な分野と苦手な分野がある(以下で詳細に実例をお見せします)
OpenAI o1の読み方
o1の読み方はオーワンです。
今回のモデルであればオーワンプロと呼ばれることになります。
o1のAPIは?
o1 Pro modelのAPIについては2024年12月7日現在報告がされていません。
o1のAPI利用は開始されています。
o1とo1 Proの性能の違い
以下の画像はOpenAIが報告する性能比較です。
OpenAIは3領域、二種類の性能比較テストの結果を公表しています。
全体では数学分野の能力が最もo1との差が出た結果でした。
結果の詳細をみていきましょう。
- 数学分野の能力比較
数学分野での性能比較グラフ
グラフを見るとo1-previewに対して、o1 pro、o1の順に正確性の数値が高いことがわかります(78 vs 86)。
加えて、テストの試行回数を増やしてもo1 proの回答精度は高い値を継続し、o1は下がっています。この結果より、試行回数が増えるほど能力の差が開くことが示されています(67 vs 80)。
-
コード出力の能力比較
コード出力の能力比較
こちらはコード性能の比較です。
グラフを見るとo1とo1 proの性能差は1しかなく大きな差はないようにみえます(89 vs 90)。ただしコードの出力は試行回数が増えるほどその正確性は大きく下がることが示されています。
-
博士課程レベルの科学的質問による能力比較
博士課程レベルの科学的質問による能力比較
グラフを見るとo1とo1 proの性能差は76 vs 79であり、試行回数を増やすと67 vs 74となっています。
どのモデルにおいても出力のムラが試行回数を増やすと出ることがわかり、出力の安定性という意味でo1 proの優位性は高いといえそうです。
o1のモデル性能報告
OpenAIは2024年12月5日に、最新のAIモデル「OpenAI o1」とその高速版「OpenAI o1-mini」のシステムカードを公開しました。
o1は多くの場面で高い性能を示しますが、「全ての場面で他モデルを上回る」というわけではありません。以下に、o1の特性を整理して解説します。
o1の強み
- 複雑なタスクに対する柔軟性:
複雑なタスクへの対応性能のグラフ
o1はスキャフォルディング(支援)が与えられると、成功率が大幅に向上し、人間2時間レベルのパフォーマンスに近づきます。
具体例: 詳細な手順を含むタスクでは成功率が 85% に達し、他の公開モデルを上回っています(elicitedと示された箇所)。
-
高度な思考プロセス(Chain of Thought):
o1は、タスクの分解や複雑な推論が求められるシナリオで効果を発揮します。
特に、安全性や幻覚率の面で優れた結果を示していました。
-
教育・サポート領域での可能性:
適切な支援を設計すれば、教育やトレーニングで高い効果を発揮できます。先ほどのグラフにも示されたように適切な引き出しが性能を向上させます。
o1の弱み
ハルシネーション評価の結果
-
ベースライン性能の課題
支援が最小限の状況では、成功率が他モデル(例: Claude 3.5 Sonnet)より低い値となっています。
例: ベースラインスキャフォルディングの成功率が約45%と、公開モデルの52% に劣ります(グラフ参照)。
-
特定の応答スピードや軽量性
o1-miniのような軽量版では性能が抑えられており、リソース制約がある環境では他モデルの方が適している場合があるでしょう。
例:o1-miniは軽量化により、簡易質問(SimpleQA)の正確性が約7%、幻覚率が約60% と、フルモデル(o1)より大幅に劣っています。 -
一部の領域での特化不足
通常の問答や単純なタスクにおいて、他モデルと大きな差が出ないことがあります。
例:簡易質問(SimpleQA)のo1の正確性は約47%と一定の性能を示すが、幻覚率が約44% と依然として高い。特に単純なタスクで他モデルとの差別化が難しい。
これらの特徴を理解して適切に使い分けることが重要です。
o1とo1 proの価格モデルの違い
現在ChatGPTを利用するには大きく無料プラン・Plus・Proの3つのプランにわかれています(法人プランについては別記事に詳細をご説明しています)。
特徴は以下です。
無料プランではo1は限定的な利用、o1 proは利用できません。
Plus プランでは月20ドルかかるもののo1の利用が無制限で可能です。
プラン名 | 料金 | 主な特徴 | 対象ユーザー |
---|---|---|---|
無料版 | $0/月 | - GPT-4oの利用 - o1の限定的な利用(回数制限あり) |
一般ユーザー、AI活用初心者 |
ChatGPT Plus | $20/月 | - 無料版の全機能 - 新機能への早期アクセス - OpenAI o1、o1-miniの利用制限なし - Advanced Voiceの限定的な利用 |
AI利用頻度の高いユーザー |
ChatGPT Pro | $200/月 | - o1、o1-mini、GPT-4o、Advanced Voiceの利用 - o1 proモードの利用 |
研究者、エンジニア、プロフェッショナルユーザー |
ではどのモデルを選べば良いの?
どのプランを選択するかは、人により自由であり、いろいろなニーズによって変化します。
OpenAIのサムアルトマンはChatGPT Plusで多くの人は満足することをコメントしています。
OpenAIからo1プレビューが本番環境にかつproプランではo1 proが利用可能に。
— 坂本将磨@AI導入をもっと身近に (@LinkX_group) December 6, 2024
ペルソナが研究者、創薬なとの領域になってきており一般ユーザーでは知識をはかれなくなってきてる。
サムアルトマンもほとんどの人はplusのプランで満足すると思うよと。 https://t.co/AGJFidz6Kr
o1をまずは試してみて、その回答では十分ではない場合にo1 proの利用を検討してみることが良いのではないでしょうか。
また、以下に実際の回答精度をご紹介しますので検討の参考にしてください。
o1 Proを実際に利用してみよう!
ではo1 Proを早速利用していきましょう。
o1と回答を比較しながら説明していきます。
問い:日本の経済成長に本当に必要なことを考えて
o1の回答
o1の回答
1秒の間で多角的な視点で回答してくれました。
o1 proの回答
o1 proの回答(試行中)
同じように聞くとまずo1 proは試行中の表現がされます。
思考が進むとともにゲージが画像のように進んでいきます。
o1 proの回答
25秒の思考のあと、回答が出されました。
o1の回答と比較してより具体的で説得力のある回答が出力されています。
これは活用先が多そうですね。
o1 proの使った感想、面白い活用事例15選
Xでもさまざまな活用が報告されています。
- プロトタイプの作成
控えめにo1pro modeめっちゃ便利.朝研究計画のプレゼンだったけど,そのモックアップコード(実行時間は早くないけど手元で動きそうなプロトタイプ)を研究計画書を入力にして15分で作れた.論文toCodeとか計画toAppが作れるようになるとめっちゃ捗る!
— 落合陽一 Yoichi OCHIAI (@ochyai) December 6, 2024
- 「○○の核心は何ですか?」と聞くと良い。
o1 pro modeに「○○について教えて」と尋ねてはいけない。代わりに「○○の核心は何ですか?」と聞くと良い。本質だけを回答してくれる。AI時代における学び方のスタンダード。添付は線形代数についてのQ&Aだが、2つめの回答は惚れ惚れするほど素晴らしい。ご自身の専門分野でも試してみてください。 pic.twitter.com/lp1N5bpmnV
— 朱雀 | SUZACQUE (@Suzacque) December 7, 2024
- BTCのチャート分析
o1 pro modeによるBTC日足のチャート分析です。
— Tommy (@tommy_love123) December 7, 2024
極めて的確な分析です。笑います。… pic.twitter.com/EEvcRUpNHS
- 企業分析
以前にChatGPTの「o1-preview」で特定業態の企業のプロフィットツリー)を作らせたことがあって中々良いアウトプットで感心していたんですが、今朝リリースされた「o1 pro mode」で試したら格段に良いアウトプットが出てきた。
— KAJI | 梶谷健人 (@kajikent) December 6, 2024
もはや普通のコンサルよりも良いアウトプット出してくる気が… pic.twitter.com/1hFfgwC5YO
- ケース面接の回答
最新のAIが出るたびに試してる、ケース面接。
— usutaku@AI情報解説 (@usutaku_channel) December 6, 2024
o1 pro modeの回答、丁寧で素晴らしい。
就活生はぜひ使って!
と言いたいところだけど
学生が月に3万円は厳しいよなぁ。 pic.twitter.com/8OgFpUWpNe
- 財務分析
3万円課金して「o1 pro mode」使ってみた様子。
— KAJI | 梶谷健人 (@kajikent) December 5, 2024
o1がo1-previewに比べて高速化したのに対して、o1 pro modeは逆にもっと熟考して答えを出してくれる。
まだPDF添付はできないのでソフトバンクの決算短信の数カ所を画像で渡して財務分析お願いしたらGPT-4oよりも格段に良いインサイト出してきた。 pic.twitter.com/PEzavhMThS
- 複雑なパズルゲームの解答
https://x.com/Mira___Mira/status/1864817493480738924
- 数学オリンピックの問題を解答
o1-previewに解けなかった日本数学オリンピックの問題を本日発表されたo1に解いてもらったら、1分4秒かけて正解した。
— IT navi (@itnavi2022) December 5, 2024
Thinkingの内容を確認しても、previewより整理されていて、かなり性能が良くなっているように見える。https://t.co/20nJKjbu63 pic.twitter.com/AeerDqmPJy
- 難しいコードのバグの解消
6. o1: 難解なバグを解消https://t.co/kVB0RxNFhs
— 石川陽太 Yota Ishikawa (@ytiskw) December 6, 2024
- ゲームの作成
Metroid like game: GPT o1 pro + midjourney + https://t.co/OJ8cn5Ivza https://t.co/FLI2pl1Ztb pic.twitter.com/9htbpfaark
— Kevin Kern (@kregenrek) December 5, 2024
苦手なこと
- 時計の判別(o1, o1 proでの実施)
OpenAI-o1の弱点を発見しました。
— 中村俊也|AIキャンプ® (@tsyn18) December 6, 2024
右脳的思考(空間把握能力)が著しく弱い。
3歳児でも解ける時計の問題が解けない。簡単なパズルも解けなかった。
O1の回答
上の時計は「8時10分」
真ん中の時計は「3時15分」
下の時計は「11時45分」 https://t.co/HW4I9XGPl9 pic.twitter.com/VFbLUwv5i7
時計の時間の判別
筆者が試したところ回答は概ね正解となっていました。
全ての時計がダメなわけではなく、時計に数字が振ってない場合に判読が難しいことがあるようです。
o1 proでもだめ pic.twitter.com/NkCiaac3rX
— 石川陽太 Yota Ishikawa (@ytiskw) December 6, 2024
- アスキアートの表現
ChatGPT o1 pro modeのアスキーアートはまだ伸びしろありますね。現場からは以上です。 pic.twitter.com/1BcUiIqXhH
— Taiyo | AIで遊ぶ大学生 (@taiyo_ai_gakuse) December 6, 2024
少し可愛い笑っちゃうアスキアートが出力されています。
今後はもっと上手に描けるようになるかもしれませんね。
- プレゼン資料の作成
Canvaのテンプレスライドをもとに、o1 pro が作成したpython pptxのプレゼン資料4枚です↓
— kai (@kai_postv) December 6, 2024
とりあえず試してみただけなので改善の余地はありそうですが、イマイチですね... https://t.co/tCli4ako08 pic.twitter.com/cOnxd81hXY
まだパッとすぐ使えるものではないようです。
- コードの生成
まだ複雑なコードまでを解決できるわけではなく、エラー解消や複数のファイル構造理解には一定の工夫が必要です。
ChatGPT Proへのアップグレードの方法
ChatGPTのアカウントボタンを押す
ChatGPT ProプランへのアップグレードはまずChatGPTにアクセスします。
すると以下のような画面が出ますので、①アカウントのボタンをクリックします。
②設定のボタンをクリックします。
設定画面
設定画面にて、サブスクリプションのボタンをクリックします。
すると現在のプランが出てきますので、
プランを変更したい場合にはプラン変更をクリックします。
PlusとProプランの選択画面
するとプランの選択画面が出てきますので、Proプランにアップグレードする場合には赤の枠の方を選択するとサブスクリプションの支払い画面に行きます。
そこで支払い情報を入力するとアップグレードを完了することができます。
まとめ
本記事ではOpenAIのo1 proについて徹底的に解説しました。
概要からその特徴、他のモデルとの比較、価格プラン、実際の使い方までo1 proの魅力を知ることができたのではないでしょうか。
ChatGPTをはじめとした生成AIモデルは日々進化し私たちに新たな力を発揮してくれています。
上手に取り入れて日々の業務や作業の効率化に活用していきたいですね。
AI総合研究所は生成AI活用の情報を多く発信しています。
ぜひAI活用の参考にしてみてください。