この記事のポイント
- OpenAIは、AGI開発を目指すAI研究組織で、AIの利益を人類に還元が目標
- ChatGPT、DALL・E、Whisperなど革新的AIサービスの特徴と使用法を紹介
- OpenAIの歴史と、AIがもたらす社会的影響を分析
- AGI開発の潜在的リスクと利点をOpenAIの見解から考察
- AIの倫理的開発と利用に関するOpenAIの取り組みを解説
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
AI技術の急速な発展とともに、私たちの生活やビジネスに革新をもたらす組織「OpenAI」に関心が集まっています。
設立者にイーロン・マスクやサム・アルトマンらが名を連ねるOpenAIは、2015年に発足し、一般の利益を目標に汎用人工知能(AGI)の開発を推進。その究極の目的は、AI技術の恩恵を全人類に還元することにあります。
この記事では、OpenAIの基本情報から歴史、代表的なAIサービス「ChatGPT」「DALL・E」「Whisper」の使い方、さらにはAGI開発に伴うリスクと利点に至るまで、徹底解説します。
OpenAIが描く未来図と日々の進化に目を向けることで、AIが有するポテンシャルと、社会へのインパクトを深く理解していただけるでしょう。
最新モデル、OpenAI o1(o1-preview)について詳しく知りたい方は、こちらの記事もご覧ください⬇️
OpenAI o1(ChatGPT o1)とは?その特徴や使い方、料金体系を徹底解説!
OpenAIとは
OpenAIは、人工知能(AI)の研究と開発に焦点を当てた非営利団体で、2015年にアメリカ合衆国で設立されました。
主な設立者にはイーロン・マスクとサム・アルトマンがいます。他にも名だたる起業家、研究者、技術者が関与しています。
彼らの目標の一つは、**汎用人工知能(Artificial General Intelligence = AGI)**の開発です。
AGIは、人間のように幅広いタスクを学習し、理解し、実行できるレベルの人工知能を指します。
OpenAIは、そのようなAGIを安全かつ利益をもたらす形で開発し、その利益を広く人類に還元することを目指しています。
そして、AGIがもたらす潜在的な影響を考慮し、その研究と開発において倫理的かつ安全なアプローチを取ることを重視しています。
【関連記事】
➡️AGIとは?従来のAIとの違いや活用領域、今後の課題を徹底解説
OpenAIの歴史
ChatGPTの発表によって世間に広く知られることになったOpenAIですが、何もいきなり発足されたわけではありません。
彼らの歩みにも歴史があります。次に、どのような変遷をたどって現在のOpenAIという組織があるのかを概観してみましょう。
<【2018年】GPTのリリース / 商業モデルへのシフト>
2018年に最初のGPTモデルをリリースしました。GPTは、以前のAI言語モデルと比べて大幅に進歩したことで注目を集め、OpenAIが次々と発表するGPTシリーズの基礎となりました。
また、組織体制の変更もありました。非営利団体から「OpenAI LP」という「キャップド・プロフィット」構造への移行です。
これは、投資を引きつけつつも、利益を特定の限界までに制限し、研究目的に忠実でいることを可能にするものです。これにより、より多くの資金を研究に投じることができるようになりました。
この時点では、ChatGPTはリリースされていません。「GPT」とはディープラーニングという機械学習の手法でトレーニングされたモデルの1つであり、「ChatGPT」はそのGPTを利用したウェブサービスです。
GPTがChatGPTとしてリリースされるのは、ここから4年後の2022年となります。
<【2019年】GPT-2のリリースとその影響>
言語生成モデルGPT-2を発表しましたが、当初はその強力な生成能力が悪用される可能性を懸念して、完全なモデルのリリースを控えました。
後に、社会への影響を評価した上で、フルモデルを公開し、AIの責任ある使用に関する広範な議論を促しました。
<【2020年】GPT-3とChatGPTの開発>
2020年には、さらに進化したGPT-3が発表され、その規模と精度は業界内外で大きな注目を集めました。
GPT-3は、自然言語処理の分野において顕著な進歩を示し、多くの実用的応用が可能となりました。
2022年末には、これを基にした対話型AIモデル「ChatGPT(次で紹介)」がリリースされ、一般の人々にも広く利用されるようになりました。
<【2022年】ChatGPTのリリースとその影響>
先ほど紹介したChatGPTが2022年末にリリースされました。これはGPT-3.5モデルをベースにした対話型AIです。
GPT-3.5は、自然言語を理解し、それに応じた会話を行うことができます。ChatGPTは一般ユーザーに広く公開され、そのユーザーフレンドリーなインターフェイスと高度な言語処理能力で大きな注目を集めました。
その後、ChatGPTは教育、ビジネス、エンターテイメントなど、多くの分野に影響を及ぼしました。
<【2023年】技術の進化とパートナーシップ>
2023年には、さらに進化したモデルであるGPT-4がリリースされました。
この新しいモデルは、理解力、文脈の捉え方、より正確な情報生成能力が向上しており、さらに広範囲の応用が可能となっています。
さらに、Microsoftとのパートナーシップを強化し、特にAzureクラウドプラットフォームを利用して、AIサービスの提供を拡大しています。
この協力関係は、OpenAIの技術をより多くの企業や開発者に利用しやすくするためのものです。
【関連記事】
➡️Azure OpenAI Serviceとは?その機能や料金、活用方法を解説
OpenAIが提供するAIサービス
OpenAIはいくつかの革新的なAIサービスを提供しており、これらは多様な用途に活用されています。
主要なサービスを以下に紹介します。
ChatGPT
ChatGPTの特徴は何と言っても対話型に設計されている点です。ユーザーからの質問やコメントに基づいて適切な回答を提供してくれるため、誰でも簡単にAIを使ってタスクをこなしたり生成物を生み出したりすることができます。
日常の質問に答えたり、スケジュールの管理を助けたりなどの「個人的なアシスタント」としての活用から、教育ツールやカスタマーサポートなどまで、幅広いジャンルで多様な使い方をされています。
上述したような生産性を誇るChatGPTは、確かに多くのテーマやトピックについての広範な情報を持っています。
ただし、最新の情報や特定の詳細については、常に最新の状態を保証するものではないため、重要な情報については確認が必要です。
ChatGPTの使い方
それではさっそくChatGPTの使い方を見ていきましょう。
以下のURLからChatGPTを利用することができます。
ChatGPT
すでにアカウントを持っている人は「Login」を、まだアカウントを持っていない人は「Sign up」を選択し、アカウントが使える状態にしてください。
ChatGPTのトップページ
アカウントの準備ができたら、以下の画像になります。「Message ChatGPT..」の欄にて、試しに何か質問してみましょう。
きっとChatGPTが素敵な回答を返してくれるはずです。
ChatGPTの操作画面
ChatGPTの基本機能や、できることについては、こちらの記事で解説しています。
➡️ChatGPTでできること一覧!Plusとの違いやビジネス活用も紹介【最新】
DALL・E3
DALL-EはOpenAIによって開発された革新的な画像生成AIで、テキストの説明から独創的な画像を生成する能力を持っています。
GPTモデルに、GPT2やGPT3といったバージョンがあったように、DALL-Eにも「DALL-E2」や「DALL-E3」といったバージョンがあります。
この記事の執筆時では、「DALL-E 2」の新規ユーザー登録は受け付けていなかったため、「DALL-E3」を使いましょう。
DALL・E3の使い方
DALL-E 3は、DALL-E 2と違って、生成される画像のクオリティがとても高いです。また、ChatGPT上で使える点も大きな違いです。
ChatGPT上で、「XXな画像がほしい」とメッセージを送れば、AIが自動で画像生成モードに切り替わり、画像が生成されます。
使い方は先ほどのChatGPTと同様です。例えば、商品企画を考える状況で説明します。
以下のように、ChatGPTにデザイン案をどのようにすればいいか聞いてみました。
カバンに扇風機が取り付けられていて、夏に街を歩いていても、気分次第で扇風機の風を浴びて涼しくなるようなカバンの製品を開発したい。
下の画像ご覧ください。ここではテキスト上でアドバイスをしてくれていますが、ここでさらに、画像で見せてくださいと頼むと、次のようになります。
ChatGPT上で商品のアドバイスをもらう
このように、DALL-Eを使うことで文章から画像を生成することが可能になります。
ChatGPT上で画像を生成する
この事例では、文章での質問と並行して画像も生成してもらうというやり方でしたが、最初から画像の生成を依頼することももちろんできます。
ChatGPT上で画像を生成する2
DALL-E3の使い方や料金体系については、こちらの記事で詳しく解説しています。
➡️DALL-E3とは?使い方や料金、無料で使う方法を紹介!商用利用は可能?
Whisper
WhisperはOpenAIが提供する無料の音声認識モデルです。
このモデルは、Webから収集した約68万時間にわたる多言語の音声データに基づいて学習しており、入力された音声を高精度でテキストに変換することができます。
Whisperの使い方
そのWhisperの使い方には大きく2つの方法がありますが、ここでは簡単なやり方で実践できる方法を紹介します。
Hugging faceという場所で公開されているものなので、そちらを使います。「Hugging Face」は、AIモデルや機械学習のための学習用データセットが公開されているプラットフォームで、登録不要で無料で利用可能です。
以下のURLから操作画面に飛べます。
https://huggingface.co/spaces/openai/whisper
操作の手順は以下の通りです。
1.「❶ Record from microphone」を選択することで、マイクから音声を入力できます。
2.「❷ 送信」を選択することで、音声解析が始まり、しばらく待つと、テキストに翻訳されます。
Whisperの操作画面
OpenAIが見据える、AGI開発のリスクと利点
冒頭でも紹介しましたが、AGIは、幅広い問題に対して総合的に取り組むことが可能です。
対比的な言葉として、ASI(Artificial Specific Intelligence = 特化型人工知能)があります。
こちらは、現在の主なAI技術が該当しており、特定のタスクに特化した機能をもちます。
OpenAI CEO サム・アルトマンは、2023年2月、「AGI実現に対する短期および長期のロードマップ」を発表し、人類改善のためのリスク軽減策について説明しました。
そこではAGIについての可能性と危険性の両面が述べられています。
例えば、AGIの開発には以下のような利点があります。
-
経済的な豊かさの増大
AGIが人間の労働を補助または代替することで生産性を向上させ、新たな産業やサービスが創出されます。 -
科学的な進歩の加速
AGIは複雑なデータの解析や実験の自動化を助け、これまでにないスピードで新しい発見を促進するとされています。
他方で、そのリスクに関しても言及されています。そこでは、AGIが持つ強大な能力が誤って、または悪意を持って使用される可能性があるとされています。
例えば、個人のプライバシー侵害、不正な監視、自動化による雇用の大規模な喪失などです。
さらに、AGIの行動が予測不能であるため、意図しない結果を招くことも懸念されます。
これに対処するため、OpenAIは段階的な導入と厳格な国際的な監視体制の確立を提案しています。
詳しくはOpenAIが運営するWebサイト上でご覧いただけます。
➡️Governance of superintelligence
OpenAIの今後
先ほど紹介したアルトマンの2023年の発表では、このような言葉がありました。
人間の知性を超えた存在を成功させることは人類史上最重要事項であり、希望に満ちてはいるが、恐ろしいプロジェクトだ。
OpenAIはChatGPTの導入によってその名を人口に膾炙させましたが、彼らはAGIを目指しています。
AGIが完全に運用され、社会に浸透し始めることは、様々な可能性とともに物議をかもす可能性があります。上述した利点の部分でも、その産業的なインパクトの大きさを述べましたが、そのような明るい方向に加えて、様々な潜在的なリスクが予想されます。
OpenAIはそのような倫理的なマネジメントにも力を入れているため、ますます今後のAGIの方向性を検討する上で、OpenAIの存在は欠かせないようになっていくでしょう。
まとめ
この記事ではOpenAIの概要や歴史、そして実際に提供しているサービス、今後の運用リスクなどについて説明してきました。
突然世界中を話題にさせるような海外の企業というと抵抗感があるかもしれませんが、OpenAIも人間が運営している1つの企業です。
そんな企業の歴史や、提供しているサービス、理念などがこの記事で伝わっていれば幸いです。