この記事のポイント
- この記事は、マイクロソフトの最新自然言語理解とAI支援技術の研究について解説しています。
- 新たな研究では、自然言語の意図をプログラムが理解しやすい形式に変換することでバグの特定が可能になったことを示唆しています。
- データ分析においては、自動的に洞察を得るための技術が開発され、データサイエンティストの作業効率が向上することが期待されます。
- 盲目・弱視の人々向けには、AIを利用した支援技術が研究されており、訓練データの不足が認識の精度に影響を及ぼしていることが認識されています。
- プライバシー保護に重きを置いた機械学習技術の研究が進み、機械学習の安全性が向上しています。
- マイクロソフト研究所の社長ピーター・リーがTIME100 Healthリストに名を連ねるなど、同研究所の研究が世界的に影響力を持っていることがわかります。
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
マイクロソフトが研究開発を推進する今日この頃、自然言語理解とAI支援技術における新たな動向が注目されています。
本記事では、プログラムの理解と実行における曖昧さの解消、データ分析での自動インサイト生成技術、障害者支援のためのAI適用、プライバシー保護を強化する機械学習手法など、研究の進展とその応用方法について、詳しくご紹介します。
盲目や弱視の人々のための技術や、訓練データのプライバシー保護など、社会的な利益をもたらす可能性を秘めた進化が期待される中、マイクロソフトの研究者たちは、AIというフィールドで革新的な成果を次々と生み出しています。
さらに、研究所の社長ピーター・リーがTIME100 Healthリストに名前を連ねるなど、研究チームが世界的な影響力を有することも明らかになっており、それぞれの分野での最先端の進捗状況を見守ることができるでしょう。
自然言語の意図とプログラムの事後条件の変換
マイクロソフト研究所は、プログラマーが書くコードやドキュメントにおける自然言語の意図を、プログラムが理解しやすい形式へと変換する研究を進めています。
れにより、コードのバグを特定したり、信頼性を高めることが可能になるかもしれません。
ただし、自然言語の曖昧さが問題となることがあり、研究所はこの問題を解決するために大規模言語モデル(LLM)を利用しています。
新たな論文では、この技術によって実際に役立つ事後条件を生成し、実際のプロジェクトでのバグを発見できることが示されています。
自動インサイト生成:質問とコード生成のセマンティック整合性
データ分析の分野において、自動的に有益な洞察を得ることは非常に重要です。マイクロソフトの研究者たちは、データから直接的な洞察を引き出すための、セマンティックに整合した質問とコードを生成する技術を開発しました。
これにより、データサイエンティストやエンジニアはより効率的にデータを探索できるようになります。実証的な研究を通じて、この技術がデータに関するより興味深い洞察を提供することが示されています。
CLIPモデルと盲目/弱視ユーザーのためのAI
AIは盲目や弱視の人々を支援するために有効ですが、これまでの研究ではそのパフォーマンスに格差があることが明らかにされていました。
マイクロソフトと世界銀行の研究者は、大規模マルチモーダルモデル(CLIP)を評価し、障害者用オブジェクトを認識する際の正確さに問題があることを発見しました。
この問題は、訓練データにBLV関連のコンテンツが不足していることが原因であることが示唆され、数ショット学習アプローチによって改善できる可能性があるとされています。
プライバシー保護とMLモデル:DP-SGDの新しいアプローチ
機械学習モデルを訓練する際のプライバシー問題に対処するため、マイクロソフト研究所は新しいアプローチを提示しています。
この研究では、差分プライバシー(DP)を用いて、メンバーシップ推論と属性推論を定量化する新しい手法が紹介されています。
これにより、訓練データのプライバシーを守りつつ、モデルのユーティリティを維持することが可能になります。
マイクロソフト研究ニュースと影響力ある人物
マイクロソフト研究所の社長ピーター・リーが、2024年TIME100 Healthリストに名を連ねるなど、研究所は多方面で注目されています。
また、研究所はサンクチュアリAIと協力し、AIモデルの開発を進めています。
さらに、小型言語モデルのPhi-3や、AIを活用した新薬開発、持続可能な農業の支援など、多岐にわたる分野での研究開発が行われています。
出典:Microsoft