2024-04-30

透明性と自己整合性を兼ね備えたコード生成の新時代：StarCoder2-15B-Instructの革新

この記事のポイント

この記事はStarCoder2-15B-Instruct-v0.1の概要とその特徴を紹介しています。
StarCoder2-15B-InstructはHumanEvalスコア72.6を記録し、他の先進的なモデルを上回る成績を達成しています。
開発プロセスの透明性が強調されており、オープンソース化によって広く研究や開発に活用される可能性があります。

監修者プロフィール

坂本将磨

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域：自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

本記事では、透明性と自己整合性を重視した新時代のコード生成モデル「StarCoder2-15B-Instruct-v0.1」について取り上げます。
発表されたばかりのこのモデルは、他の先進的なモデルたちと比較しても優れた成果を示し、実践的なコード生成能力という点で大きな可能性を見せています。

そのトレーニングパイプラインの透明性やオープンソース化は、さらなる研究や開発にどのように影響を与えるのか、詳細にわたって解説していきます。開発者や研究者、あるいはコーディングに関心のある全ての方々にとって必読の内容です。

StarCoder2-15B-Instruct-v0.1：新しい時代のコード生成モデル

StarCoder2-15B-Instructのトレーニングパイプライン：透明性と多様性

StarCoder2-15B-Instructの評価：競合他社を上回る性能

StarCoder2-15B-Instructの影響とオープンソース化

StarCoder2-15B-Instruct-v0.1：新しい時代のコード生成モデル

2024年4月29日に発表されたStarCoder2-15B-Instruct-v0.1は、進化したAIによるコード生成モデルです。

このモデルは、許諾的かつ透明な方法で開発され、コード生成タスクにおいて優れた成果を上げています。特に注目すべきは、HumanEvalスコアで72.6を達成し、他の有名なモデルであるCodeLlama-70B-Instructのスコアを上回ったことです。

StarCoder2-15Bのベンチマーク
EvalPlusベンチマーク

StarCoder2-15B-Instructは、多様で高品質なPython関数のシードデータを基に、多様なコーディングタスクの指示を自己生成し、それに対する応答を自己検証することで、高品質な訓練データを生成しています。

このモデルは、自己生成したデータによって学習を行う自己整合技術を使用しており、その仕組みによりモデルはより効果的にコードを生成できるようになっています。

StarCoder2-15B-Instructのトレーニングパイプライン：透明性と多様性

StarCoder2-15B-Instructの開発において重要なのが、そのトレーニングパイプラインです。このパイプラインは3つの主要なステップで構成されています。

StarCoder2-15B-Instructのトレーニングパイプライン

まず、The Stack v1という大規模なコードコーパスから、多様で高品質なシード関数を抽出します。次に、これらの関数を基に、多様なコーディング指示を生成します。
そして最後に、生成された応答を自己検証することで、品質を確保しています。

このプロセスを通じて、モデルはより実践的で有用なコード生成能力を身につけることができます。
透明性と多様性を重視したこのアプローチは、モデルの汎用性と実用性を高める重要な要素となっています。

StarCoder2-15B-Instructの評価：競合他社を上回る性能

StarCoder2-15B-Instructのパフォーマンスは、EvalPlusというベンチマークを通じて評価されています。
結果として、このモデルは、その規模で最も優れた許諾的LLMとして際立っており、より大きなモデルや、非透明なモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。

StarCoder2-15BのLiveCodeBenchにおけるスコア
LiveCodeBenchベンチマーク