この記事のポイント
- この記事はNVIDIAのゲノム解析ツール「Parabricks v4.3.1」に関する内容です。
- Parabricksには新しく体細胞データに特化したバリアントコーリングの機能が追加され、大きなアップグレードが行われました。
- DeepSomaticやMinimap2などのツールもアップグレードされ、ゲノムシーケンスの計算資源の負担を軽減しました。
- ベンチマーク結果に基づくと、特にNVIDIAのGPU H100やL4使用時の解析速度とコストに改善が見られます。
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
ゲノム研究における深層学習の応用を推進するNVIDIAが、体細胞変異の研究をより深化させるための新たなツール、Parabricks v4.3.1を発表しました。
この新バージョンにより、体細胞データ用のバリアントコーリングを新機能として提供し、ゲノミクス分析のスピードと精度を飛躍的に向上させています。
特に、DeepVariantやMinimap2のアップグレードにサポートを加え、ゲノムシーケンサーに必要な計算資源の負担を大幅に軽減。
NVIDIAが提供する最新ベンチマーク情報を基に、H100やL4などの人気のGPUを用いた際の速度やコストの改善点も明らかにしています。
本記事では、これらの技術革新がゲノム解析の現場にどのような影響を与えるのか、そしてその詳細について解説していきます。
NVIDIA Parabricksによる体細胞変異の解析加速
NVIDIAは、ゲノム研究の分野での深層学習の活用を進め、Parabricks v4.3.1を発表しました。
この新しいバージョンには、体細胞データ用のバリアントコーリング(変異検出)の新機能が含まれており、業界をリードするツールの最新バージョンへのアップグレードが行われています。
特に、GoogleのDeepSomaticが短いリードシーケンシングでのサポートを受け、DeepVariant(1.6.1)とMinimap2(v2.26)のアップグレードが提供されます。
バリアントコーリングは、遺伝子の変異を特定するための重要な過程であり、多大な計算資源を必要とする作業です。
NVIDIA Parabricksは、これらの作業をGPU加速によって高速化し、研究者がより正確かつ迅速に実施できるようサポートしています。
DeepSomaticとMinimap2のアップデート
体細胞変異は、生殖細胞(卵や精子)以外の細胞で発生し、遺伝せず、無作為に起こります。
DeepSomaticは、Googleが開発したDeepVariantの体細胞データ向けバージョンであり、高い精度で変異を検出することができます。
DeepVariantと同様にオープンソースであり、Parabricks最新バージョンでは短いリードシーケンシング用のDeepSomaticがサポートされ、GPU加速を活用しています。
一方、Minimap2は長いリードシーケンスのアラインメント(配列の整列)に用いられるツールで、最新バージョンではRNAシーケンシングデータのスプライスアラインメントや、長いリード楽器プロバイダーとの統合が改善されています。
Parabricksとベンチマークの改善
NVIDIAは、各リリースごとにツールやGPUにわたるベンチマーク性能の継続的な改善に取り組んでいます。
Parabricks v4.3リリースからの最新ベンチマークは、NVIDIAの最も人気のあるGPUであるH100とL4を使用した場合の最速のスピードとサンプルごとの最低コストを示しています。
これにより、科学者や研究者はがんシーケンスをより迅速に分析することが可能になります。
また、NVIDIAのChelsea Gomatamは、製品のマーケティングマネージャーとして、NVIDIA加速コンピューティングとゲノミクス解析ソフトウェアの製品ポジショニングをリードしています。
出典:NVIDIA