NVIDIAの「NIM」でAI導入のハードルを一気に下げる！専門知識は必要ありません

2024年6月2日に、NVIDIAがCOMPUTEXにてNIMを発表しました。

また2024年6月19日に、NVIDIAは一時はAppleやMicrosoftを抜き、世界時価総額ランキング1位になりました。その金額はなんと、526兆円です。

そんなNVIDIAが開発したNIMとは一体何なのでしょうか？この記事を読むことで、疑問を解決することができます。

NIMを導入できる生成AIモデルの紹介から、NIMの導入方法まで共有しています。個人、企業を問わず、「NIMについて興味があり導入を検討している人全員」の参考になるはずです。ぜひ最後までお読みください。

なお、NVIDIAについてまとめた記事もあります。以下の記事を読むことで、NVIDIAがどんな会社なのか理解することができるはずです。

►NIMの概要
►NIMの５つの特徴
►NVIDIAが提供する生成AIモデルを紹介！(全てのモデルにNIMが活用できます)
►NIMを導入する前にNVIDIAにログインする
►プロフィールを作成する
►NIMを生成AIモデルに導入する方法
►NIMに関する記事の引用元
►まとめ

►NIMの概要

NIMは、NVIDIAが開発した推論マイクロサービスです。正式名称はNVIDIA Inference Microservices(日本語でNVIDIA推論マイクロサービス)と言います。

これまでAI開発に縁がなかった個人や企業でも、AIを活用できるように設計されたものです。複雑なAI技術と、企業が実際に必要とするシステムとの「橋渡し役」をしてくれます。

そうすることで、従来の10倍〜100倍の企業のアプリケーション開発者が、AIを使った社内改革を推進できるようになります。

AIの技術を導入するためのハードルが格段に下がります。

複雑なインフラ構築をしたり、専門知識を覚える必要はありません。

様々な環境に対応することができ、今あるシステムへの導入もスムーズに行うことができます。

またNIMは業界で広く使用されているAPI標準に対応しています。なので、他のシステムやソフトウェアと簡単に連携でき、安心して使用することができます。さらに、企業向けのサポートとしてNVIDIA AI Enterpriseがあります。導入から運用まで、NVIDIAがNIMについてのサポートをしてくれます。

►NIMの５つの特徴

「NIMって推論マイクロサービスのことなんだね！」ということは理解できました。しかしNIMの何がすごいのか、まだまだイメージができません。そこでこの章では、NIMの特徴についてもう少し具体的に共有していこうと思います。

上記の画像をもとに、その内容を見ていきましょう。その特徴は５つあります。

◼︎NIMの特徴その１：Prebuilt container and Helm chart（ビルド済みコンテナとHelmチャート）

NIMは、変更がしやすく自分の思い通りに操作ができるように設計されています。

☐デプロイ可能な環境例

開発したAIモデルは様々な環境に柔軟にデプロイできます。

✓デプロイとは？

作ったソフトウェアやサービスを、実際に使える状態にすること。

動かす場所を、環境に合わせて自由に選べます。普段活用しているのPCの中、インターネット上のクラウド、自社のサーバーなど、最適な場所を選んでNIMを導入することができます。

✓デプロイ可能な環境例

・PC

☐ビルド済みコンテナとHelmチャート

さらに、NIMではビルド済みコンテナとHelmチャートが提供されています。

✓ビルド済みコンテナとは？

アプリを実行するために必要なライブラリなどがパッケージ化された、自己完結型のソフトウェアパッケージのこと。

✓Helmチャートとは？

Kubernetes上でアプリを定義、インストール、管理するためのパッケージ管理ツールのこと。

✓ビルド済みコンテナとHelmチャートを利用することで、以下のようなメリットがあります

・デプロイが迅速

環境構築の手間を省き、迅速にアプリケーションをデプロイできます。

・変更しやすい

異なる環境でも同じコンテナイメージを使用できるため、移植性が向上します。

・管理が簡単

Helm チャートを使用することで、アプリケーションのバージョン管理や更新を効率的に行えます。

ビルド済みコンテナ Helmチャートは、NVIDIA独自のハードウェアだけでなく、有名なクラウドサービスやKubernetesを使った環境でも徹底的にテストされています。NVIDIAを利用したすべての環境でのサポートが受けられます。

また企業は、どこにでも生成AIアプリをデプロイすることができます。さらに、アプリや処理するデータも完全に制御可能です。

◼︎NIMの特徴その２：Industry standard APIs（業界標準のAPI）

NIMを活用することで、業界標準のAPIを使ってAIモデルにアクセスできます。またデプロイのプロセスも一般的なものと同じです。なので開発者は、特別な専門知識がなくても比較的簡単にAIアプリが開発できるようになります。

そして多くの場合、たった3行のコードを変更するだけで最新の状態にアップデートできます。

例えば、ある画像認識AIを利用したアプリを考えてみます。このAIがバージョンアップされて、精度が向上したとします。

今までならこの変更をアプリに反映するために、多くのコード修正が必要な場合がありました。しかし、NIMのAPIを利用すれば、数行のコード変更だけで新しいバージョンのAIモデルを組み込むことができるということです。

このように、簡単に利用できてスムーズに組み込むことができるため、企業はAIを迅速に導入することができます。そしてビジネスの成長に合わせて拡張していくことができます。

◼︎NIMの特徴その３：Domain specific code（ドメイン固有のコード）

特定の分野に特化したAIモデルの開発や活用にも力を発揮してくれます。

例えば、高速処理を可能にするNVIDIA CUDAライブラリに加えて、言語、音声、動画処理、ヘルスケアなど、様々な分野に特化して最適化されたカスタムコードがパッケージに含まれています。

これらのカスタムコードを活用することで、それぞれの用途に最適化された、より高精度で専門性の高いAIアプリを開発することができます。

◼︎NIMの特徴その４：Optimized inference engines（最適化された推論エンジン）

NIMは最適化された推論エンジンを活用して、高速性と効率性を追求します。可能な限り遅延をなくし、高い処理能力を実現します。

これにより推論処理にかかるコストが削減されました。なので、ユーザーに快適に利用してもらうことができます。

さらに公開されているAIモデルだけでなく、独自のデータを使ってAIモデルをカスタマイズすることも可能です。機密性の高いデータもデータセンターの外に出すことなく、精度とパフォーマンスを向上させることができます。

◼︎NIMの特徴その５：NVIDIA AI Enterprise

NIMはNVIDIA AI Enterpriseに含まれています。そのため、企業でのAI活用を強力にサポートしてくれます。

✓エンタープライズグレードには以下の基盤が備わっています

・機能ブランチ(新機能の開発が、既存機能の安定性に影響を与えないようにする効果があります)

・厳格な検証(リリース前に厳しい品質基準をクリアしています)

・サービスレベル契約によるサポート

・定期的なセキュリティアップデート

このように、企業が安心して利用できる機能が充実しています。

このような包括的なサポートと最適化された機能があります。NIMはAI開発に縁がなかった企業にとって、非常に重要なツールとなります。

►NVIDIAが提供する生成AIモデルを紹介！(全てのモデルにNIMが活用できます)

この章では、NVIDIAが提供する生成AIモデルの特徴や、使ってみて感じたことを共有していきます。この章で共有するような生成AIモデルに、NIMを活用できます。NIMを活用することのメリットは、NIMの５つの特徴で共有しました。

もちろんNIMは、ここで紹介していない生成AIモデルにも幅広く対応しています。「これからNIMを活用していきたい」と思っている人は、まず活用できる生成AIモデルについて理解しておきましょう！この章を読むだけで大丈夫です。

以下がNVIDIAの生成AIカタログになります。

このカタログでは、MODELSとINDUSTRIESに分類されています。MODELSでは、生成AIができることをカテゴリー別で紹介されています。INDUSTRIESでは、生成AIモデルが実際に活用される業界や分野について紹介されています。

◼︎MODELS

まず最初に、MODELSの共有をします。

2024年6月時点で、５つのモデルがあります。自社や個人で開発しているアプリにNIMの導入を検討している人は、ぜひ参考にしてください。

同じような生成AIモデルを利用している場合、NIMを導入することで、以下で紹介されているメリットを開発しているアプリでも得ることができます。

✓５つのモデルは以下のとおりです

・Reasoning(推論)

・Visual Design(ビジュアルデザイン)

・Retrieval(検索)

・Speech(音声)

・Biology(生物学)

この節では、上記の５つのモデルについて共有していきます。なお、モデルカタログの更新頻度は非常に早いです。なので、この記事で紹介されているモデルをすでに試せない場合があります。

モデルの紹介に関しては、NIMの導入を検討するための参考程度にご覧ください。

☐Reasoning(推論)

最初に共有する生成AIは、推論が得意な生成AIです。与えらた情報に基づいて、論理的な出力をしてくれます。

Reasoningをクリックすることで、画面が切り替わります。

クリック後、以下のような画面が表示されます。

✓Reasoning(推論)のカテゴリーでは、さらに以下のように項目が分かれています

・Developer Favorites(開発者のお気に入り)

・Fresh Off the Press(最新情報)

・Combine Vision and Language Intelligence(視覚と言語のインテリジェンスを組み合わせる)

☑︎Developer Favorites(開発者のお気に入り)

開発者のお気に入り欄では、４つのモデルが共有されています。

1.llama3-70b-instruct(meta)

✓この生成AIモデルの特徴

優れた文脈理解、推論、テキスト生成能力を持ち、複雑な会話を支えるモデルです。

使用する際は、該当するモデルをクリックします。

クリックすると、以下のような画面が表示されます。

この画面を下までスクロールすると、プロンプト入力画面が見つかるはずです。実際に使用してみたい人は、画面を下にスクロールしましょう。

Type text here…にテキストを入力することで、質問に対する内容を出力してくれます。例えば、以下のようにテキストを入力します。

出力の際はSendをクリックします。

出力の内容は以下のとおりです。

プロンプト欄に「日本語で出力してください」と追加の入力をすることで、日本語でも出力してくれます。

以下が出力内容の全文です。

このようなテキストベースの生成AIモデルに、NIMを活用することができます。

✓llama3-70b-instructのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

高性能なGPUアクセラレーションにより、複雑な会話の処理が高速化し、応答時間が短縮されます。また、大規模なデータセットの処理においても、処理速度が向上します。

✓GPUアクセラレーションとは？

コンピュータのグラフィック処理ユニット(GPU)を使って、処理速度を大幅に高速化すること。

2.mixtral-8x7b-instruct-vo.1(mistralai)

✓この生成AIモデルの特徴

指示に従い、リクエストを完了し、創造的なテキストを生成するMOE LLMです。

✓MoE LLMとは？

Mixture of Experts (MoE) Language Modelsの略。複数の異なる言語モデルを組み合わせることで、より強力な性能を発揮する大規模言語モデルのこと。

使用する際は、該当するモデルをクリックします。

クリックすると、以下のような画面に切り替わります。

この画面を下までスクロールすると、プロンプト入力画面が見つかるはずです。実際に使用してみたい人は、画面を下にスクロールします。

プロンプト欄に以下のようなテキストを入力します。

10歳の少年の物語を出力してください。

出力の際はSendをクリックします。

出力の内容は以下のとおりです。

以下が出力内容の全文です。

ちょっとだけ出力の精度が劣ってしまう感じがしますね。しかし今回の記事は、「NIMを活用できる生成AIモデルの紹介」なので問題ありません。

✓mixtral-8x7b-instruct-vo.1のような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

高度な推論タスクに対する処理能力が向上します。また複数の専門知識を持つモデルの組み合わせにより、創造的で正確なテキスト生成ができるようになります。

3.mistral-large(mistralai)

✓この生成AIモデルの特徴

複雑な多言語推論タスクに優れたモデルです。

使用する際は、該当するモデルをクリックします。

クリックすると、以下のような画面に切り替わります。

この画面を下までスクロールすると、プロンプト入力画面があります。実際に使用してみたい人は、画面を下にスクロールします。

出力の精度の違いをわかりやすくするために、上記のプロンプトを使用することにします。

入力後に出力する際はSendをクリックします。

出力の内容は以下のとおりです。

以下が出力内容の全文です。

日本語で出力してくれるものの、日本語の精度はそこまで高くない印象です。文字化けもしてしまっていますね。

✓mistral-largeのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

多言語対応やコード出力の際、効率よく出力してくれるようになります。また、複雑な推論タスクが迅速に処理されるようになります。なので、開発速度も向上します。

4.gemma-7b(Google)

✓この生成AIモデルの特徴

テキスト理解、変換、コード生成に優れた最先端のテキスト生成モデルです。

使用する際は、該当するモデルをクリックします。

クリックすると、以下のような画面に切り替わります。

この画面を下までスクロールすると、プロンプト入力画面があります。実際に使用してみたい人は、画面を下にスクロールします。

ここでも、上記のプロンプトを使用して検証しました。プロンプト入力後に出力する際は、Sendをクリックします。

出力の内容は以下のとおりです。

以下が出力内容の全文です。

✓gemma-7bのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

テキスト理解や変換、コード生成において、GPUによる高速な推論ができるようになります。また、データの通信速度や転送速度が向上します。さらに、アプリでの応答時間が改善されます。

✓GPUとは？

Graphics Processing Unitの略。画像や映像などの処理を高速に行うための、コンピュータの専用チップを指します。

☑︎Fresh Off the Press(最新モデル)

テキストや画像を理解し、情報豊かな応答を生成するマルチモーダルビジョンランゲージモデルです。

✓NIMを導入することのメリット

高速な画像解析とテキスト生成、また出力精度が高まります。さらに、複雑なクエリにも対応できるようになります。

✓クエリとは？

データベースや検索エンジンに情報を求めるための質問のこと。

✓llava-v1.6-34bとの違いは？

✓この生成AIモデルの特徴

東南アジア地域の文化、歴史、知識に特化したLLMです。東南アジアの文化的背景と歴史を深く理解しています。その理解をもとに、自然言語処理タスクを効率的に行うことができます。

✓NIMを導入することのメリット

ここで紹介されている生成AIモデルは、画期的なマルチモーダルモデルになります。画像内の視覚要素を理解し、推論する能力を備えている生成AIです。

「モデルについての説明」と「そのモデルにNIMを導入することのメリット」の2点をわかりやすくまとめました。

1.kosmos-2(microsoft)

✓この生成AIモデルの特徴

画像内の視覚要素を理解し、推論するために設計された画期的なマルチモーダルモデルです。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

実際に以下の画像が添付されています。加えて、プロンプトも入力されています。

性能を確かめることが目的なので、変更せずに活用しました。なお、出力内容もすでに表示されていました。以下が出力内容です。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・高度な視覚推論

画像のコンテキストをより深く理解するようになります。

・統合的なデータ解析

テキストと画像の情報を統合して解析することで、より広範囲な情報を提供してくれるようになります。

・リアルタイムのフィードバック

ユーザーとのやり取りはリアルタイムで行われます。その時のユーザーエクスペリエンスが向上します。

2.neva-22b(nvidia)

✓この生成AIモデルの特徴

テキストと画像を理解し出力するマルチモーダルビジョンランゲージモデルです。

✓マルチモーダルビジョンランゲージモデルとは？

画像とテキストに加えて、音声や動画など、複数の種類の情報を理解できるAIモデルのこと。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

実際に以下の画像が添付されていました。またプロンプトは、画像内のテキストを入力しました。

出力する際は、Runをクリックします。

以下が出力された内容です。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

画像とテキストの両方を利用した、より質の高い情報が出力されるようになります。加えてユーザーの質問に対して、より的確な答えが提供できるようになります。

3.deplot(google)

✓この生成AIモデルの特徴

画像を表に変える、ワンショットビジュアルランゲージモデルです。

✓ワンショットビジュアルランゲージモデルとは？

たった1つの例を見るだけで、新しい画像やテキストを理解できるAIモデルのこと。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

以下のように画像が添付されていました。また、このモデルではプロンプトを使用しません。画像だけで内容を理解してくれます。

加えて、すでに出力内容も表示されていました。以下のように、表形式で出力してくれます。白い表に関しては、僕が添付したものになります。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・視覚情報の効率的な変換

画像からテキストへの変換が、より迅速で正確になります。

・データ解析が簡単に

変換されたデータを簡単に解析することができるようになります。また、効率よくデータ分析ができるようになります。

4.fuyu-8b(adept)

✓この生成AIモデルの特徴

画像理解と言語生成を含む、幅広いタスクに対応するマルチモーダルモデルです。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

実際に以下の画像が添付されていました。加えて、プロンプトも入力されていました。

性能を確かめることが目的なので、変更せずに活用していきます。出力する際は、Runをクリックします。

以下が出力された内容です。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

画像理解と言語生成の両方を効率的に行い、多様なタスクに対応できるようになります。

☐Visual Design(ビジュアルデザイン)

次に共有する生成AIは、画像やグラフィックを理解することが得意な生成AIです。

Visual Designをクリックすることで、画面が切り替わります。

クリック後、以下のような画面が表示されます。

✓Visual Design(ビジュアルデザイン)のカテゴリーでは、さらに以下のように項目が分かれています

・Trained on Licensed Data with NVIDIA Edify(ライセンスデータを使用したトレーニングモデル)　　

・Leading Open Diffusion Models(先進的なオープンディフュージョンモデル)

☑︎Trained on Licensed Data with NVIDIA Edify(ライセンスデータを使用したトレーニングモデル)　　

ライセンスデータを使用したトレーニングモデルでは、現在2つのモデルが紹介されています。ここで紹介されているAIモデルは「企業向け」の大型言語モデルになります。

1.edify-image(gettyimages)

✓この生成AIモデルの特徴

高解像度の4K画像を生成できるモデルです。また商業利用に安全なライブラリをもとにしているため、信頼性が高いです。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

すでにプロンプトが入力されており、出力もされています。

高い精度で画像を出力してくれます。

またedify-imageでは、Featureをクリックすることで画像の修復などができます。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・高品質な画像生成

ユーザーはリアルタイムで高品質な4K画像を生成し、すぐに利用できるようになります。

・クリエイティブな活動が効率的に

画像生成と修正を迅速に行うことで、クリエイティブプロセスが効率化されます。プロジェクトのスピードが向上します。

2.edify-3d-early-access(shutterstock)

✓この生成AIモデルの特徴

テキストから高品質な3Dアセットを生成でき、商業利用に安全なライブラリを基にしているため、3Dコンテンツの作成が簡単です。

実際に使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

すでにプロンプトが入力されていました。なので、以下のプロンプトをそのまま活用していきます。

出力する際は、Runをクリックします。

以下が出力された内容になります。

2Dと3Dで画像を出力してくれました。なお3Dで出力された画像は、ドラッグ&ドロップで動かすことができます。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・リアルタイム3Dアセット生成

ユーザーはテキスト入力から、リアルタイムで3Dモデルなどのデジタル資産を作成できるようになります。

・クリエイティブの柔軟性

さまざまな3Dアセットを迅速に生成・修正できるようになります。なのでクリエイティブなプロジェクトにおいて、柔軟性が上がります。独自性の高いコンテンツ制作が容易になります。

☑︎Leading Open Diffusion Models(先進的なオープンディフュージョンモデル)

先進的なオープンディフュージョンモデルモデルでは、現在５つのモデルが紹介されています。ここで紹介されている生成AIモデルは画像や動画などのメディアを生成してくれます。最近導入された新技術です。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

1.stable-diffusion-3-medium(stabilityai)

✓この生成AIモデルの特徴

テキストから画像への生成モデルです。高品質な画像を生成します。

✓NIMを導入することのメリット

よりリアルで高品質な画像が迅速に生成できるようになります。

2.stable-diffusion-xl(stabilityai)

✓この生成AIモデルの特徴

リアルな美的要素を持つ画像を出力します。

✓NIMを導入することのメリット

より現実的で美しい画像を生成できるようになります。加えて、幅広い用途での高品質なビジュアル生成ができるようになります。

3.sdxl-lightning(bytedance)

✓この生成AIモデルの特徴

テキストから画像への生成モデルです。高品質な画像を生成してくれます。

✓NIMを導入することのメリット

効率的かつ迅速に、高品質な画像を生成できるようになります。

4.stable-video-diffusion(stabilityai)

✓この生成AIモデルの特徴

１枚の画像を条件フレームとして使用し、動画シーケンスを生成するディフュージョンモデルです。

✓動画シーケンスとは？

連続する複数の静止画を繋ぎ合わせて、動きのある動画を作成するためのデータのこと。

✓ディフュージョンモデルとは？

ノイズから徐々に画像や音声などのデータを作成するAIモデルのこと。

✓NIMを導入することのメリット

単一の画像から高品質な動画シーケンスを生成できるようになります。

5.sdxl-turbo(stabilityai)

✓この生成AIモデルの特徴

入力したテキストプロンプトから、リアルな画像を迅速に生成することができます。このモデルは、単一のネットワーク評価で画像を生成するため、高速で処理され出力されます。

✓NIMを導入することのメリット

非常に高速な生成プロセスで、リアルな画像を生成できるようになります。

☐Retrieval(検索)

Retrieval(検索)では、膨大なデータから必要な情報を効率的に探すのが得意な生成AIが紹介されています。

Retrievalをクリックすることで、画面が切り替わります。

クリック後、以下のような画面が表示されます。

✓Retrieval(検索)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Build Your First RAG Pipeline(初めてのRAGパイプラインを構築)

✓RAGパイプラインとは？

検索と生成AIを組み合わせて、より信頼性と最新情報を重視した回答を出力する技術のこと。

☑︎Build Your First RAG Pipeline(初めてのRAGパイプラインを構築)

RAGパイプラインを構築するための生成AIモデルは、現在4つ紹介されています。これらのモデルは、チャットベースの推論モデルを、企業独自のデータに接続するために使用されます。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

1.nv-embed-v1(nvidia)

✓この生成AIモデルの特徴

テキスト入力から高品質な数値エンベディングを生成します。

✓数値エンベディングとは？

数値データを、コンピューターが理解しやすいベクトルに変換する技術のこと。

✓NIMを導入することのメリット

より効果的なデータ検索と情報生成ができるようになります。具体的には、ユーザーがテキスト入力を行う際に、瞬時に高品質な数値エンベディングを生成ができるようになります。さらにユーザーがより直感的に操作できるようになり、エクスペリエンスが向上します。

2.arctic-embed-l(snowflake)

✓この生成AIモデルの特徴

GPU加速によるテキストエンベディングを生成します。

✓テキストエンベディングとは？

文章データを、コンピューターが理解しやすい数値ベクトルに変換する技術のこと。

✓NIMを導入することのメリット

GPU加速を活用した高速かつ効率的なテキストエンベディングの生成ができるようになります。ユーザーはリアルタイムでエンベディングを取得でき、これにより大量のデータを迅速に処理して検索精度を向上させることができます。さらにユーザーは、自身のニーズに合わせたカスタマイズができるようになります。

3.rerank-qa-mistral-4b(nvidia)

✓この生成AIモデルの特徴

特定の文章が「質問に対する情報を含んでいるかどうか」を確率で評価するために最適化されたGPU加速モデルです。

✓NIMを導入することのメリット

質問応答システムにおいて高い精度でリランキングを行うことができるようになります。加えてユーザーは、質問を入力するだけで関連性の高い情報を迅速に取得できます。そのため検索効率も飛躍的に向上します。

4.bge-m3(baai)

✓この生成AIモデルの特徴

テキストリトリーバルタスクのためのエンベディングモデルです。

✓テキストリトリーバルタスクとは？

大量のテキストデータの中から、特定の質問やキーワードに関連する文章を見つけるタスクのこと。

✓NIMを導入することのメリット

テキスト検索タスクにおいてさらに高いパフォーマンスを発揮します。また、ユーザーは複雑な検索クエリに対しても迅速かつ正確な結果を得ることができるようになります。加えて検索プロセスをより柔軟に管理し、自分のニーズに合った情報を効率的に取得できるようになります。

☐Speech(音声)

Speech(音声)では、音声を理解して、ユーザーが求めている出力をすることが得意な生成AIです。Speechをクリックすることで、画面が切り替わります。

クリック後、以下のような画面が表示されます。

✓Speech(音声)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Convert Speech to Text(音声をテキストに変換)

☑︎Convert Speech to Text(音声をテキストに変換)

このカテゴリーでは、現在1つの生成AIモデルが紹介されています。話された音声をテキストに変えてくれます。なおモデルは、クリックすることで実際に使用することができます。

1.parakeet-ctc-0.6b(nvidia)

✓この生成AIモデルの特徴

最先端の精度と速度で英語の音声を文字に起こすことができます。

✓NIMを導入することのメリット

音声からテキストへの変換がリアルタイムで行われるため、ユーザーは即座に音声を文字として利用できます。これにより音声データの活用が容易になり、生成AIモデルとの連携がスムーズになります。さらに音声認識のプロセスが効率化され、生成されたテキストを他のAIモデルでも利用できるようになります。ビジネスや教育、エンターテインメントなどの分野での応用が期待できます。

☐Biology(生物学)

生物学的なデータを理解し、分析することが得意な生成AIです。Biologyをクリックすることで、画面が切り替わります。

クリック後、以下のような画面が表示されます。

✓Biology(生物学)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Generative AI Virtual Screening(生成AIによるバーチャルスクリーニング)

✓バーチャルスクリーニングとは？

コンピューターを使って、膨大な数の化合物の中から、特定の病気や症状に効果がありそうな物質を見つける方法のこと。

☑︎Generative AI Virtual Screening(生成AIによるバーチャルスクリーニング)

このカテゴリーでは、現在4つの生成AIモデルが紹介されています。タンパク質の構造や機能を理解し、予測するために使われる最新の生成AIモデルです。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

1.rfdiffusion(ipd)

✓この生成AIモデルの特徴

タンパク質のバックボーンを生成するためのモデルです。特にタンパク質バインダーの設計に優れています。

モデルをクリックすると以下の画面に切り替わります。

✓NIMを導入することのメリット

ユーザーがタンパク質のバックボーンをリアルタイムで生成し、設計プロセスを即座に調整できるようになります。研究や開発のスピードが大幅に向上します。研究者は、より迅速に正確なバインダーを設計することができ、実験の反復回数が減少します。

2.esmfold(meta)

✓この生成AIモデルの特徴

タンパク質のアミノ酸配列から、3D構造を予測するモデルです。このモデルは、タンパク質のフォールディング（折り畳み）を高精度で予測し、薬物発見プロセスを支援します。

モデルをクリックすると以下の画面に切り替わります。

✓NIMを導入することのメリット

タンパク質構造予測のプロセスを、より直感的に行うことができるようになります。研究者はリアルタイムで構造予測の結果を得ることができ、即座にフィードバックを受け取りながら調整を行うことができます。これにより予測精度が向上し、研究の効率が高まり、迅速に新薬の発見ができるようになります。

3.diffdock(mit)

✓この生成AIモデルの特徴

分子がタンパク質とどのように相互作用するかを予測するドッキングモデルです。このモデルは、薬物とターゲットタンパク質の相互作用を3D構造として予測し、薬物発見プロセスを支援します。

モデルをクリックすると以下の画面に切り替わります。

✓NIMを導入することのメリット

ユーザーがリアルタイムでドッキング結果を確認できるようになります。これにより研究者は迅速に仮説を検証し、最適な薬物候補を見つけることができます。また、ドッキングの精度を向上させ、時間とリソースを節約できます。

4.molmim-generate(nvidia)

✓この生成AIモデルの特徴

薬物発見のために適切な特性を持つ分子を生成するモデルです。このモデルは、特定の化学的特性を持つ分子を生成するために制御された生成プロセスを使用します。

モデルをクリックすると以下の画面に切り替わります。

✓NIMを導入することのメリット

分子生成のプロセスを、より直感的に行うことができるようになります。また、研究者は生成された分子の特性をリアルタイムで確認し、必要に応じて即座に生成条件を調整できます。これにより、適切な特性を持つ分子を迅速に見つけることができ、薬物開発のスピードと効率が大幅に向上します。より効率的に研究を進めることができます。

◼︎INDUSTRIES

次に、INDUSTRIESのカテゴリーについての共有です。

このカテゴリーの中では、生成AIモデルが活用されている３つの分野について紹介されています。

☐Gaming(ゲーム)

Gamingをクリックすることで画面が切り替わります。

以下がGamingで紹介されている生成AIモデルになります。

今回はDigital Humansのaudio2faceについて共有します。ちなみにDigital Humansで紹介されているモデルでは、自然言語での対話から、ダイナミックなゲームキャラクターを作成することができます。

☑︎audio2face(nvidia)

✓この生成AIモデルの特徴

音声入力をリアルタイムでキャラクターの表情に変換するモデルです。この技術により、ゲームキャラクターは自然な口の動きや表情を持つことができ、より現実的なキャラクターを作成できます。特に音声に基づくリップシンクと顔のパフォーマンスにおいて、非常に高い精度を誇ります。

使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

サンプルの音声を使用してキャラクターの声を作成することができます。また驚きや悲しみ、喜びなども調整することが可能です。非常に細かい設定を行うことができます。

調整後、Runをクリックします。

クリックすることで、右に表示されているキャラクターが喋ります。口の動きと音声が一致していることに驚きました。

✓NIMを導入することのメリット

ユーザーがリアルタイムで音声を入力することで、ゲームキャラクターの表情やリップシンクがリアルタイムで反映されます。ゲーム内のキャラクターがプレイヤーと自然にコミュニケーションでき、没入感が大幅に向上します。さらにキャラクターの表現力を強化し、より多様なシナリオに対応したダイナミックなゲームキャラクターを作成することが可能になります。

☐Healthcare(医療)

Healthcareをクリックすることで画面が切り替わります。

以下がHealthcareで紹介されている生成AIモデルになります。

今回はMedical Imagingのvista-3dについて共有します。ちなみにMedical Imagingで紹介されているモデルでは医用画像をセグメント化することができます。

✓セグメント化とは？

画像やデータを意味のあるまとまりに分ける作業のこと。

☑︎vista-3d(nvidia)

✓この生成AIモデルの特徴

医療画像のセグメンテーションと注釈付けに特化したモデルです。主に人間の解剖学的構造を正確に識別し、詳細なセグメンテーションを行う能力があります。これにより、医療専門家が迅速かつ正確に診断を行うためのサポートが提供されます。

使用する際は、モデルをクリックします。

クリックすると、以下の画面が表示されます。

CT Image ExamplesからCT画像の例を選択することができます。

またClass Labelsから、肝臓や腎臓などの特定の部位を選択することができます。この機能は、CT画像内で特定の部位を識別し、解析するために使用されます。

特定の部位を選択するとRunが表示されます。画像を出力する際は、クリックをしましょう。

クリック後、以下の画像が出力されました。

素人では特定するのは難しいですが、このような画像も生成AIを用いて作成することができます。またDirectionを操作することで、CT画像を別の角度から見れるようになります。

✓NIMを導入することのメリット

セグメンテーションと注釈付けの結果が即座に反映されるようになります。医療専門家は迅速に対応ができるようになります。医療の質が向上し、より良い治療結果が期待できるようになります。

☐Industrial(産業)

Industrialをクリックすることで画面が切り替わります。

以下がIndustrialで紹介されている生成AIモデルになります。

今回はSimulate and Optimize Real World Outcomes(現実世界の結果をシミュレーションし最適化する)のcuoptとai-weather-forecastingについて共有します。現実世界の結果を予測するためのオペレーションズリサーチ、および予測アルゴリズムを搭載した生成AIモデルです。

☑︎cuopt(nvidia)

✓この生成AIモデルの特徴

物流、交通管理、配送計画など、多岐にわたる分野での最適なルート計画を可能にするモデルです。

使用する際は、モデルをクリックします。

クリックすると以下の画面が表示されます。

この画面ではデリバリーのシミュレーションをすることができます。例えばデリバリーの例を選択することができたり、時間などを考慮しながら効率的にデリバリーをする方法を見つけることができます。

また、Task Constraints(タスクの制約)とFleet Constraints(車両の制約)にはすでにテキストが入力されています。

これらの条件をもとにして、出力をしてみましょう。出力の際は、Runをクリックします。

以下の内容が出力されました。

このように、条件に合わせて最適化されたルートを出力してくれます。このような生成AIモデルにもNIMを導入することができるんです。

✓NIMを導入することのメリット

リアルタイムでルート最適化を行い、ユーザーに対して即時のフィードバックを提供できるようになります。これにより、企業は効率的なルート計画を迅速に作成し、コスト削減や時間の短縮が可能となります。また、変動する条件に対して即座に最適なルートを見つけ出し、より柔軟な運用が実現できます。

☑︎ai-weather-forecasting(nvidia)

✓この生成AIモデルの特徴

グローバルスケールでの天気予報ができるモデルです。このモデルは大規模な気象データを解析し、詳細な天気予報を提供するために設計されています。また、地域レベルの高精度な予報も可能です。

クリックすると以下の画面が表示されます。

入力スペースにはすでにテキストが入力されており、すぐに出力できる状態になっています。

上記の条件ではスーパーサイクロン「アンファン」のインドへの上陸に関する予測を設定しています。

予測を出力する際はForecastをクリックします。

以下の内容が表示されました。

指定された日時におけるインド付近の表面風速の予測が出力されました。色の違いによって、特定の地域でどの程度の風速が予測されているかがわかりやすく理解できます。この情報は、災害対策などに役立ちます。

✓NIMを導入することのメリット

リアルタイムで予報結果を確認し、必要に応じて詳細な情報を取得できるようになります。これにより、農業、交通、イベント企画など、さまざまな分野での意思決定が正確に行えるようになります。また天気予報の精度が向上し、予測の更新がスムーズに行われるため、常に最新の情報を得ることができます。そのため、全体的な社会の安全性と効率性が向上します。

◼︎生成AIモデルのカタログにアクセス(NIMが使えます)

以下のリンクから、生成AIモデルのカタログにアクセスできます。アクセスすることで、紹介されている生成AIモデルは全て使用することができます。「NIMを活用できる生成AIモデルに興味のある人」はぜひアクセスしてみてください。

https://build.nvidia.com/explore/discover

►NIMを導入する前にNVIDIAにログインする

まずは、AIカタログにログインしていきましょう。ホーム画面の右上にあるクリックします。

クリックすると以下の画面が表示されます。

それぞれの項目の日本語訳は以下のとおりです。

法人メールアドレスを使用するか、個人のメールアドレスを使用するかによって受けられるサービスが変わります。法人で使用する場合は法人のアドレス、個人で使用する場合は個人のアドレスを入力しましょう。

アドレスを入力後、Nextをクリックします。

クリックすると以下の画面が表示されるので、必要事項を入力していきます。

入力後、Create Accountをクリックします。

クリックすると以下の画面が表示されます。

この画面が表示されたタイミングで、届いたメールを確認します。もし届いていない場合はResend Emailをクリックしてもう一度送信してもらいましょう。それでもメールが届かない場合は、Change Emailでアドレスを変更しましょう。

届いたメールのVerify Email Addressをクリックすることで、以下の画面が表示されます。

NVIDIAからの情報やお知らせが必要な場合は、項目にチェックを入れます。確認ができたら、登録するをクリックします。

クリックすると以下の画面が表示されます。メールアドレスを入力してContinueをクリックします。

これでログインは完了です。次に、プロフィールを作成していきます。

►プロフィールを作成する

続いて、NVIDIAで使用するためのプロフィールを作成していきます。上記の画像のContinueをクリックした後、以下の画面が表示されます。

上記の画面に必要事項を入力していきます。入力が完了したら、Submitをクリックします。

これでプロフィール作成の完了です。

►NIMを生成AIモデルに導入する方法

最後の章では、実際にNIMに生成AIモデルを導入する方法について共有します。なるべく理解しやすいようにまとめました。NIMの導入を検討している人はぜひ参考にしてください。

NIMを導入する方法①環境の準備

NVIDIA AI Enterpriseのサポートを受けているインフラストラクチャソフトウェアを確認します。なお確認の際は、以下のリンクからご覧いただけます。

デプロイメントガイド🔽

https://docs.nvidia.com/ai-enterprise

上記のサイトを日本語訳にしたものが、以下の画像です。

NIMを導入する方法②NVIDIA AI Enterpriseのインストール

デプロイメントガイドに従って、NVIDIA AI Enterpriseインフラストラクチャソフトウェアをセットアップします。

✓やるべきことは以下のとおりです

・インフラ準備

必要なハードウェア（GPUサーバー等）とソフトウェア（Docker、Kubernetes等）の準備をする

・ネットワーク設定

クラウドやデータセンターのネットワーク設定を確認し、NVIDIA AI Enterpriseの動作に必要なポートやプロトコルを設定する。

NIMを導入する方法③NIMのダウンロードと設定

NGC(NVIDIA GPU Cloud)カタログにアクセスし、使用するNIM（例：BioNeMo DiffDock NIM）を選択します。なおNGCカタログは、以下からご覧いただけます。

NGCカタログ🔽

https://catalog.ngc.nvidia.com/?filters=&orderBy=weightPopularDESC&query=&page=&pageSize=

次に、選択したNIMのLearn Moreボタンをクリックし、詳細情報ページに移動します。

次に、詳細ページ内のQuick Start Guideをクリックし、NIMの導入手順を確認します。

✓やるべきことは以下のとおりです

・ダウンロード

NIMのコンテナイメージやその他の必要なファイルをダウンロードします

・設定ファイル

NIMの動作に必要な設定ファイルを確認し、編集します。

NIMを導入する方法④CUDAドライバのインストール

推奨されるCUDAドライバをインストールします。インストールする際は、以下のリンクをご覧ください。

CUDAドキュメント🔽

https://docs.nvidia.com/cuda

2024年6月時点では、ドライババージョン550.54.14が推奨されています。

次にインストールガイドに従って、ネットワークリポジトリを使用してパッケージマネージャ経由でインストールします。

次に、docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi コマンドを実行します。CUDAドライバが正しくインストールされていることを確認しましょう。

なお、以下がNVIDIAドライバダウンロードページになります。

https://www.nvidia.com/Download/index.aspx

NIMを導入する方法⑤DockerおよびNVIDIAコンテナツールキットのインストール

DockerとNVIDIAコンテナツールキットをインストールします。公式サイトからインストールすることができます。

Docker公式サイト🔽

https://www.docker.com

なお、Dockerをインストールする際はインストールガイドをご覧ください。

NVIDIAコンテナツールキットは以下からインストールすることができます。

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

インストール後、NVIDIAコンテナツールキットのドキュメントのConfigure Dockerに従って設定を進めていきます。

NIMを導入する方法⑥NGC APIキーの生成と設定

NGC APIキー生成ページにアクセスし、APIキーを生成します。export NGC_API_KEY=<value> コマンドを使用してAPIキーを設定します。

次に、echo "export NGC_API_KEY=<value>" >> ~/.bashrc または echo "export NGC_API_KEY=<value>" >> ~/.zshrc を実行して、APIキーを環境変数に保存します。

以下が、APIキーを作成するページになります。

NGC APIキー生成ページ🔽

https://org.ngc.nvidia.com/setup/personal-keys

NIMを導入する方法⑦NGCへのDockerログイン

ターミナルでdocker loginコマンドを実行します。次に、NGC APIキーを使用してNGCコンテナレジストリにログインします。

NIMを導入する方法⑧NIMコンテナの起動

次に、NIMコンテナの設定とモデルのダウンロードをしていきます。その際、ターミナルで以下のコマンドを実行します。

1.コンテナ名とイメージ名を設定します

2.必要なモデルをダウンロードします

3.ダウンロードしたアーティファクトを解凍します

4.以下のコマンドを実行してNIMを起動します

ここで補足があります。

✓補足

異なるGPU環境では、--gpusフラグやNVIDIA_VISIBLE_DEVICES環境変数を使用して、特定のGPUを指定することができます。

NIMを導入する方法⑨サポートとドキュメントの利用

VIDIA AI Enterprise Documentation Hubで、リリースドキュメントや追加のデプロイメントガイドを参照します。その際、NVIDIAの公式ドキュメントを参照し、導入時のベストプラクティスを確認するのがおすすめです。

次にエンタープライズサポートにアクセスし、ナレッジベースの記事やサポートケースを参照します。

導入時に問題が発生した場合は、NVIDIAのサポートに問い合わせるようにしましょう。もしくはナレッジベースを利用して解決策を探します。

デプロイメントガイドは、以下から参照することができます。

https://docs.nvidia.com/ai-enterprise

また、以下がエンタープライズサポートページになります。

https://www.nvidia.com/en-us/support/enterprise

NIMを導入する方法⑩ライセンスの確認

NVIDIA AI Product Agreementのライセンス条件を確認し、同意します。その後、必要なライセンスキーを取得します。

ダウンロードしたアーティファクトを使用し、NIMを実行していきます。取得したライセンスキーを使用して、NIMのライセンス認証を行います。

NIMを導入する方法⑪推論の実行と検証

推論リクエストの実行と、動作確認をしていきます。

1.NIMコンテナが正常に起動し、次のメッセージが表示されるのを確認します

2.別のターミナルで次のコマンドを実行し、推論可能なモデルのリストを取得します

3.推論リクエストを実行し、動作を検証します

上記の上記の①〜⑪の手順に従うことで、NVIDIA NIMを正しく導入しすることができるはずです。

AIアプリの開発を進めていくことができます。

►NIMに関する記事の引用元

NVIDIAのNIMに関する記事を書くにあたって、以下のリンクを参考にしました。

https://developer.nvidia.com/ja-jp/blog/nvidia-nim-offers-optimized-inference-microservices-for-deploying-ai-models-at-scale

https://docs.nvidia.com/nim/large-language-models/latest/getting-started.html

►まとめ

以上になります。

少し前の時代では生成AIに触れることもなかったし、自分でAIアプリを構築するなんて考えることもできませんでした。しかし、時代は大きく変化しています。NIMのような、誰でも活用できる推論マイクロサービスが開発されました。決して簡単ではないですが、取り組もうと思えばどんな人でも本格的なAIアプリを構築することができます。

目まぐるしく変化をしていくAIの分野ですが、しっかりと情報をキャッチすることが大切だと思ってます。今現在何が起きているのか、どんな便利な物が開発されているのかを理解するのは大切なことですね。そのサポートができるように、僕自身も学びつつ、今後も記事の中で共有していこうと思います。

この記事がNIMの導入についての検討、そして新たな視点の提供につながれば幸いです。

なお記事に関しての感想やご要望等ございましたら、コメント欄にて受け付けてます。このページを下までスクロールすると見つかります。

読んで頂いた人の意見をもとに、記事の内容を向上させていきたいと思ってます。ぜひご記入ください！

最後までお読み頂きありがとうございます。