NVIDIAの「NIM」でAI導入のハードルを一気に下げる!専門知識は必要ありません

生成AIの読み物

2024年6月2日に、NVIDIAがCOMPUTEXにてNIMを発表しました。

また2024年6月19日に、NVIDIAは一時はAppleやMicrosoftを抜き、世界時価総額ランキング1位になりました。その金額はなんと、526兆円です。

そんなNVIDIAが開発したNIMとは一体何なのでしょうか?この記事を読むことで、疑問を解決することができます。

NIMを導入できる生成AIモデルの紹介から、NIMの導入方法まで共有しています。個人、企業を問わず、「NIMについて興味があり導入を検討している人全員」の参考になるはずです。ぜひ最後までお読みください。

なお、NVIDIAについてまとめた記事もあります。以下の記事を読むことで、NVIDIAがどんな会社なのか理解することができるはずです。

  1. ►NIMの概要
  2. ►NIMの5つの特徴
    1. ◼︎NIMの特徴その1:Prebuilt container and Helm chart(ビルド済みコンテナとHelmチャート)
    2. ◼︎NIMの特徴その2:Industry standard APIs(業界標準のAPI)
    3. ◼︎NIMの特徴その3:Domain specific code(ドメイン固有のコード)
    4. ◼︎NIMの特徴その4:Optimized inference engines(最適化された推論エンジン)
    5. ◼︎NIMの特徴その5:NVIDIA AI Enterprise
  3. ►NVIDIAが提供する生成AIモデルを紹介!(全てのモデルにNIMが活用できます)
    1. ◼︎MODELS
    2. ◼︎INDUSTRIES
    3. ◼︎生成AIモデルのカタログにアクセス(NIMが使えます)
  4. ►NIMを導入する前にNVIDIAにログインする
  5. ►プロフィールを作成する
  6. ►NIMを生成AIモデルに導入する方法
    1. NIMを導入する方法①環境の準備
    2. NIMを導入する方法②NVIDIA AI Enterpriseのインストール
    3. NIMを導入する方法③NIMのダウンロードと設定
    4. NIMを導入する方法④CUDAドライバのインストール
    5. NIMを導入する方法⑤DockerおよびNVIDIAコンテナツールキットのインストール
    6. NIMを導入する方法⑥NGC APIキーの生成と設定
    7. NIMを導入する方法⑦NGCへのDockerログイン
    8. NIMを導入する方法⑧NIMコンテナの起動
    9. NIMを導入する方法⑨サポートとドキュメントの利用
    10. NIMを導入する方法⑩ライセンスの確認
    11. NIMを導入する方法⑪推論の実行と検証
  7. ►NIMに関する記事の引用元
  8. ►まとめ

►NIMの概要

NIMは、NVIDIAが開発した推論マイクロサービスです。正式名称はNVIDIA Inference Microservices(日本語でNVIDIA推論マイクロサービス)と言います。

NIM

これまでAI開発に縁がなかった個人や企業でも、AIを活用できるように設計されたものです。複雑なAI技術と、企業が実際に必要とするシステムとの「橋渡し役」をしてくれます。

そうすることで、従来の10倍〜100倍の企業のアプリケーション開発者が、AIを使った社内改革を推進できるようになります。

AIの技術を導入するためのハードルが格段に下がります。

複雑なインフラ構築をしたり、専門知識を覚える必要はありません。

様々な環境に対応することができ、今あるシステムへの導入もスムーズに行うことができます。

またNIMは業界で広く使用されているAPI標準に対応しています。なので、他のシステムやソフトウェアと簡単に連携でき、安心して使用することができます。さらに、企業向けのサポートとしてNVIDIA AI Enterpriseがあります。導入から運用まで、NVIDIAがNIMについてのサポートをしてくれます。

►NIMの5つの特徴

「NIMって推論マイクロサービスのことなんだね!」ということは理解できました。しかしNIMの何がすごいのか、まだまだイメージができません。そこでこの章では、NIMの特徴についてもう少し具体的に共有していこうと思います。

上記の画像をもとに、その内容を見ていきましょう。その特徴は5つあります。

◼︎NIMの特徴その1:Prebuilt container and Helm chart(ビルド済みコンテナとHelmチャート)

NIMは、変更がしやすく自分の思い通りに操作ができるように設計されています。

☐デプロイ可能な環境例

開発したAIモデルは様々な環境に柔軟にデプロイできます。

✓デプロイとは?

作ったソフトウェアやサービスを、実際に使える状態にすること 。

動かす場所を、環境に合わせて自由に選べます。普段活用しているのPCの中、インターネット上のクラウド、自社のサーバーなど、最適な場所を選んでNIMを導入することができます。

☐ビルド済みコンテナとHelmチャート

さらに、NIMではビルド済みコンテナHelmチャートが提供されています。

✓ビルド済みコンテナとは?

アプリを実行するために必要なライブラリなどがパッケージ化された、自己完結型のソフトウェアパッケージのこと。

✓Helmチャートとは?

Kubernetes上でアプリを定義、インストール、管理するためのパッケージ管理ツールのこと。

✓ビルド済みコンテナとHelmチャートを利用することで、以下のようなメリットがあります

・デプロイが迅速

環境構築の手間を省き、迅速にアプリケーションをデプロイできます。

・変更しやすい

異なる環境でも同じコンテナイメージを使用できるため、移植性が向上します。

・管理が簡単

Helm チャートを使用することで、アプリケーションのバージョン管理や更新を効率的に行えます。

ビルド済みコンテナ Helmチャートは、NVIDIA独自のハードウェアだけでなく、有名なクラウドサービスやKubernetesを使った環境でも徹底的にテストされています。NVIDIAを利用したすべての環境でのサポートが受けられます。

また企業は、どこにでも生成AIアプリをデプロイすることができます。さらに、アプリや処理するデータも完全に制御可能です。

◼︎NIMの特徴その2:Industry standard APIs(業界標準のAPI)

NIMを活用することで、業界標準のAPIを使ってAIモデルにアクセスできます。またデプロイのプロセスも一般的なものと同じです。なので開発者は、特別な専門知識がなくても比較的簡単にAIアプリが開発できるようになります。

そして多くの場合、たった3行のコードを変更するだけで最新の状態にアップデートできます。

例えば、ある画像認識AIを利用したアプリを考えてみます。このAIがバージョンアップされて、精度が向上したとします。

今までならこの変更をアプリに反映するために、多くのコード修正が必要な場合がありました。しかし、NIMのAPIを利用すれば、数行のコード変更だけで新しいバージョンのAIモデルを組み込むことができるということです。

このように、簡単に利用できてスムーズに組み込むことができるため、企業はAIを迅速に導入することができます。そしてビジネスの成長に合わせて拡張していくことができます。

◼︎NIMの特徴その3:Domain specific code(ドメイン固有のコード)

特定の分野に特化したAIモデルの開発や活用にも力を発揮してくれます。

例えば、高速処理を可能にするNVIDIA CUDAライブラリに加えて、言語、音声、動画処理、ヘルスケアなど、様々な分野に特化して最適化されたカスタムコードがパッケージに含まれています。

これらのカスタムコードを活用することで、それぞれの用途に最適化された、より高精度で専門性の高いAIアプリを開発することができます。

◼︎NIMの特徴その4:Optimized inference engines(最適化された推論エンジン)

NIMは最適化された推論エンジンを活用して、高速性と効率性を追求します。可能な限り遅延をなくし、高い処理能力を実現します。

これにより推論処理にかかるコストが削減されました。なので、ユーザーに快適に利用してもらうことができます。

さらに公開されているAIモデルだけでなく、独自のデータを使ってAIモデルをカスタマイズすることも可能です。機密性の高いデータもデータセンターの外に出すことなく、精度とパフォーマンスを向上させることができます。

◼︎NIMの特徴その5:NVIDIA AI Enterprise

NIMはNVIDIA AI Enterpriseに含まれています。そのため、企業でのAI活用を強力にサポートしてくれます。

✓エンタープライズグレードには以下の基盤が備わっています

・機能ブランチ(新機能の開発が、既存機能の安定性に影響を与えないようにする効果があります)

・厳格な検証(リリース前に厳しい品質基準をクリアしています)

・サービスレベル契約によるサポート

・定期的なセキュリティアップデート

このように、企業が安心して利用できる機能が充実しています。

このような包括的なサポートと最適化された機能があります。NIMはAI開発に縁がなかった企業にとって、非常に重要なツールとなります。

►NVIDIAが提供する生成AIモデルを紹介!(全てのモデルにNIMが活用できます)

この章では、NVIDIAが提供する生成AIモデルの特徴や、使ってみて感じたことを共有していきます。この章で共有するような生成AIモデルに、NIMを活用できます。NIMを活用することのメリットは、NIMの5つの特徴で共有しました。

もちろんNIMは、ここで紹介していない生成AIモデルにも幅広く対応しています。「これからNIMを活用していきたい」と思っている人は、まず活用できる生成AIモデルについて理解しておきましょう!この章を読むだけで大丈夫です。

以下がNVIDIAの生成AIカタログになります。

NIM カタログ

このカタログでは、MODELSINDUSTRIESに分類されています。MODELSでは、生成AIができることをカテゴリー別で紹介されています。INDUSTRIESでは、生成AIモデルが実際に活用される業界や分野について紹介されています。

◼︎MODELS

まず最初に、MODELSの共有をします。

2024年6月時点で、5つのモデルがあります。自社や個人で開発しているアプリにNIMの導入を検討している人は、ぜひ参考にしてください。

同じような生成AIモデルを利用している場合、NIMを導入することで、以下で紹介されているメリットを開発しているアプリでも得ることができます。

✓5つのモデルは以下のとおりです

・Reasoning(推論)

・Visual Design(ビジュアルデザイン)

・Retrieval(検索)

・Speech(音声)

・Biology(生物学)

この節では、上記の5つのモデルについて共有していきます。なお、モデルカタログの更新頻度は非常に早いです。なので、この記事で紹介されているモデルをすでに試せない場合があります。

モデルの紹介に関しては、NIMの導入を検討するための参考程度にご覧ください。

☐Reasoning(推論)

最初に共有する生成AIは、推論が得意な生成AIです。与えらた情報に基づいて、論理的な出力をしてくれます。

Reasoningをクリックすることで、画面が切り替わります。

NIM 画面

クリック後、以下のような画面が表示されます。

NIM

✓Reasoning(推論)のカテゴリーでは、さらに以下のように項目が分かれています

・Developer Favorites(開発者のお気に入り)

・Fresh Off the Press(最新情報)

・Combine Vision and Language Intelligence(視覚と言語のインテリジェンスを組み合わせる)

☑︎Developer Favorites(開発者のお気に入り)

開発者のお気に入り欄では、4つのモデルが共有されています。

NIM ここ
1.llama3-70b-instruct(meta)

✓この生成AIモデルの特徴

優れた文脈理解、推論、テキスト生成能力を持ち、複雑な会話を支えるモデルです。

使用する際は、該当するモデルをクリックします。

ここをクリック

クリックすると、以下のような画面が表示されます。

ラマ

この画面を下までスクロールすると、プロンプト入力画面が見つかるはずです。実際に使用してみたい人は、画面を下にスクロールしましょう。

NIM プロンプト画面

Type text here…にテキストを入力することで、質問に対する内容を出力してくれます。例えば、以下のようにテキストを入力します。

こんな感じ

出力の際はSendをクリックします。

NIM ここをクリック

出力の内容は以下のとおりです。

NIM 出力内容

プロンプト欄に「日本語で出力してください」と追加の入力をすることで、日本語でも出力してくれます。

NIM 日本語にも対応

以下が出力内容の全文です。

全文

このようなテキストベースの生成AIモデルに、NIMを活用することができます。

✓llama3-70b-instructのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

高性能なGPUアクセラレーションにより、複雑な会話の処理が高速化し、応答時間が短縮されます。また、大規模なデータセットの処理においても、処理速度が向上します。

✓GPUアクセラレーションとは?

コンピュータのグラフィック処理ユニット(GPU)を使って、処理速度を大幅に高速化すること。

2.mixtral-8x7b-instruct-vo.1(mistralai)

✓この生成AIモデルの特徴

指示に従い、リクエストを完了し、創造的なテキストを生成するMOE LLMです。

✓MoE LLMとは?

Mixture of Experts (MoE) Language Modelsの略。複数の異なる言語モデルを組み合わせることで、より強力な性能を発揮する大規模言語モデルのこと。

使用する際は、該当するモデルをクリックします。

NIM ここをクリック

クリックすると、以下のような画面に切り替わります。

モデル画面

この画面を下までスクロールすると、プロンプト入力画面が見つかるはずです。実際に使用してみたい人は、画面を下にスクロールします。

NIM プロンプト画面

プロンプト欄に以下のようなテキストを入力します。

10歳の少年の物語を出力してください。

出力の際はSendをクリックします。

ここをクリック

出力の内容は以下のとおりです。

NIM 出力内容

以下が出力内容の全文です。

全文

ちょっとだけ出力の精度が劣ってしまう感じがしますね。しかし今回の記事は、「NIMを活用できる生成AIモデルの紹介」なので問題ありません。

✓mixtral-8x7b-instruct-vo.1のような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

高度な推論タスクに対する処理能力が向上します。また複数の専門知識を持つモデルの組み合わせにより、創造的で正確なテキスト生成ができるようになります。

3.mistral-large(mistralai)

✓この生成AIモデルの特徴

複雑な多言語推論タスクに優れたモデルです。

使用する際は、該当するモデルをクリックします。

NIM ここをクリック

クリックすると、以下のような画面に切り替わります。

モデル画面

この画面を下までスクロールすると、プロンプト入力画面があります。実際に使用してみたい人は、画面を下にスクロールします。

NIM プロンプト画面

出力の精度の違いをわかりやすくするために、上記のプロンプトを使用することにします。

入力後に出力する際はSendをクリックします。

NIM ここをクリック

出力の内容は以下のとおりです。

出力内容

以下が出力内容の全文です。

全文

日本語で出力してくれるものの、日本語の精度はそこまで高くない印象です。文字化けもしてしまっていますね。

✓mistral-largeのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

多言語対応やコード出力の際、効率よく出力してくれるようになります。また、複雑な推論タスクが迅速に処理されるようになります。なので、開発速度も向上します。

4.gemma-7b(Google)

✓この生成AIモデルの特徴

テキスト理解、変換、コード生成に優れた最先端のテキスト生成モデルです。

使用する際は、該当するモデルをクリックします。

NIM ここをクリック

クリックすると、以下のような画面に切り替わります。

モデル画面

この画面を下までスクロールすると、プロンプト入力画面があります。実際に使用してみたい人は、画面を下にスクロールします。

NIM プロンプト画面

ここでも、上記のプロンプトを使用して検証しました。プロンプト入力後に出力する際は、Sendをクリックします。

ここをクリック

出力の内容は以下のとおりです。

NIM 出力内容

以下が出力内容の全文です。

全文

✓gemma-7bのような生成AIモデルにNIMを活用することで、以下のようなメリットを得ることができます

テキスト理解や変換、コード生成において、GPUによる高速な推論ができるようになります。また、データの通信速度や転送速度が向上します。さらに、アプリでの応答時間が改善されます。

✓GPUとは?

Graphics Processing Unitの略。画像や映像などの処理を高速に行うための、コンピュータの専用チップを指します。

☑︎Fresh Off the Press(最新モデル)

最新モデル欄は常に更新されています。そのスピードも非常にはやいです。

NIM ここ

「モデルの特徴」「そのモデルにNIMを導入することのメリット」の2点をわかりやすくまとめました。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

1.nemotron-4-340b-instruct(nvidia)

✓この生成AIモデルの特徴

多くの合成データを生成します。また、現実世界のデータの特性を再現する精度が高いです。

✓NIMを導入することのメリット

高速なデータ出力で、大規模なデータセットを迅速に作成してくれます。また、データトレーニングの効率がアップします。

2.mistral-7b-instruct-v0.3(mistralai)

✓この生成AIモデルの特徴

指示に従ってリクエストを完了してくれます。また、創造的なテキストを生成するのが得意です。

✓NIMを導入することのメリット

高性能な推論により、テキスト生成が高速化します。

3.codestral-22b-instruct-v0.1(mistralai)

✓この生成AIモデルの特徴

幅広いプログラミング言語とタスクに対応したコード生成モデルです。

✓NIMを導入することのメリット

コード生成の精度が高くなります。またアプリなどの開発プロセスが効率化します。

4.yi-large(01-ai)

✓この生成AIモデルの特徴

英語と中国語で訓練されたモデル。多様なタスクに対応しています(チャットボットやクリエイティブライティングなど)。

✓NIMを導入することのメリット

チャットボットやクリエイティブライティングのタスクで、リアルタイムでの応答が高速化されます。またユーザーとの対話がスムーズになり、ユーザー体験が向上します。

5.llava-v1.6-34b(liuhaotian)

✓この生成AIモデルの特徴

テキストや画像を理解する、情報豊かな応答を生成するマルチモーダルビジョンランゲージモデルです。

✓NIMを導入することのメリット

高速な画像解析とテキスト生成ができるようになります。また効率的なマルチモーダル処理、スケーラビリティの向上、複雑な質問にも対応してくれます。

6.llava-v1.6-mistral-7b(liuhaotian)

✓この生成AIモデルの特徴

テキストや画像を理解し、情報豊かな応答を生成するマルチモーダルビジョンランゲージモデルです。

✓NIMを導入することのメリット

高速な画像解析とテキスト生成、また出力精度が高まります。さらに、複雑なクエリにも対応できるようになります。

✓クエリとは?

データベースや検索エンジンに情報を求めるための質問のこと。

llava-v1.6-34bとの違いは?

サイズ能力が違います。llava-v1.6-34bの方が大きなモデル(34B)です。なので精度の高い出力をしてくれます。その一方で、llava-v1.6-mistral-7bは少し小さなモデル(7B)です。しかし、軽量で効率的な推論を提供してくれます。制約がある環境でも高いパフォーマンスを維持してくれます。

7.breeze-7b-instruct(mediatek)

✓この生成AIモデルの特徴

中国語(繁体字)の言語理解とチャットボット機能を強化するLLMです。

✓NIMを導入することのメリット

高速なテキスト生成をしてくれるようになります。また、言語理解の性能も高くなります。NIMを導入すれば、多言語対応の強化をすることもできます。

8.solar-10.7b-instruct(upstage)

✓この生成AIモデルの特徴

推論、数学に特化したモデルです。NLPタスクに優れています。

✓NLPタスクとは?

Natural Language Processingの略。NLPタスクはコンピュータに人間の言葉を理解させ、処理させ、活用させるための課題のことを指します。質問応答テキスト要約はNLPタスクとなります。

✓NIMを導入することのメリット

テキスト解析と生成が高速化します。また、複雑なタスクの処理も効率化します。

9.granite-34b-code-instruct(ibm)

✓この生成AIモデルの特徴

コード生成、補完、説明、およびマルチターン対話に対応するソフトウェアプログラミングLLMです。大規模な企業プロジェクトや研究機関向けです。

✓ソフトウェアプログラミングLLMとは?

人間のようにコードを書けるAIモデルのこと。

✓NIMを導入することのメリット

コード生成が高速化します。また対話のサポート、バグ修正の効率化、コラボレーションの強化もしてくれます。

10.granite-8b-code-instruct(ibm)

✓この生成AIモデルの特徴

コード生成、補完、説明、およびマルチターン対話に対応するソフトウェアプログラミングLLMです。スタートアップや中小企業向けです。

granite-34b-code-instructとの違いは?

llava-v1.6-mistral-7bで共有した違いと同じで、サイズ能力が違います。granite-34b-code-instructの方が大きなモデル(34B)です。なので精度の高い出力をしてくれます。その一方で、granite-8b-code-instructは少し小さなモデル(8B)です。しかし軽量で効率的な推論を提供してくれます。制約がある環境でも高いパフォーマンスを維持してくれます。

✓NIMを導入することのメリット

コード生成が高速化します。また対話のサポート、バグ修正の効率化、コラボレーションの強化もしてくれます。

11.paligemma(google)

✓この生成AIモデルの特徴

テキストと画像を理解し、情報豊かな出力をしてくれるビジョンランゲージモデルです。

ビジョンランゲージモデルとは?

画像とテキストの両方を理解し、それらをつなげて新しい情報を生成できるAIモデルのこと。

✓NIMを導入することのメリット

画像解析とテキスト生成が高速化します。それによって、応答時間が短縮されます。

12.seallm-7b-v2.5(seallms)

✓この生成AIモデルの特徴

東南アジア地域の文化、歴史、知識に特化したLLMです。東南アジアの文化的背景と歴史を深く理解しています。その理解をもとに、自然言語処理タスクを効率的に行うことができます。

✓NIMを導入することのメリット

テキスト解析と生成が高速化します。また多言語対応が強化され、コスト効率も向上します。

13.sea-lion-7b-instruct(aisingapore)

✓この生成AIモデルの特徴

東南アジア地域の言語と文化に特化したLLMです。東南アジアの複数の言語(マレー語、タイ語、ベトナム語など)を理解します。また、それらの言語での自然言語処理タスクを効率的に行うことができます。

✓NIMを導入することのメリット

テキスト解析と生成が高速化します。また、地域特化型のサービスや多言語対応の精度も高まります。

14.arctic(snowflake)

✓この生成AIモデルの特徴

SQL生成とコーディングに焦点を当てた企業向けのモデルです。推論を効率的にすることができます。

✓SQL生成とは?

自然言語で書かれた質問を、データベースを操作するためのSQLコードに変換すること。SQLはStructured Query Languageの略です。

✓NIMを導入することのメリット

SQL生成が高速化します。それによってデータベース操作の効率が大幅に向上します。またビジネスインテリジェンスやデータ分析が迅速かつ正確に行われるようになります。

15.phi-3-mini-128k-instruct(microsoft)

✓この生成AIモデルの特徴

軽量で最先端のオープンLLMです。強力な数学能力と論理的推論能力を備えています。

✓オープンLLMとは?

誰でも自由に利用・変更・配布できる、公開されている大規模言語モデルのこと。

✓NIMを導入することのメリット

高速な推論ができるようになります。また、複雑な計算タスクの処理も迅速化します。

☑︎Combine Vision and Language Intelligence(視覚と言語を組み合わせる)

ここで紹介されている生成AIモデルは、画期的なマルチモーダルモデルになります。画像内の視覚要素を理解し、推論する能力を備えている生成AIです。

NIM ここ

「モデルについての説明」「そのモデルにNIMを導入することのメリット」の2点をわかりやすくまとめました。

1.kosmos-2(microsoft)

✓この生成AIモデルの特徴

画像内の視覚要素を理解し、推論するために設計された画期的なマルチモーダルモデルです。

実際に使用する際は、モデルをクリックします。

ここをクリック

クリックすると、以下の画面が表示されます。

モデル画面

実際に以下の画像が添付されています。加えて、プロンプトも入力されています。

添付画像とプロンプト

性能を確かめることが目的なので、変更せずに活用しました。なお、出力内容もすでに表示されていました。以下が出力内容です。

NIM 出力内容

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・高度な視覚推論

画像のコンテキストをより深く理解するようになります。

・統合的なデータ解析

テキストと画像の情報を統合して解析することで、より広範囲な情報を提供してくれるようになります。

・リアルタイムのフィードバック

ユーザーとのやり取りはリアルタイムで行われます。その時のユーザーエクスペリエンスが向上します。

2.neva-22b(nvidia)

✓この生成AIモデルの特徴

テキストと画像を理解し出力するマルチモーダルビジョンランゲージモデルです。

✓マルチモーダルビジョンランゲージモデルとは?

 画像とテキストに加えて、音声や動画など、複数の種類の情報を理解できるAIモデルのこと。

実際に使用する際は、モデルをクリックします。

ここをクリック

クリックすると、以下の画面が表示されます。

NIM モデル画面

実際に以下の画像が添付されていました。またプロンプトは、画像内のテキストを入力しました。

添付画像とプロンプト

出力する際は、Runをクリックします。

ここをクリック

以下が出力された内容です。

NIM 出力内容

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

画像とテキストの両方を利用した、より質の高い情報が出力されるようになります。加えてユーザーの質問に対して、より的確な答えが提供できるようになります。

3.deplot(google)

✓この生成AIモデルの特徴

画像を表に変える、ワンショットビジュアルランゲージモデルです。

✓ワンショットビジュアルランゲージモデルとは?

たった1つの例を見るだけで、新しい画像やテキストを理解できるAIモデルのこと。

実際に使用する際は、モデルをクリックします。

ここをクリック

クリックすると、以下の画面が表示されます。

モデル画面

以下のように画像が添付されていました。また、このモデルではプロンプトを使用しません。画像だけで内容を理解してくれます。

NIM 添付画像

加えて、すでに出力内容も表示されていました。以下のように、表形式で出力してくれます。白い表に関しては、僕が添付したものになります。

出力内容

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・視覚情報の効率的な変換

画像からテキストへの変換が、より迅速で正確になります。

・データ解析が簡単に

変換されたデータを簡単に解析することができるようになります。また、効率よくデータ分析ができるようになります。

4.fuyu-8b(adept)

✓この生成AIモデルの特徴

画像理解と言語生成を含む、幅広いタスクに対応するマルチモーダルモデルです。

実際に使用する際は、モデルをクリックします。

NIM ここをクリック

クリックすると、以下の画面が表示されます。

モデル画面

実際に以下の画像が添付されていました。加えて、プロンプトも入力されていました。

添付画像とプロンプト

性能を確かめることが目的なので、変更せずに活用していきます。出力する際は、Runをクリックします。

NIM ここをクリック

以下が出力された内容です。

出力内容

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

画像理解と言語生成の両方を効率的に行い、多様なタスクに対応できるようになります。

☐Visual Design(ビジュアルデザイン)

次に共有する生成AIは、画像やグラフィックを理解することが得意な生成AIです。

Visual Designをクリックすることで、画面が切り替わります。

NIM ここをクリック

クリック後、以下のような画面が表示されます。

Visual Design画面

✓Visual Design(ビジュアルデザイン)のカテゴリーでは、さらに以下のように項目が分かれています

・Trained on Licensed Data with NVIDIA Edify(ライセンスデータを使用したトレーニングモデル)  

・Leading Open Diffusion Models(先進的なオープンディフュージョンモデル)

☑︎Trained on Licensed Data with NVIDIA Edify(ライセンスデータを使用したトレーニングモデル)  

ライセンスデータを使用したトレーニングモデルでは、現在2つのモデルが紹介されています。ここで紹介されているAIモデルは「企業向け」の大型言語モデルになります。

ここをクリック
1.edify-image(gettyimages)

✓この生成AIモデルの特徴

高解像度の4K画像を生成できるモデルです。また商業利用に安全なライブラリをもとにしているため、信頼性が高いです。

実際に使用する際は、モデルをクリックします。

NIM ここをクリック

クリックすると、以下の画面が表示されます。

モデル画面

すでにプロンプトが入力されており、出力もされています。

プロンプト内容

高い精度で画像を出力してくれます。

またedify-imageでは、Featureをクリックすることで画像の修復などができます。

NIM ここをクリック

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・高品質な画像生成

ユーザーはリアルタイムで高品質な4K画像を生成し、すぐに利用できるようになります。

・クリエイティブな活動が効率的に

画像生成と修正を迅速に行うことで、クリエイティブプロセスが効率化されます。プロジェクトのスピードが向上します。

2.edify-3d-early-access(shutterstock)

✓この生成AIモデルの特徴

テキストから高品質な3Dアセットを生成でき、商業利用に安全なライブラリを基にしているため、3Dコンテンツの作成が簡単です。

実際に使用する際は、モデルをクリックします。

ここをクリック

クリックすると、以下の画面が表示されます。

NIM モデル画面

すでにプロンプトが入力されていました。なので、以下のプロンプトをそのまま活用していきます。

プロンプト

出力する際は、Runをクリックします。

NIM ここをクリック

以下が出力された内容になります。

出力内容

2Dと3Dで画像を出力してくれました。なお3Dで出力された画像は、ドラッグ&ドロップで動かすことができます。

このような性能を発揮するモデルにNIMを導入することで、以下のようなメリットを得ることができます。

✓NIMを導入することのメリット

・リアルタイム3Dアセット生成

ユーザーはテキスト入力から、リアルタイムで3Dモデルなどのデジタル資産を作成できるようになります。

・クリエイティブの柔軟性

さまざまな3Dアセットを迅速に生成・修正できるようになります。なのでクリエイティブなプロジェクトにおいて、柔軟性が上がります。独自性の高いコンテンツ制作が容易になります。

☑︎Leading Open Diffusion Models(先進的なオープンディフュージョンモデル)

先進的なオープンディフュージョンモデルモデルでは、現在5つのモデルが紹介されています。ここで紹介されている生成AIモデルは画像や動画などのメディアを生成してくれます。最近導入された新技術です。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

ここ
1.stable-diffusion-3-medium(stabilityai)

✓この生成AIモデルの特徴

テキストから画像への生成モデルです。高品質な画像を生成します。

✓NIMを導入することのメリット

よりリアルで高品質な画像が迅速に生成できるようになります。

2.stable-diffusion-xl(stabilityai)

✓この生成AIモデルの特徴

リアルな美的要素を持つ画像を出力します。

✓NIMを導入することのメリット

より現実的で美しい画像を生成できるようになります。加えて、幅広い用途での高品質なビジュアル生成ができるようになります。

3.sdxl-lightning(bytedance)

✓この生成AIモデルの特徴

テキストから画像への生成モデルです。高品質な画像を生成してくれます。

✓NIMを導入することのメリット

効率的かつ迅速に、高品質な画像を生成できるようになります。

4.stable-video-diffusion(stabilityai)

✓この生成AIモデルの特徴

1枚の画像を条件フレームとして使用し、動画シーケンスを生成するディフュージョンモデルです。

✓動画シーケンスとは?

連続する複数の静止画を繋ぎ合わせて、動きのある動画を作成するためのデータのこと。

✓ディフュージョンモデルとは?

ノイズから徐々に画像や音声などのデータを作成するAIモデルのこと。

✓NIMを導入することのメリット

単一の画像から高品質な動画シーケンスを生成できるようになります。

5.sdxl-turbo(stabilityai)

✓この生成AIモデルの特徴

入力したテキストプロンプトから、リアルな画像を迅速に生成することができます。このモデルは、単一のネットワーク評価で画像を生成するため、高速で処理され出力されます。

✓NIMを導入することのメリット

非常に高速な生成プロセスで、リアルな画像を生成できるようになります。

☐Retrieval(検索)

Retrieval(検索)では、膨大なデータから必要な情報を効率的に探すのが得意な生成AIが紹介されています。

Retrievalをクリックすることで、画面が切り替わります。

NIM ここをクリック

クリック後、以下のような画面が表示されます。

NIM 表示画面

✓Retrieval(検索)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Build Your First RAG Pipeline(初めてのRAGパイプラインを構築)

✓RAGパイプラインとは?

検索と生成AIを組み合わせて、より信頼性と最新情報を重視した回答を出力する技術のこと。

☑︎Build Your First RAG Pipeline(初めてのRAGパイプラインを構築)

RAGパイプラインを構築するための生成AIモデルは、現在4つ紹介されています。これらのモデルは、チャットベースの推論モデルを、企業独自のデータに接続するために使用されます。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

ここをクリック
1.nv-embed-v1(nvidia)

✓この生成AIモデルの特徴

テキスト入力から高品質な数値エンベディングを生成します。

✓数値エンベディングとは?

数値データを、コンピューターが理解しやすいベクトルに変換する技術のこと。

✓NIMを導入することのメリット

より効果的なデータ検索と情報生成ができるようになります。具体的には、ユーザーがテキスト入力を行う際に、瞬時に高品質な数値エンベディングを生成ができるようになります。さらにユーザーがより直感的に操作できるようになり、エクスペリエンスが向上します。

2.arctic-embed-l(snowflake)

✓この生成AIモデルの特徴

GPU加速によるテキストエンベディングを生成します。

✓テキストエンベディングとは?

文章データを、コンピューターが理解しやすい数値ベクトルに変換する技術のこと。

✓NIMを導入することのメリット

GPU加速を活用した高速かつ効率的なテキストエンベディングの生成ができるようになります。ユーザーはリアルタイムでエンベディングを取得でき、これにより大量のデータを迅速に処理して検索精度を向上させることができます。さらにユーザーは、自身のニーズに合わせたカスタマイズができるようになります。

3.rerank-qa-mistral-4b(nvidia)

✓この生成AIモデルの特徴

特定の文章が「質問に対する情報を含んでいるかどうか」を確率で評価するために最適化されたGPU加速モデルです。

✓NIMを導入することのメリット

質問応答システムにおいて高い精度でリランキングを行うことができるようになります。加えてユーザーは、質問を入力するだけで関連性の高い情報を迅速に取得できます。そのため検索効率も飛躍的に向上します。

4.bge-m3(baai)

✓この生成AIモデルの特徴

テキストリトリーバルタスクのためのエンベディングモデルです。

✓テキストリトリーバルタスクとは?

大量のテキストデータの中から、特定の質問やキーワードに関連する文章を見つけるタスクのこと。

✓NIMを導入することのメリット

テキスト検索タスクにおいてさらに高いパフォーマンスを発揮します。また、ユーザーは複雑な検索クエリに対しても迅速かつ正確な結果を得ることができるようになります。加えて検索プロセスをより柔軟に管理し、自分のニーズに合った情報を効率的に取得できるようになります。

☐Speech(音声)

Speech(音声)では、音声を理解して、ユーザーが求めている出力をすることが得意な生成AIです。Speechをクリックすることで、画面が切り替わります。

NIM ここをクリック

クリック後、以下のような画面が表示されます。

表示画面

✓Speech(音声)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Convert Speech to Text(音声をテキストに変換)

☑︎Convert Speech to Text(音声をテキストに変換)

このカテゴリーでは、現在1つの生成AIモデルが紹介されています。話された音声をテキストに変えてくれます。なおモデルは、クリックすることで実際に使用することができます。

ここ
1.parakeet-ctc-0.6b(nvidia)

✓この生成AIモデルの特徴

最先端の精度と速度で英語の音声を文字に起こすことができます。

✓NIMを導入することのメリット

音声からテキストへの変換がリアルタイムで行われるため、ユーザーは即座に音声を文字として利用できます。これにより音声データの活用が容易になり、生成AIモデルとの連携がスムーズになります。さらに音声認識のプロセスが効率化され、生成されたテキストを他のAIモデルでも利用できるようになります。ビジネスや教育、エンターテインメントなどの分野での応用が期待できます。

☐Biology(生物学)

生物学的なデータを理解し、分析することが得意な生成AIです。Biologyをクリックすることで、画面が切り替わります。

NIM ここをクリック

クリック後、以下のような画面が表示されます。

表示画面

✓Biology(生物学)のカテゴリーでは、以下の項目で生成AIモデルが共有されています

・Generative AI Virtual Screening(生成AIによるバーチャルスクリーニング)

✓バーチャルスクリーニングとは?

コンピューターを使って、膨大な数の化合物の中から、特定の病気や症状に効果がありそうな物質を見つける方法のこと。

☑︎Generative AI Virtual Screening(生成AIによるバーチャルスクリーニング)

このカテゴリーでは、現在4つの生成AIモデルが紹介されています。タンパク質の構造や機能を理解し、予測するために使われる最新の生成AIモデルです。なおそれぞれのモデルは、クリックすることで実際に使用することができます。

NIM ここ
1.rfdiffusion(ipd)

✓この生成AIモデルの特徴

タンパク質のバックボーンを生成するためのモデルです。特にタンパク質バインダーの設計に優れています。

モデルをクリックすると以下の画面に切り替わります。

出力内容

✓NIMを導入することのメリット

ユーザーがタンパク質のバックボーンをリアルタイムで生成し、設計プロセスを即座に調整できるようになります。研究や開発のスピードが大幅に向上します。研究者は、より迅速に正確なバインダーを設計することができ、実験の反復回数が減少します。

2.esmfold(meta)

✓この生成AIモデルの特徴

タンパク質のアミノ酸配列から、3D構造を予測するモデルです。このモデルは、タンパク質のフォールディング(折り畳み)を高精度で予測し、薬物発見プロセスを支援します。

モデルをクリックすると以下の画面に切り替わります。

NIM 出力内容

✓NIMを導入することのメリット

タンパク質構造予測のプロセスを、より直感的に行うことができるようになります。研究者はリアルタイムで構造予測の結果を得ることができ、即座にフィードバックを受け取りながら調整を行うことができます。これにより予測精度が向上し、研究の効率が高まり、迅速に新薬の発見ができるようになります。

3.diffdock(mit)

✓この生成AIモデルの特徴

分子がタンパク質とどのように相互作用するかを予測するドッキングモデルです。このモデルは、薬物とターゲットタンパク質の相互作用を3D構造として予測し、薬物発見プロセスを支援します。

モデルをクリックすると以下の画面に切り替わります。

出力内容

✓NIMを導入することのメリット

ユーザーがリアルタイムでドッキング結果を確認できるようになります。これにより研究者は迅速に仮説を検証し、最適な薬物候補を見つけることができます。また、ドッキングの精度を向上させ、時間とリソースを節約できます。

4.molmim-generate(nvidia)

✓この生成AIモデルの特徴

薬物発見のために適切な特性を持つ分子を生成するモデルです。このモデルは、特定の化学的特性を持つ分子を生成するために制御された生成プロセスを使用します。

モデルをクリックすると以下の画面に切り替わります。

NIM 出力内容

✓NIMを導入することのメリット

分子生成のプロセスを、より直感的に行うことができるようになります。また、研究者は生成された分子の特性をリアルタイムで確認し、必要に応じて即座に生成条件を調整できます。これにより、適切な特性を持つ分子を迅速に見つけることができ、薬物開発のスピードと効率が大幅に向上します。より効率的に研究を進めることができます。

◼︎INDUSTRIES

次に、INDUSTRIESのカテゴリーについての共有です。

このカテゴリーの中では、生成AIモデルが活用されている3つの分野について紹介されています。

☐Gaming(ゲーム)

Gamingをクリックすることで画面が切り替わります。

ここをクリック

以下がGamingで紹介されている生成AIモデルになります。

表示画面

今回はDigital Humansaudio2faceについて共有します。ちなみにDigital Humansで紹介されているモデルでは、自然言語での対話から、ダイナミックなゲームキャラクターを作成することができます。

☑︎audio2face(nvidia)

✓この生成AIモデルの特徴

音声入力をリアルタイムでキャラクターの表情に変換するモデルです。この技術により、ゲームキャラクターは自然な口の動きや表情を持つことができ、より現実的なキャラクターを作成できます。特に音声に基づくリップシンクと顔のパフォーマンスにおいて、非常に高い精度を誇ります。

使用する際は、モデルをクリックします。

NIM ここをクリック

クリックすると、以下の画面が表示されます。

モデル画面

サンプルの音声を使用してキャラクターの声を作成することができます。また驚きや悲しみ、喜びなども調整することが可能です。非常に細かい設定を行うことができます。

NIM 調整可能

調整後、Runをクリックします。

ここをクリック

クリックすることで、右に表示されているキャラクターが喋ります。口の動きと音声が一致していることに驚きました。

✓NIMを導入することのメリット

ユーザーがリアルタイムで音声を入力することで、ゲームキャラクターの表情やリップシンクがリアルタイムで反映されます。ゲーム内のキャラクターがプレイヤーと自然にコミュニケーションでき、没入感が大幅に向上します。さらにキャラクターの表現力を強化し、より多様なシナリオに対応したダイナミックなゲームキャラクターを作成することが可能になります。

☐Healthcare(医療)

Healthcareをクリックすることで画面が切り替わります。

NIM ここをクリック

以下がHealthcareで紹介されている生成AIモデルになります。

生成AIモデル

今回はMedical Imagingvista-3dについて共有します。ちなみにMedical Imagingで紹介されているモデルでは医用画像をセグメント化することができます。

✓セグメント化とは?

画像やデータを意味のあるまとまりに分ける作業のこと。

☑︎vista-3d(nvidia)

✓この生成AIモデルの特徴

医療画像のセグメンテーションと注釈付けに特化したモデルです。主に人間の解剖学的構造を正確に識別し、詳細なセグメンテーションを行う能力があります。これにより、医療専門家が迅速かつ正確に診断を行うためのサポートが提供されます。

使用する際は、モデルをクリックします。

ここをクリック

クリックすると、以下の画面が表示されます。

NIM CT画像の作成画面

CT Image ExamplesからCT画像の例を選択することができます。

NIM 画像を選択

またClass Labelsから、肝臓や腎臓などの特定の部位を選択することができます。この機能は、CT画像内で特定の部位を識別し、解析するために使用されます。

NIM 特定の部位を選択

特定の部位を選択するとRunが表示されます。画像を出力する際は、クリックをしましょう。

ここをクリック

クリック後、以下の画像が出力されました。

CT画像

素人では特定するのは難しいですが、このような画像も生成AIを用いて作成することができます。またDirectionを操作することで、CT画像を別の角度から見れるようになります。

向きを変える

✓NIMを導入することのメリット

セグメンテーションと注釈付けの結果が即座に反映されるようになります。医療専門家は迅速に対応ができるようになります。医療の質が向上し、より良い治療結果が期待できるようになります。

☐Industrial(産業)

Industrialをクリックすることで画面が切り替わります。

NIM ここをクリック

以下がIndustrialで紹介されている生成AIモデルになります。

表示画面

今回はSimulate and Optimize Real World Outcomes(現実世界の結果をシミュレーションし最適化する)のcuoptai-weather-forecastingについて共有します。現実世界の結果を予測するためのオペレーションズリサーチ、および予測アルゴリズムを搭載した生成AIモデルです。

☑︎cuopt(nvidia)

✓この生成AIモデルの特徴

物流、交通管理、配送計画など、多岐にわたる分野での最適なルート計画を可能にするモデルです。

使用する際は、モデルをクリックします。

NIM ここをクリック

クリックすると以下の画面が表示されます。

表示画面

この画面ではデリバリーのシミュレーションをすることができます。例えばデリバリーの例を選択することができたり、時間などを考慮しながら効率的にデリバリーをする方法を見つけることができます。

また、Task Constraints(タスクの制約)とFleet Constraints(車両の制約)にはすでにテキストが入力されています。

NIM 入力されているテキスト

これらの条件をもとにして、出力をしてみましょう。出力の際は、Runをクリックします。

ここをクリック

以下の内容が出力されました。

NIM 出力内容

このように、条件に合わせて最適化されたルートを出力してくれます。このような生成AIモデルにもNIMを導入することができるんです。

✓NIMを導入することのメリット

リアルタイムでルート最適化を行い、ユーザーに対して即時のフィードバックを提供できるようになります。これにより、企業は効率的なルート計画を迅速に作成し、コスト削減や時間の短縮が可能となります。また、変動する条件に対して即座に最適なルートを見つけ出し、より柔軟な運用が実現できます。

☑︎ai-weather-forecasting(nvidia)

✓この生成AIモデルの特徴

グローバルスケールでの天気予報ができるモデルです。このモデルは大規模な気象データを解析し、詳細な天気予報を提供するために設計されています。また、地域レベルの高精度な予報も可能です。

ここをクリック

クリックすると以下の画面が表示されます。

モデル画面

入力スペースにはすでにテキストが入力されており、すぐに出力できる状態になっています。

プロンプト

上記の条件ではスーパーサイクロン「アンファン」のインドへの上陸に関する予測を設定しています。

予測を出力する際はForecastをクリックします。

NIM ここをクリック

以下の内容が表示されました。

出力内容

指定された日時におけるインド付近の表面風速の予測が出力されました。色の違いによって、特定の地域でどの程度の風速が予測されているかがわかりやすく理解できます。この情報は、災害対策などに役立ちます。

✓NIMを導入することのメリット

リアルタイムで予報結果を確認し、必要に応じて詳細な情報を取得できるようになります。これにより、農業、交通、イベント企画など、さまざまな分野での意思決定が正確に行えるようになります。また天気予報の精度が向上し、予測の更新がスムーズに行われるため、常に最新の情報を得ることができます。そのため、全体的な社会の安全性と効率性が向上します。

◼︎生成AIモデルのカタログにアクセス(NIMが使えます)

以下のリンクから、生成AIモデルのカタログにアクセスできます。アクセスすることで、紹介されている生成AIモデルは全て使用することができます。「NIMを活用できる生成AIモデルに興味のある人」はぜひアクセスしてみてください。

https://build.nvidia.com/explore/discover

►NIMを導入する前にNVIDIAにログインする

まずは、AIカタログにログインしていきましょう。ホーム画面の右上にあるクリックします。

ここをクリック

クリックすると以下の画面が表示されます。

NIM サインイン画面

それぞれの項目の日本語訳は以下のとおりです。

サインイン

法人メールアドレスを使用するか、個人のメールアドレスを使用するかによって受けられるサービスが変わります。法人で使用する場合は法人のアドレス、個人で使用する場合は個人のアドレスを入力しましょう。

アドレス入力

アドレスを入力後、Nextをクリックします。

NIM ここをクリック

クリックすると以下の画面が表示されるので、必要事項を入力していきます。

必要事項を入力

入力後、Create Accountをクリックします。

必要事項を入力

クリックすると以下の画面が表示されます。

NIM 通知確認

この画面が表示されたタイミングで、届いたメールを確認します。もし届いていない場合はResend Emailをクリックしてもう一度送信してもらいましょう。それでもメールが届かない場合は、Change Emailでアドレスを変更しましょう。

通知が届かない時

届いたメールのVerify Email Addressをクリックすることで、以下の画面が表示されます。

NIM もう直ぐ完了

NVIDIAからの情報やお知らせが必要な場合は、項目にチェックを入れます。確認ができたら、登録するをクリックします。

ここをクリック

クリックすると以下の画面が表示されます。メールアドレスを入力してContinueをクリックします。

NIM ここをクリック

これでログインは完了です。次に、プロフィールを作成していきます。

►プロフィールを作成する

続いて、NVIDIAで使用するためのプロフィールを作成していきます。上記の画像Continueをクリックした後、以下の画面が表示されます。

必要事項を入力

上記の画面に必要事項を入力していきます。入力が完了したら、Submitをクリックします。

NIM ここをクリック

これでプロフィール作成の完了です。

►NIMを生成AIモデルに導入する方法

最後の章では、実際にNIMに生成AIモデルを導入する方法について共有します。なるべく理解しやすいようにまとめました。NIMの導入を検討している人はぜひ参考にしてください。

NIMを導入する方法①環境の準備

NVIDIA AI Enterpriseのサポートを受けているインフラストラクチャソフトウェアを確認します。なお確認の際は、以下のリンクからご覧いただけます。

デプロイメントガイド🔽

https://docs.nvidia.com/ai-enterprise

上記のサイトを日本語訳にしたものが、以下の画像です。

エンタープライズ

NIMを導入する方法②NVIDIA AI Enterpriseのインストール

デプロイメントガイドに従って、NVIDIA AI Enterpriseインフラストラクチャソフトウェアをセットアップします。

✓やるべきことは以下のとおりです

・インフラ準備

必要なハードウェア(GPUサーバー等)とソフトウェア(Docker、Kubernetes等)の準備をする

・ネットワーク設定

クラウドやデータセンターのネットワーク設定を確認し、NVIDIA AI Enterpriseの動作に必要なポートやプロトコルを設定する。

NIMを導入する方法③NIMのダウンロードと設定

NGC(NVIDIA GPU Cloud)カタログにアクセスし、使用するNIM(例:BioNeMo DiffDock NIM)を選択します。なおNGCカタログは、以下からご覧いただけます。

NGCカタログ🔽

https://catalog.ngc.nvidia.com/?filters=&orderBy=weightPopularDESC&query=&page=&pageSize=

次に、選択したNIMのLearn Moreボタンをクリックし、詳細情報ページに移動します。

次に、詳細ページ内のQuick Start Guideをクリックし、NIMの導入手順を確認します。

✓やるべきことは以下のとおりです

・ダウンロード

NIMのコンテナイメージやその他の必要なファイルをダウンロードします

・設定ファイル

NIMの動作に必要な設定ファイルを確認し、編集します。

NIMを導入する方法④CUDAドライバのインストール

推奨されるCUDAドライバをインストールします。インストールする際は、以下のリンクをご覧ください。

CUDAドキュメント🔽

https://docs.nvidia.com/cuda

2024年6月時点では、ドライババージョン550.54.14が推奨されています。

次にインストールガイドに従って、ネットワークリポジトリを使用してパッケージマネージャ経由でインストールします。

次に、docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi コマンドを実行します。CUDAドライバが正しくインストールされていることを確認しましょう。

なお、以下がNVIDIAドライバダウンロードページになります。

https://www.nvidia.com/Download/index.aspx

NIMを導入する方法⑤DockerおよびNVIDIAコンテナツールキットのインストール

DockerとNVIDIAコンテナツールキットをインストールします。公式サイトからインストールすることができます。

Docker公式サイト🔽

https://www.docker.com

なお、Dockerをインストールする際はインストールガイドをご覧ください。

NVIDIAコンテナツールキットは以下からインストールすることができます。

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

インストール後、NVIDIAコンテナツールキットのドキュメントのConfigure Dockerに従って設定を進めていきます。

NIMを導入する方法⑥NGC APIキーの生成と設定

NGC APIキー生成ページにアクセスし、APIキーを生成します。export NGC_API_KEY=<value> コマンドを使用してAPIキーを設定します。

次に、echo "export NGC_API_KEY=<value>" >> ~/.bashrc または echo "export NGC_API_KEY=<value>" >> ~/.zshrc を実行して、APIキーを環境変数に保存します。

以下が、APIキーを作成するページになります。

NGC APIキー生成ページ🔽

https://org.ngc.nvidia.com/setup/personal-keys

NIMを導入する方法⑦NGCへのDockerログイン

ターミナルでdocker loginコマンドを実行します。次に、NGC APIキーを使用してNGCコンテナレジストリにログインします。

NIMを導入する方法⑧NIMコンテナの起動

次に、NIMコンテナの設定とモデルのダウンロードをしていきます。その際、 ターミナルで以下のコマンドを実行します。

1.コンテナ名とイメージ名を設定します

コード

2.必要なモデルをダウンロードします

NIM コード

3.ダウンロードしたアーティファクトを解凍します

コード

4.以下のコマンドを実行してNIMを起動します

NIM コード

ここで補足があります。

✓補足

異なるGPU環境では、--gpusフラグやNVIDIA_VISIBLE_DEVICES環境変数を使用して、特定のGPUを指定することができます。

NIMを導入する方法⑨サポートとドキュメントの利用

VIDIA AI Enterprise Documentation Hubで、リリースドキュメントや追加のデプロイメントガイドを参照します。その際、NVIDIAの公式ドキュメントを参照し、導入時のベストプラクティスを確認するのがおすすめです。

次にエンタープライズサポートにアクセスし、ナレッジベースの記事やサポートケースを参照します。

導入時に問題が発生した場合は、NVIDIAのサポートに問い合わせるようにしましょう。もしくはナレッジベースを利用して解決策を探します。

デプロイメントガイドは、以下から参照することができます。

https://docs.nvidia.com/ai-enterprise

また、以下がエンタープライズサポートページになります。

https://www.nvidia.com/en-us/support/enterprise

NIMを導入する方法⑩ライセンスの確認

NVIDIA AI Product Agreementのライセンス条件を確認し、同意します。その後、必要なライセンスキーを取得します。

ダウンロードしたアーティファクトを使用し、NIMを実行していきます。取得したライセンスキーを使用して、NIMのライセンス認証を行います。

NIMを導入する方法⑪推論の実行と検証

推論リクエストの実行と、動作確認をしていきます。

1.NIMコンテナが正常に起動し、次のメッセージが表示されるのを確認します

コード

2.別のターミナルで次のコマンドを実行し、推論可能なモデルのリストを取得します

NIM コード

3.推論リクエストを実行し、動作を検証します

コード

上記の上記の①〜⑪の手順に従うことで、NVIDIA NIMを正しく導入しすることができるはずです。

AIアプリの開発を進めていくことができます。

►NIMに関する記事の引用元

NVIDIAのNIMに関する記事を書くにあたって、以下のリンクを参考にしました。

https://developer.nvidia.com/ja-jp/blog/nvidia-nim-offers-optimized-inference-microservices-for-deploying-ai-models-at-scale

https://docs.nvidia.com/nim/large-language-models/latest/getting-started.html

►まとめ

以上になります。

少し前の時代では生成AIに触れることもなかったし、自分でAIアプリを構築するなんて考えることもできませんでした。しかし、時代は大きく変化しています。NIMのような、誰でも活用できる推論マイクロサービスが開発されました。決して簡単ではないですが、取り組もうと思えばどんな人でも本格的なAIアプリを構築することができます。

目まぐるしく変化をしていくAIの分野ですが、しっかりと情報をキャッチすることが大切だと思ってます。今現在何が起きているのか、どんな便利な物が開発されているのかを理解するのは大切なことですね。そのサポートができるように、僕自身も学びつつ、今後も記事の中で共有していこうと思います。

この記事がNIMの導入についての検討、そして新たな視点の提供につながれば幸いです。

なお記事に関しての感想やご要望等ございましたら、コメント欄にて受け付けてます。このページを下までスクロールすると見つかります。

読んで頂いた人の意見をもとに、記事の内容を向上させていきたいと思ってます。ぜひご記入ください!

最後までお読み頂きありがとうございます。

ブログをメールで購読

学べるブログの更新・重要アップデート(Grok/Gemini など)を、メールで受け取れます。無料。いつでも解除できます。更新時(週1〜2回目安)

生成AIの読み物

コメント

学べるブログをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む

学べるブログをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む