【2026年最新版】Grok Imagine完全ガイド:無料と有料の違い・使い方・画像生成→音声付き動画・4つのモード
生成AIの読み物
2025.08.112026.04.08
🎮 操作・基礎
🎛️ モード比較
⚖️ プラン選択
🎨 実践・FAQ
「ただ画像を作る」だけの時代は終わりました。
Grok Imagineは、脳内にある曖昧なイメージを、一瞬で具現化し、動きを与え、世界へ共有できる「拡張された想像力」 です。
本記事は、実務的・創造的な活用バイブルです。基礎操作から、プロでも迷う「モードの使い分け」、そして収益化やブランディングに繋がる「高品質な出力」の秘訣まで。この1ページが、クリエイティブを革新します。
⚡️ こんな方へ
AI生成の「質」にもっとこだわりたい方
静止画だけでなく「動画化」も試したい方
Grok有料プランの価値を厳密に見極めたい方
🔑 手に入る知識
4つのモード(Spicy等)の決定的な違い
失敗しないプロンプトの「型」と実例
SNSで映える「音声付き動画」の作成術
生成AI図解テンプレ設計者
図表とテンプレで、生成AIの使い方・比較・トラブル解決を「再現できる手順」に落とし込んで解説。
Grok/Gemini(Google AI Studio)中心。
海外の一次情報も確認し、手順に落として解説します。
Achievement
中国語(HSK6級)/ RED(小紅書)フォロワー10万人超
Search Console (12M)
10.9万 Click / 247万 Imp (CTR 4.4%)
Search Console (3M)
3.66万 Click / 90.8万 Imp (CTR 4.0%)
VISITOR
4.0万 (直近90日)
ENGAGEMENT
2分56秒 (平均滞在)
SOURCE
Organic Search 92%
「自分で決められない」のは性格ではなく、脳の判断ルールの欠如が原因です。
判断軸を固定し、年間270時間の自由を取り戻す「即決の仕組み」 を完全解説。
即決の仕組み
判断軸を3つに固定し、迷いを機械的に処理する独自メソッド。
AI決断代行
思考そのものを外注し、ChatGPTに「正解」を出力させるプロンプト。
場面別テンプレ
仕事・買い物・LINE返信。日常の迷いをなくす具体的な「型」を網羅。
精神論ゼロ
性格や気合いは不要。論理的なシステムだけで解決する設計。
Grok Imagineって何?
多彩な入力と出力
テキスト・音声(Voice)・画像アップロードに対応。画像生成はAuroraベースで、フォトリアルからアニメ風など多様なスタイルに展開し、編集(指示に沿った修正)も可能です。
動画への変換
テキストから「サウンド付き6秒動画」を生成。生成画像や手持ちの静止画(写真)も、短尺動画へ変換できます。
Spicyモード
表現の振れ幅を広げるオプション(年齢・ポリシーに基づき制御)。xAIの規約上は13歳以上(未成年は保護者同意)が前提で、違法・有害なコンテンツや児童の性的表現などは明確に禁止されています。
提供状況
2026年1月4日現在、Grok公式アプリ(iOS/Android)でImagine(画像・動画生成)を利用可能。X上のGrokもiOS/Android/Webで提供され、利用可能範囲は地域・プラン・アカウント状態で変動します。
そもそも「生成AI」とは? 基本を学ぶ
Grok Imagineは、数ある「生成AIツール」のひとつです。もし「生成AIのことよくわからない」「もっと生成AI関連の知識を身につけたい」という方がいたら、以下の記事で解説している基本的な知識を身につけましょう。Grokだけでなく他のAIツールもスムーズに使いこなせるようになります。
STEP 1:全体像を掴む
まずはここから。生成AIという技術の全体像を掴みましょう。
STEP 2:心臓部「大規模言語モデル(LLM)」を理解する
Grokのような対話型AIの頭脳である「大規模言語モデル」の仕組みを学ぶことができます。
STEP 3:他のAIとの違いを知る
Grokは他のAIと何が違うのか?各AIの強みや特徴を比較し、自分に合ったツールを見つけるヒントになります。
AIを深く知る:Grok Imagineは「なぜ賢い」のか?
Grok Imagineは非常に強力な画像生成AIですが、このようなAIがどのようにして高い精度の能力を身につけているのか、その「仕組み」に興味はありませんか?
AIの心臓部であるLLM(大規模言語モデル)の学習プロセスを理解することで、Grok Imagineのポテンシャルをさらに引き出すことができます。以下の記事では、その全知識をまとめました。AIを「使う」 から「理解する」 へ、一歩先の知識を手に入れたい方はぜひご覧ください。
リリースされたのはいつ?
Grok Imagineは8月4日 にリリースされました。
Grok Imagineで何ができるの?
基本生成
テキスト入力に加え、音声(Voice)だけでも画像生成が可能。作風は指示により幅広く調整できます(生成結果・利用可否は環境やロールアウト状況で変動)。
公式ストア説明では「音声付き6秒動画」を生成可能と明記。テキストから短尺動画を作れるほか、静止画(生成画像や手持ち写真)を動画へ変換できます。
編集・拡張機能
同一テーマで複数回生成し、候補を比較しながらプロンプトを微調整して詰めていけます(提供UIや上限は随時更新)。
手元の写真・画像をアップロードして、生成の起点(構図・被写体の参照)や、静止画→動画化に活用できます。
生成→確認→修正→再生成を短いサイクルで回しやすく、短尺クリエイティブの試行回数を増やせます(速度・優先度はプランや混雑状況で変動)。
モード・入力
生成の表現幅を調整する設定(「Spicy」等の名称で表示される場合あり)。年齢要件(13歳以上、13〜17歳は保護者同意)とポリシーに基づき、地域・アカウント状態などで利用範囲が制御されます。
キーボード入力に加え、マイクによる音声入力、画像のアップロードに対応。必要に応じてリンク貼り付けや資料取り込みで文脈を渡しながら制作できます。
Grok公式アプリ(iOS/Android)で画像・動画生成を利用可能。機能は順次ロールアウトされ、端末・地域・アプリ版・プラン等により差異が生じる場合があります。
Grok
IMAGINE
Gemini
NANO BANANA
「SNSでバズるカオス」か、「実務で稼ぐ安定」か。
数百枚の生成検証で判明した「決定的な使い分け」 を公開。
Nano Banana Pro
Grokを超えた?
「文字化けしない」 驚異の生成力。
4K画質、日本語テキスト、そして論理的思考。
「遊び」ではなく「仕事」で使えるAI を探しているあなたへ。
その全貌と使いこなし術を完全解説。
Grok Imagineはどこで活用できるの?
Grok Imagineは、iOSまたはAndroid版のGrokアプリ で活用することができます。今後ウェブ、そしてX版のGrokでも活用できるようになることが予想されます。
アプリさえあれば、全ての人がGrok Imagineで画像や動画を生成することができます。なおGrok Imagineって何? でも共有したように、Android版 では、ベータ版の機能として画像生成のみ が提供されています。
Grok Imagineは無料で活用できるの?
2025年8月15日の時点で、Grok Imagineの全ての機能を無料で活用することができます。
しかし、無料で活用できるのは期間限定 となっています。「いつまで無料なのか」 については具体的に明示されていません。変更があり次第、ここでの情報は随時更新していきます。
次の章で、「無料プランでできることとできないこと」を共有していきます。全ユーザーが無料で活用できる期間 が過ぎると、通常の状態に戻ります。その際、次章の内容が参考になるはずです。
無料プランでできることとできないこと
無料プランでできることとできないこと を図表にまとめました。
Free
無料プラン
✔
利用可能(ただし無料は利用枠・提供範囲が制限される場合あり/上限や回数などの数値は公式非公表)
Pro
有料プラン(例:SuperGrok / SuperGrok Heavy / Premium+)
✔
利用可能。サブスクにより「フル機能解放」やレートリミット増などが案内されています(例:SuperGrok Heavyは“much higher rate limits”と明記)
Key Point: 公式アプリ説明に「画像生成」「音声のみで画像生成」「画像の編集」等の記載あり。無料/有料の具体的な上限値(回数・解像度など)は公開されていません。
Free
無料プラン
✔
利用可能(ただし無料は利用枠・提供範囲が制限される場合あり/地域・アカウント条件・時期で差が出る可能性)
Pro
有料プラン
✔
利用可能。公式アプリ説明では「音声付きの6秒動画」を生成できる旨が明記されています(テキスト→動画/静止画→動画化)。
Key Point: 公式の一次情報としては「6秒(音声付き)」表記が確認できます。仕様は更新され得るため、最新のアプリ内表示(生成UI/ヘルプ)を優先してください。
Free
無料プラン
✔
アプリ内で提供される範囲の指定が可能(設定項目の一覧・数値仕様は公式非公表/UI更新で変動)
Pro
有料プラン
✔
基本は同様。加えて、有料プランにはレートリミット増が明記されているものがあり(例:SuperGrok Heavy)、試行回数の余裕が出る可能性があります(詳細は非公表)。
Key Point: 調整項目や数値の公式リストは現時点で確認できません。実機の生成画面・設定画面に表示される項目を正としてください。
Free
無料プラン
✔
表示/利用可否は年齢・地域・ポリシー等により制御(表示されないケースあり)。利用は規約・AUP等の遵守が前提。
Pro
有料プラン
✔
同様に年齢・地域・ポリシー等により制御。プランによる“無制限化”は公式に明記されていません。
Key Point: Grokは「13歳以上」を前提として利用ルール(AUP等)に従うことが公式に示されています。モードの可否はアプリ実装とポリシー適用に依存します。
Free
無料プラン
✖
「優先処理」「高速モード」等の具体仕様・数値は公式未公表。混雑時は待ち時間が発生し得ます。
Pro
有料プラン
✔
公式にレートリミット増が明記されるプランがあります(例:SuperGrok Heavy)。優先キューの有無や速度の数値は未公表のため、実機挙動に依存します。
Key Point: 公式アプリ説明ではImagineを“super fast”と表現。一方で「無料/有料で速度が何倍」等の数値は公開されていません。
Free
無料プラン
✔
履歴・削除・データ取扱いは公式FAQ/規約に手順あり(保存数などの上限値は公式非公表/実装に依存)
Pro
有料プラン
✔
同様。履歴・保存に関する“プラン差”は現時点で公式に明示されていません。
Key Point: 履歴/削除/責任ある利用については公式FAQ・規約(AUP等)に記載。保存上限や差分はアプリ内表示を優先してください。
※ 本表は一次情報(公式サイト/公式アプリストア説明/xAI公式Legal・News)に基づき、上限値など未公表の箇所は「非公表」と明記しています。機能や制限は地域・年齢・アカウント条件・運用方針・アプリ版により変動します(最終確認日:2026-01-04)。
Grok Imagineを活用する際、無料プラン では活用できる機能に制限があります。また、使用しているアプリのバージョン によっても違いが出てきます。
その一方で有料プラン(SuperGrok / Premium+) に変更することで、全ての機能を優先的に活用できます。
Grok Imagineをフル活用したい場合は、有料プランに変更する ことをおすすめします。
Grok Imagineで「当たり」の画像を最短で生成|プロンプト200
「Grok Imagineで画像生成をすることに特化したプロンプト」 を、独自で作成しました。別記事にて共有しています。以下から「プロンプト200(有料)」 にアクセスすることができます。目的に合わせて最適なスタート地点を選びましょう。
PREMIUM CONTENTS
全200本の実務プロンプト(CSV)
安全運用ガイド&量産フロー
品質スコアカード付き
コピペで即・制作開始
「まずは無料版で試してみたい」という方は以下の「実務テンプレ50」 もおすすめです。
画像生成で「指示の出し方の重要性」 を感じた方も多いのではないでしょうか。
実は普段の仕事や相談においてもプロンプトの「型」 を知っているだけで、AIは最強のパートナーに変わります。もし画像だけではなく「日々の業務や意思決定」 もAIに任せて時間を生み出したいなら、こちらの実務特化型ガイドが役立ちます。
PREMIUM CONTENTS
全100種の実務テンプレ
Notion DBで検索・複製
爆速辞書登録ファイル
即・意思決定できる環境
Grokの料金について(別記事にまとめました)
先述した通り、Grok Imagineの機能を無料で活用できるのは期間限定 です。そして活用できる機能に制限があります。Grok Imagineの機能をフルに活用する際、有料プランに変更 した方が無難です。
以下の記事を読むことで、Grokモバイルアプリの有料版の料金 が理解できるだけでなく、無料版と有料版の違い や各プラットフォームごとの料金の違い についても理解することができます。
「結論→料金早見表→知っておきたいポイント→FAQ→プラン変更方法」 の順にまとめ、できるだけ理解しやすい形式にまとめました。
Grok Imagineで問題が発生したときは・・・
Grok Imagineを使用していると、以下の問題や疑問点に出くわすことがあります。
✓発生する可能性のある問題や疑問点
・画像生成は何枚までOKなのかわからない
・何秒の動画を生成できるのかわからない
・Spicyモードが表示されない
・Androidだけど保存できない
以下の記事は、そんな問題点や疑問点を即解決 するため実務ガイド になります。最短で問題を解決したい人 におすすめです。問題が解決しない時に生まれるストレスも解消されます。
Grok Imagineの使い方①:Grokアプリのホーム画面からGrok Imagineを開く
Grok Imagineの使い方 を徹底解説していきます。Grok Imagineはどこで活用できるの? でも共有した通り、Grok Imagineはアプリ内で活用できます。
使い方に関しては、僕自身が実際に操作をしながら、スクリーンショット とテキスト でわかりやすくまとめました。
この章を読むことで、どんな人でもGrok Imagineを使いこなせるようになります。
なお、「Grokアプリをそもそも使ったことがない」「Grokアプリの詳しい機能について、まだ理解していない」 という方は、以下の記事が参考になります。Grokアプリの使い方が学べる完全ガイド です。この記事を読んだ後にGrok Imagineの使い方を学ぶことで、より理解が深まるはずです。
なおアカウントの作成が完了したところから、解説を進めていきます。
Grokアプリを開くと、以下の画面が表示されます。
この画面はGrokアプリのホーム画面 になります。Grok Imagineを活用する際、画面上部の「作る」 をタップします。
タップするとGrok Imagineのホーム画面 が表示されます。
この画面でGrok Imagineの機能を活用していきます。
Grok Imagineの使い方②:テキストを入力して画像を作成する
画像を作成するまでの手順
画像生成をする際、以下のテキスト入力欄 にテキストを入力します。
試しにここでは、以下のプロンプトを入力してみました。
Grokという名前の未来的なAIアシスタントが、輝くホログラフィックの本で満ちた宇宙の図書館に立ち、空気中から鮮やかな画像を生成している様子。フォトリアリスティックスタイルで、ネオンアクセントと星空の背景。
入力後、矢印のマーク をタップします。
タップすると、以下のように生成されます。
Grok Imagineで画像を生成
こんな感じの画像が生成されました。
生成された画像の品質も非常に高いと感じました。個人でコンテンツ作成をする際にも、優秀なツールとして活用することができそうです。このようにして、テキスト入力から画像を生成することができます。
なお記事の後半では、僕が実際に生成した画像を「プロンプト付き」で紹介しています。画像生成のヒントが見つかるかもしれません。ぜひご覧ください。
同じプロンプトでほぼ無限の画像を生成可能
Grok Imagineでは、競合にはない機能 が備わっています。
通常の画像生成AIで画像を生成する際、生成される画像の枚数 が決まっています。確認できる画像の枚数も、「生成された枚数のみ」 です。しかしGrok Imagineでは、1回の生成で「ほぼ無限」の画像 を生成することができます。
以下のように、画面をスクロールするたびに 入力したプロンプトで生成された画像を表示し続けることができます。
スクロールするたびに画像が生成
従来の画像生成AIのあり方を覆すような機能 だと感じました。
同じプロンプトでも生成される画像のニュアンス は少しずつ変化してきます。全ての画像に違いがあります。スクロールするだけで生成され続けるので、「これはいい」と思った画像 を格段に見つけやすくなりました。
プロンプトの書き方の基礎を固める
Grokで質の高い画像を生成するためのコツは、他のAIにも応用が効く「プロンプト」 という技術に基づいています。 以下の記事で解説しているプロンプトの基本的なルール を学んでおくことで、その他のAIツールでも意図通りの出力がしやすくなります。
Grok Imagineの使い方③:画像をアップロードして音声付きの動画にする
写真アプリに保存されている画像 を、瞬時に音声付き動画 にすることができます。生成される動画の時間は「6秒」 です。Grok Imagineで生成していない画像にも対応しているので、コンテンツ制作の幅が広がります。
音声付き動画を作成する際、まず最初に写真に命を吹き込む と記載された項目の「全てを見る」 をタップします。
タップすると、写真アプリが表示されます。ここから「活用したい画像や写真」 をタップしましょう。
タップすると、すぐに動画の生成が開始します。生成する時間は30秒もかかりません。 あっという間に音声付き動画が完成します。左下にある動画のマーク をタップすることで、アップロードした画像の音声付き動画 を確認することができます。ここでは以下の動画が生成されました。
ここでは以下の動画が生成されました。
Grok Imagineで生成された動画①
個人的には、挿入される音声はそこまで精度の高いものではないように感じました。しかし従来の「画像を動画に変換するツール」は、そもそも音声なしの動画 として生成されるのが一般的でした。それをたったのワンタップ で「音声付き動画」に変換できてしまうことに感動しました。
このようにして、自分の好きな画像をアップロードし、音声付き動画を生成することができます。
Grok Imagineの使い方④:音声入力で画像を生成する
キーボードでテキストを入力しなくても、音声 でプロンプトを入力し、画像を生成することができます。その際、画面右下に表示されている「話す」 をタップしましょう。
タップすると、音声入力ができる状態 に切り替わります。
「どんな画像を生成したいのか」 を伝えることで、音声だけで画像を生成することができます。
しかし2025年8月中旬の時点では、「聞き取りの精度 」が低いように感じました。実際に活用してみるとわかりますが、日本語で話しかけているのに他の外国語として認識されることが多いです。なかなか日本語として認識してくれません。今後、性能が改善されることに期待です。
なお、音声入力を停止する 場合は停止ボタン をタップします。
Grok Imagineの使い方⑤:表示されている動画をタップしてできること
Grok Imagineのホーム画面には、複数の 動画が表示されています。
Grok Imagineを開くたび に、表示される動画は変化します。ここで表示されている全ての動画は、「動画」 としても「画像」 としても利用することができます。この節では、「表示されている画像をタップしてできること」 について解説していきます。
ここでも、Grok Imagineにしかない機能が満載です。
音声付き動画を閲覧できる
音声付き動画をワンタップで閲覧することができます。表示されている気になる動画 をタップします。
タップ後に、音声付き動画 を閲覧することができます。
音声付き動画を閲覧する
初めて活用する際、どのような動画を作成すればいいのかわからない方がいるかもしれません。しかしGrok Imagineでは大量の動画や画像がすでに閲覧可能となっています。アイデアが浮かびやすい構造 になっているため、活用するのが楽しくなりそうです。
画像に切り替えられる
動画は、画像に切り替えることもできます。その際、表示されている動画の下にある写真のマーク をタップします。
タップすることで、画像としても閲覧することができます。再び動画に切り替えたい場合は、隣のマーク をタップします。
画像も動画も簡単に閲覧できるので、非常に便利だと感じました。
動画と画像をダウンロードできる
自分のフォルダにダウンロードすることもできます。動画としてダウンロードしたい場合は、動画のマーク をタップしてからダウンロードのマーク をタップします。
タップ直後にダウンロードが完了します。画像の場合も同じ手順でダウンロードすることが可能です。
Xにシェアできる
表示されている全ての動画と画像は、X上にシェアすることもできます。InstagramやTikTokでも同じようにシェアが可能です。動画または画像を表示した後、以下の矢印のマークをタップします。
次にXのマーク をタップします。InstagramやTikTokでシェアをしたい場合は、該当のマーク をタップしましょう。
タップするとXの投稿画面 に切り替わり、ポスト としてシェアすることができます。
自分で動画や画像を作成した場合も、同じ手順でシェアが可能です。作成から共有までの手順が非常に簡単なのも、Grok Imagineの魅力のひとつです。
プロンプトを確認できる
気になる動画をタップすることで、選択した動画のプロンプト を確認することができます。
タップすると、以下の画面が表示されます。この画面の英語で記載されているテキスト がプロンプトです。プロンプト部分 をタップすることで、全文 を確認することができます。
ここで表示されている「アテナイの学堂のような画像」 は、上記の画像に記載されているプロンプトで作成されています。以下に、日本語訳を含めて「卵のオブジェクトのような画像のプロンプト」 をまとめました。
people start walking away from the room slowly, chatting, picking things up
人々が部屋からゆっくりと歩き出し、おしゃべりをしながら物を拾っていく。
実際に入力されているプロンプトは英語ですが、日本語で確認することが出来れば、「こんな感じでプロンプトを入力すればいいんだ」 という理解につながりますね。
初めて生成AIを活用する方でも簡単に使えるようなプロンプトで、高品質な動画や画像を生成できます。
Grok Imagineの使い方⑥:生成される動画のモードを切り替える
動画生成時にはモード を選択できます。モードの切り替えによって出力の傾向は変わりますが、現時点(2025年10月30日)で公式の情報には、各モードが動画に与える具体的な挙動差の説明は見当たりません。
なのでこの節では、実際に各モードで動画を生成し、出力の違いを実例で確認していきます。なお機能や挙動は端末、地域、アプリ版数によって異なる場合があることを理解しましよう。
どのモードがおすすめ?4つのモードの特徴
選択できるモードは以下の4つ になります。それぞれの特徴 もまとめました。
追加の指示(追加テキスト等)を与えて、出力の方向性を追い込みやすくするモードです。動画化(静止画→短尺動画)を行う際に、動きの雰囲気や演出の傾向を「より狙いに寄せる」用途で使われます。利用できる設定項目や表示は、アプリのバージョン/地域/ロールアウト状況により変動します。
成人向け表現を相対的に許容する可能性があるモードです。ただし、年齢条件・地域・ポリシーにより利用範囲は制御されます。また、xAIのポリシー上「実在人物のポルノ的表現」や「未成年の性的表現」は明確に禁止されています。規約・AUPに反する用途(無断の実在人物加工等)は行わないでください。
意外性や遊び心のある方向に寄りやすいモードです。厳密な再現よりも「発想の広がり」「ノリの良い試作」を優先したい場面に向きます。出力傾向はアップデートで変わる可能性があるため、最新の挙動はアプリ内の結果を基準に判断してください。
標準の基本モードです。まずはここを起点に、プロンプトの当たりを付けてから他モードへ展開すると検証が安定します。Grok Imagineは「テキストから音付きの短尺動画を生成」および「静止画を短尺動画へ変換」が可能と案内されており、モード選択は主にこの“動画化”の挙動調整として使われます。
モードの変更方法
モードを選択する 際、再実行の横に表示されているマーク をタップします。
タップすると、4つのモードを選択する項目 が表示されます。
表示されているモード をタップすることで、モードの特徴を活かした動画 を生成することができます。
生成される動画の違いを検証
実際に動画を生成して、違いを検証していきます。まずは、画像生成からです。以下のプロンプトを入力して画像を生成していきます。
A hyper-unique anime girl with cat ears and ninja mask, her body made entirely of swirling fluffy clouds that change shape like smoke, holding a glowing katana made of lightning, floating in a stormy sky, highly detailed anime style, vibrant neon colors, dynamic action pose, intricate details on cloud textures.
猫耳と忍者マスクの超ユニークなアニメ少女、体全体が渦巻くふわふわの雲でできていて煙のように形を変える、稲妻の輝く刀を構え、嵐の空に浮かぶ。高度に詳細なアニメスタイル、鮮やかなネオンカラー、ダイナミックなアクションポーズ、雲のテクスチャに細かなディテール。
矢印のマーク をタップした後に複数の画像が生成されました。その中で、以下の画像を選択しました。
この画像を用いて4つのモードで動画を生成し、違いを検証します。それぞれのモードで生成される動画の特徴 を理解できるはずです。
カスタムモード
カスタムモード で動画を生成していきます。カスタム をタップしましょう。
タップするとテキスト入力欄 が表示されます。カスタムモードでは、テキスト入力 を通して動画を細かくカスタマイズできます。ここでは「輝く刀を斬りつけ、巨大な雷を爆発させて放つ。ダイナミックなスピンカメラ、エピックアニメアクション動画」 と入力しました。
矢印のマーク をタップした後、すぐに動画が生成されます。ここでは以下の動画が生成されました。
指示に忠実な、非常に斬新かつダイナミックな動画を生成できました。
Spicyモード
Spicyモード で動画を生成していきます。まず最初に、Spicy をタップしましょう。
タップした後、すぐに動画の生成が開始します。ここでは以下の動画が生成されました。
Spicyモードで生成された動画
他のモードと比較すると、「刺激強めな動画」 が出力されました。「普通の動画では飽きてしまった方」 は、Spicyモードを活用してみてはいかがでしょうか。
なお公式の発表ではありませんが、Spicyモードでは「成人向けの表現が相対的に許容されている」 という情報が散見されています。とは言っても悪用は厳禁です。
Funモード
Funモード で動画を生成していきます。まず最初に、Fun をタップしましょう。
タップした後、すぐに動画の生成が開始します。ここでは以下の動画が生成されました。
Funモードで生成された動画
他のモードで生成された動画と比較して「動きが多い」 と感じました。ツッコミどころが多い動画です。
Normalモード
Normalモード で動画を生成していきます。まず最初に、Normal をタップしましょう。
タップした後、すぐに動画の生成が開始します。ここでは以下の動画が生成されました。
Normalモードで生成された動画
Normalという名前の通り、最もベーシックな動画 が生成されました。しかし画像を瞬時に動画にできること自体が「すごいこと」です。Nomalモードでも、十分需要はある ように感じました。
Grok Imagineの使い方⑦:画像や動画をお気に入り登録する
気になる画像 を見つけた時、または完成度の高い動画を生成した時 は、お気に入り登録 をしておくと便利です。お気に入り登録をする際、左側に表示されているハートのマーク をタップします。
タップすることでお気に入り登録が完了します。
お気に入り登録した画像や動画は、テキスト欄横に表示されているFavorites に保存されます。タップしてみましょう。
タップすることで、過去にお気に入り登録した全ての画像と動画 が表示されます。
知っておくと、よりGrok Imagineを有効活用できそうです。
Grok Imagineで作成した10の画像と動画
この章では、僕自身がGrok Imagineで生成した10の画像と動画 を「プロンプト付き」 で紹介していきます。全てスマホだけで生成しました。一切、加工も加えていません。
Grok Imagineで画像生成や動画生成をする際、ぜひ参考にしてください。
空中で砕ける「氷の砂」
活用したプロンプトは以下のものになります。
Falling sand crystallizes into polyhedra mid-air, then collapses—captured across micro-moments. High-speed-shutter feel with a touch of motion blur to imply time offset. Black background, sidelight. Precisely varied particle sizes. Palette: black, silver, pale teal.
砂が落下しながら空中で多面体に結晶化→崩壊を反復。高速シャッター感+微量モーションブラーで時間差を表現。黒背景、側光、粒径の差を精密描写。色は黒×銀×薄ティール。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
空中で砕ける「氷の砂」
宙に描かれたガラスの筆跡
活用したプロンプトは以下のものになります。
Ink strokes suspended in zero-gravity, morphing smoke → liquid → glass mid-stroke. Rule of thirds, backlight plus rim for silhouette. Palette: black, gray, pale teal. Low grain; show fiber/grain inside strokes with high fidelity.
墨の筆致が無重力空間で立体化し、ストロークが煙→液体→ガラスへ相転移。三分割構図、逆光+リムで輪郭。黒×灰×薄い青緑のみ。粒状感は控えめ、ストロークの繊維感は精密。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
宙に描かれたガラスの筆跡
結晶の上に止まる蝶
活用したプロンプトは以下のものになります。
Moth-wing scales rising like a crystalline city. Focus-stacked look with razor micro-detail; side light to sculpt the crystal edges. Background fully defocused. Subtle teal dispersion. Maximize micro-pattern; keep noise extremely low.
蛾の羽の鱗粉が、氷の結晶都市のように立ち上がる。スタックフォーカス風の超解像、側光で結晶エッジを強調。背景は完全ボケ。青緑の分光反射をわずかに。粒子・ノイズを抑え、微細パターンを最大化。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
結晶の上に止まる蝶
水面に浮かぶ黒い器と波紋
活用したプロンプトは以下のものになります。
A jet-black ceramic form floats above still water; ultra-thin ripples trace geometric patterns. Strong rim light to carve edges, macro-level DOF, suppress mirror-like reflections. Palette: black + teal + a touch of white. Dust-free, ultra-clean render.
漆黒のセラミックが水面上に浮かび、極薄の波紋が幾何学模様を刻む。リムライトでエッジ強調、マクロ寄り被写界深度、鏡面反射は抑制。黒×青緑×僅かな白のみ。ダストなし、超クリーンレンダー。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
水面に浮かぶ黒い器と波紋
黒い水面を走る青い稲妻
活用したプロンプトは以下のものになります。
A sea of liquid obsidian collapses and re-weaves into vortices; hairline teal lightning runs along the edges like capillaries. Low angle, golden-spiral composition. Volumetric haze with micro-particles and polarized highlights. Palette restricted to black, teal, and silver. Minimal noise, ultra-detailed, no text or watermark.
液体黒曜石の海が自ら崩れては編み直す渦を形成し、縁に青緑の電光が毛細管のように走る。ローアングル、ゴールデンスパイラル構図。体積霧と微細な粒子、偏光ハイライト。色数は黒/ティール/銀に限定。ノイズ最小、超精細、文字なし。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
黒い水面を走る青い稲妻
江戸木版風の大波
活用したプロンプトは以下のものになります。
Edo woodblock-style rendering of waveform data. Visible paper-fiber emboss, slight plate misregistration. Palette: indigo, ink black, white. No halftones. Mostly flat composition, shadows extremely subtle. High-resolution texture fidelity.
江戸木版風のタッチで、波形データを抽象化。紙の繊維エンボス、わずかな版ズレ、彩色は藍×墨×白。ハーフトーンは禁止。平面構成だが影はごく薄く。高精細テクスチャ。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
江戸木版風の大波
星明かりの海とレンズの揺らぎ
活用したプロンプトは以下のものになります。
Ocean above, starfield below; worlds inverted. Boundary shimmers like annular lens aberration. 20mm, f/4, 15s, ISO800 (tripod). Wet sand with micro-shells and foam residue. Ultramarine/black/hint of cyan. Pinpoint stars, minimal noise.
海上は深海、海下面が星空。境界はレンズの円環収差風のゆらぎ。20mm, f/4, 15s, ISO800(三脚相当)。ウェットサンドの微小貝片、泡の残滓。群青/黒/微シアン。星像は点像再現、ノイズ最小。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
星明かりの海とレンズの揺らぎ
夕日と構える古代の弓兵
活用したプロンプトは以下のものになります。
Trojan archer wearing a Phrygian cap and scale armor, small leather pelta shield on his back, drawing a composite bow, blurred city walls in the background glowing amber in sunset, capturing the tendons in his fingers, bowstring tension, and the fine fuzz on the arrow fletching, 85mm f/1.8.
トロイア側の弓兵、フリギア帽と鱗状スケールアーマー、革のペルタ小盾を背負い複合弓を引き絞る、城壁が遠景にぼけて夕陽が琥珀色に反射、指節の筋張り・弦の撓み・矢羽の産毛まで見せる、85mm f/1.8。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
夕日と構える古代の弓兵
城門から出る古代の護衛兵
活用したプロンプトは以下のものになります。
Elite guard spearman (Trojan), long-crested helmet with feather plumes, linothorax armor, sun-emblem round shield and bronze gorget, advancing from the shadow of a gate, showing linen tunic weave, shield leather cracks, and shaved stubble marks in detail, 70mm.
貴族級の護衛槍兵(トロイア)、羽飾り長冠兜+リノトラックス、太陽紋の円盾と青銅製ゴルゲット、城門の影から前進、麻チュニックの織り目・盾革のクラック・頬の髭剃り跡まで精密、70mm。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
城門から出る古代の護衛兵
墨絵で夕景の竹林を描く
活用したプロンプトは以下のものになります。
Sumi-e bamboo scene with dry-brush skips, single-stroke value shifts, fibrous washi texture and gentle ink bleed, negative-space composition, monochrome with a faint warm tone, 8K, no seals or text.
竹林の墨絵(筆+墨)、ドライブラシの掠れと濃淡の一筆表現、和紙の繊維とインクの滲み、余白重視の構図、モノクロにごく薄い温色トーン、8K、落款や文字は無し。
生成された画像はこちらになります。出力された複数の画像の中から「これがいい」と思ったものを選択しました。
この画像から生成できた動画はこちらになります。
墨絵で夕景の竹林を描く
Grok Imagineの新機能と使い方
追加された新機能(2026年2月2日時点)
2026年2月2日に、新機能が続々とリリースされました。
主に以下の機能がリリースされています。
Core Updates (明言された新機能)
動画生成が「10-second videos」へ拡張され、解像度は720pに対応。直近30日で12億本以上(1.245B)が生成された実績と共にリリースされました。
「Dramatically better audio」と明記。感情豊かな声(Emotional voices)に加え、映像の展開に同期する音楽(Music that syncs)が生成されます。
追加指示(Follow up prompts)を含め、ユーザーの意図を正確に汲み取る能力が大幅に向上。「追いプロンプト」による微調整がより強力になりました。
Quality & Benchmarks (品質・評価)
「Sharper detail」「Smoother motion」を実現。古い家族写真やペット写真のアニメ化、ニュース系ミームなど、日常的な用途でも高品質な動きを提供します。
Artificial AnalysisのVideo Arenaにおいて、Text-to-VideoおよびImage-to-Videoカテゴリで1位を獲得した旨が公式言及されています。
「Try it now for free」の導線を展開。ブラウザ(grok.com/imagine)等から、最新の生成モデルを即座に試行可能です。
API Specifications (開発者向け)
動画生成・編集API。生成だけでなく「Edit」ガイドも存在。アスペクト比指定(デフォルト16:9)に対応し、システムへの組み込みが可能です。
画像生成・編集API。テキストからの生成に加え、既存画像の自然言語編集、複数枚同時生成(Batch)、反復編集(Multi-turn)が仕様化されています。
特に重要なのは、「10秒動画が作成できるようになった」 ことと「動画の解像度を調整できるようになった」 ことです。次の節で共有しますが、操作方法は非常に簡単です。より多くの人が、高い精度の動画を生成できるようになりました。
新機能の使い方
10秒動画の生成 や動画の画質を高める 際、まず最初にGrok Imagineのホーム画面に表示されている以下のボタンをタップします。
タップすると、Imagine Settings が表示されます。
この項目で操作していきます。
生成する動画の長さを10秒に変更する際は、Video Durationに表示されているトグルボタン をタップします。
また生成する動画の画質を変更する際は、Video Resolutionに表示されているトグルボタン をタップします。
このように、動画の生成時間を変更するのも画質を変更するのも、非常に簡単です。
参考までに、動画の時間、そして画質はそれぞれ「どのようなシチュエーションでどの数値が最適なのか」 を以下の図表にまとめています。
Video Duration (動画時間)
検証用
ワンアクション
最適: 検証・ループ映え・一撃演出
構図や動きの「当たり判定」を行う検証や、ループ前提の短尺動画に。失敗しやすいテーマで「量産→選別」する際に効率的です。
ワンアクション(振り向く/波が寄せる等)
テンポ重視の「一撃で刺す」演出
ストーリー性
カメラワーク
最適: 変化量・作品感・広告完成版
表情や天候の変化、パン/ドリー等のカメラワークで「見せる時間」が必要な場合に。BGMを活かした「起承転」のある尺です。
追いプロンプト(Follow-up)前提の調整
短いながらも「作品感」が出る広告/ショート
Video Resolution (解像度)
試作
高速PDCA
最適: 当たりを引くための反復生成
まずは数を回して構図や動きの「成立」を確認するフェーズに。通信負荷を抑え、素材の選別(採用したら720pで再生成)に向きます。
構図/動きの確認(ディテール不問)
チームへの軽量共有・比較テスト
本番
保存版
最適: 公開・質感・ディテール勝負
SNS投稿の完成版やポートフォリオに。質感(布、肌、金属、水滴)や情報量の多いシーン(街、文字入り)で真価を発揮します。
見栄えが必要なSNS投稿
“滑らかさ・解像感”が評価される場所
実運用の選び方 (Tactical Matrix)
生成される動画のアスペクト比を変更する
さらに、生成される動画のアスペクト比 も簡単に変更できます。制作の幅が広がるので、ここもぜひ覚えておきましょう。
アスペクト比を変更する際、Aspect Ratio から変更していきます。
Grok Imagineでは、以下のアスペクト比に変更できます。サイズに応じた推奨シーン もまとめているので参考にしてください。
Standard Video (動画・配信の定番)
YouTube
Cinematic
最適: YouTube / 映画的表現 / デスクトップ
最も一般的な動画フォーマット。シネマティックなカメラワーク(パン・ドリー)や、背景の広がりを見せる映像に最適。サムネイルへの転用も最も容易です。
✦ 推奨シーン:雄大な風景、走行シーン、ドローン空撮、物語のある映像。
TikTok
Reels / Shorts
最適: スマホ全画面・ショート動画
SNSでの没入感が最大化される比率。人物の全身ダンスや、画面いっぱいにエフェクトが広がる演出に。上下の余白がないため、被写体を大きく捉えられます。
✦ 推奨シーン:ダンス、Vlog(自撮り)、商品接写、迫力重視のCG。
Creative & Web (Web・演出用)
Feed Video
Product Loop
最適: フィード内再生・商品ループ・プレビュー
InstagramやXのフィードで「見切れ」が発生しない安定サイズ。商品の360度回転や、ロゴアニメーションなど、中心に視線を集めるループ動画に向きます。
✦ 推奨シーン:商品回転、シンメトリーな幾何学模様、ロゴモーション。
Web Embed
Blog Top
最適: Web記事埋め込み・自然な視野角
16:9ほど横長すぎないため、Web記事のトップ動画として配置した際に縦方向の情報量も確保できます。ドキュメンタリータッチの落ち着いた映像に適しています。
✦ 推奨シーン:インタビュー風、街角の環境映像(アンビエント)、料理手順。
Character
Fashion
最適: モーションポートレート・ファッション
「動く肖像画」のような使い方に。9:16ほど縦長ではないため、上下にテロップを入れる余地を作りやすく、全身コーディネートを見せる動画広告にも適しています。
✦ 推奨シーン:モデルの立ち姿、キャラの表情変化、縦構図のシネマグラフ。
迷った時の選び方(動画運用ルール)
基本フロー
検証=480p ➔ 本番=720p
SNSショート
9:16 (TikTok/Reels)
YouTube/映画
16:9 (Cinematic)
ループ素材
1:1 (汎用性・安定)
Web・キャラ
3:2 (Web) or 2:3 (人物)
高品質な画像を生成するために
プロンプトを工夫しても、AIが意図しない画像を生成したり、指示が長すぎてエラーになったりすることがあります。
これらの現象は、AIの内部的な仕組みや特性が原因です。 より深くAIを理解し、トラブルを未然に防ぎながら安定して高品質な出力を得るために、以下の2つの記事を紹介します。
記事の振り返り(FAQ形式でまとめました)
最後に、FAQ形式 で本記事の内容をまとめました。振り返り としてご覧ください。
Grok Imagineとは何ですか?
Grok(xAI)のアプリ/体験内で提供される画像・動画生成(Imagine)です。公式ストア説明では、音声プロンプトでの画像生成、テキストプロンプトから音声付きの短尺動画(6秒)の生成、静止画(写真)を動画化する機能が案内されています。
ポイント: 一次情報は「音声入力」「テキスト→音声付き6秒動画」「静止画→動画」を明記しています。
いつから、誰が利用できますか?
利用可否は地域・アカウント・ロールアウトにより変動します。xAIの案内では、Grokは一部地域で無料(制限付き)で提供され、また有料サブスクリプションでフル機能が解放される旨が整理されています。年齢については13歳以上の利用が前提です。
無料プランと有料プランの違いは何ですか?
無料は制限付きで、有料サブスクリプションによりフル機能が解放されると整理されています。具体的な生成回数・待機優先度などの数値仕様は公開されていません。
生成される画像の解像度はどのくらいですか?
最大解像度の具体的な数値は公式に明示されていません。アプリ内で選べるサイズ・比率に準拠し、アップデートで変更される可能性があります。
動画の長さは最大で何秒ですか?
公式ストア説明では、テキストプロンプトから「音声付き6秒動画」を生成できる旨が案内されています。上限はアップデートやロールアウトで変更される可能性があるため、端末上の表示を優先してください。
テキストから直接動画を生成できますか?
公式ストア説明では、テキストプロンプトから音声付きの短尺動画(6秒)を生成できる旨が案内されています。実際の提供状況はロールアウトやバージョンにより差が出る場合があります。
どのような生成モードがありますか?
Imagineには「Normal」「Fun」「Custom」「Spicy」の4モードが案内されています。Spicyは年齢・地域・ポリシーにより制御され、違法・未成年関連・権利侵害などは禁止です。
「ほぼ無限スクロール」とは何ですか?
特定の公式機能名というより、候補(生成結果)を連続的に閲覧・比較できる体験を指す表現です。大量の案を見比べて、好みの構図や質感を素早く見つける用途に向きます。
画像をアップロードして何ができますか?
公式ストア説明では、静止画(写真)を動画化できる旨が案内されています。画像を起点に、制作フロー(動画化・派生案作成など)へつなげる使い方が可能です。
音声入力は使えますか?
はい。公式ストア説明で、音声プロンプトによる画像生成が案内されています。重要な要件はテキストで補正すると安定しやすいです。
気に入った画像を保存できますか?
保存や共有の挙動は提供面(Web/アプリ)に依存します。生成物の保存上限などの数値は公開されていません。
プロンプトを作成する上でのコツはありますか?
「主題→スタイル→光源/構図→質感/色→制約(避けたい要素)」の順で具体化し、短い反復で調整するのが実務的です。動画化する場合は“動き”と“カメラ”の指示を明確にするとブレが減ります。
商用利用は可能ですか?権利関係はどうなりますか?
利用はxAIの利用規約と各国法令を前提とします。生成物の扱い(商用利用可否、権利、帰属表記の推奨など)は公式規約・FAQの最新記載に従ってください。第三者の著作権・商標・肖像権・プライバシー侵害に当たる利用はリスクが高く、ポリシー上も制限対象になり得ます。
Web版やX(旧Twitter)でも利用できますか?
Grok自体はWebやアプリ、X上でも提供されますが、Imagine(画像/動画生成)の対応範囲は表示面やロールアウトで差が出る場合があります。最新の可否はアプリ内表記やストア説明を優先してください。
仕様が変更された場合、どこで確認すればよいですか?
最も確実なのは、アプリ内の公式表記、App Store/Google Playの説明、xAI公式FAQやポリシー等の一次情報です。本ページの記載と差異がある場合は公式情報を優先してください。
✓ 50本の即戦力テンプレ(CSV)
✓ 「2ノブ方式」を学ぶA4導入シート
✓ 再現性の基本となる「スキーマ」の要点
RECOMMENDED
✓ 全200本 の即戦力テンプレ(CSV)
✓ 安全運用ガイド/量産フロー(PDF)
✓ チームで使える品質スコアカード
まとめ
以上になります。
Grok Imagineがどのようなツールなのか、どんなことができるのか、どんな成果物が生成できるのかについて理解することができたかと思います。
使ってみた時の第一印象は、「画像も動画も生成が超簡単」 でした。しかも動画に関しては、自動的に音声も生成されます。ここまで手軽に、画像、音声付き動画を生成できるツールは、いまのところ競合にはありません。もっと高品質なものを出力してくれるツールはあります。しかしこの手軽さは、今後Grok Imagineを重宝する大きな理由になると感じました。
Grokは、今後も進化し続けると思います。僕自身は引き続きその進化を追いつつ、ブログ記事にまとめ、更新し続けようと思います。
本記事が、Grok Imagineの理解と生成AIの興味関心につながれば幸いです。
なお、こちらのページを最後までスクロール するとコメント欄 があります。そちらのコメント欄に気づきや感想等がございましたらご記入ください。さらに質の高い情報を発信するための学びとさせていただきます。
最後までお読みいただきありがとうございました。
関連記事
本記事の最後に、Grok関連の記事を5つ 共有します。Grokについてもっと理解したい方は、あわせてお読みください。
用語集
本記事で記載されていたテキストの「用語集」 です。意味を理解するのに最適です。参考にしてください。
プラットフォーム & プラン
Grok(グロック)
xAIが提供する対話型AI。Web/iOS/AndroidやX連携で動作し、テキスト応答に加えて画像・動画生成などのマルチモーダル機能を備える。
Grokアプリ
iOS/Android向け公式アプリ。画像生成、画像→動画化、テキスト→動画(約6秒)や音声入力などに対応(提供範囲は順次更新)。
SuperGrok / Premium+
有料アクセス層。最新モデルや新機能に優先的にアクセスできる。具体的な数値上限は非公表。
無料枠
誰でも試せる利用枠。利用回数や同時実行などに制限があり、国・年齢・アプリ版数で挙動が異なる。
Grok Imagine の中核概念
Grok Imagine
アプリ内の画像生成&短尺動画生成機能。テキスト/音声から画像生成、画像→動画化、テキスト→動画(約6秒)に対応。
Auroraエンジン
Grokの画像/動画生成を支えるモデル群(Aurora)。高品質な静止画や短尺動画の生成に用いられる。
Make Video(Animate)
生成/アップロードした画像を音声付き短尺動画へ変換する操作。UI表記はバージョンで異なる場合がある。
バリエーション
同一テーマから多様な候補を連続表示・比較できる仕組み(いわゆる“ほぼ無限スクロール”挙動)。
Favorites
気に入った出力をお気に入り登録して後で参照・活用できる管理機能(保存上限の数値は非公表)。
入出力とメディア仕様
Text-to-Image
Image-to-Video
静止画を起点に短尺動画を生成。上限秒数はアプリ内表示や更新状況により変動し得る。
解像度
最大解像度の具体的数値は公式に非公表。アプリ内のサイズ/比率選択に準拠し、アップデートで変動し得る。
アスペクト比
縦横比の指定。例:1:1、16:9など(選択肢はバージョンにより異なる)。
被写界深度(DOF)
ピントの合う範囲。浅いと背景ボケ、深いと全体にピントが合う表現。
生成モード
Normal
Fun
Custom
Spicy
成人向け表現に関わるモード。年齢・地域・AUP等のポリシーで利用範囲が制御(違法・有害・未成年関連は不可)。
プロンプト作成の用語
プロンプト
生成指示文。主題→スタイル→光源/構図→質感/色数→不要要素の順で具体化すると安定しやすい。
ネガティブプロンプト
スタイル転写
参照画像の画風・質感を新規画像へ反映する手法(対象素材の権利に注意)。
Image-to-Image
既存画像をもとに再生成・一部修正・画角拡張(アウトペインティング)などを行う。
バッチ生成
複数の生成を連続・並列的に進める運用上の呼び名。公式の機能名や実装は版数により異なる。
写真的・映像的な表現
リムライト
ゴールデンスパイラル
体積霧
フォトリアル
スタックフォーカス風
複数のピント面を合成したような全面高精細の見え方(実写の技法を模した表現)。
ポリシー & 権利
NSFW
職場不適切な成人向け表現。Spicyモードなどに関連し、年齢確認・地域要件・AUPの遵守が必要。
著作権・パブリシティ権
著名人の肖像、既存キャラクター、実在ロゴ等の扱いに法的留意が必要。商用利用時は規約・法令を確認。
コメント