📘 Grok Imagine Video の技術仕様
| 仕様 | 詳細 |
|---|---|
| モデルID | grok-imagine-video |
| 提供元 | xAI |
| タイプ | 動画生成&編集AI |
| 入力タイプ | テキスト(プロンプト);任意で画像または動画 テキストプロンプト(自然言語);任意で画像入力(画像→動画);既存クリップ編集用に任意で video_url。編集用入力動画の最大長はエンドポイントにより異なり、一部の編集フローでは約 8.7 秒と報告。 |
| 出力タイプ | 一時URL経由の .mp4 動画 |
| 生成可能な長さ | 1〜15秒 |
| 解像度 | 480p、720p(設定可能) |
| アスペクト比 | 1:1、16:9、9:16 |
| 編集対応 | 可 — 最大約 8.7 秒までの動画のアニメーション化・変更に対応 |
| モデレーション | コンテンツモデレーションを搭載 |
| 料金 | 秒単位課金、解像度により変動 |
🚀 Grok Imagine Video とは?
Grok Imagine Video は、CometAPI を通じて提供される xAI の高度な動画生成・編集AIモデルです。開発者は自然言語のプロンプトから短尺のカスタム動画を生成でき、静止画のアニメーション化や既存クリップの編集も任意で行えます。出力長・解像度・アスペクト比を設定でき、ポリシー遵守のためのコンテンツモデレーションを内蔵しています。
🧠 主な機能(Grok Imagine の特長)
- ネイティブ音声+リップシンク:環境音や効果音、短いスピーチ/ナレーションを生成し、リップシンクに概ね同期。
- 画像→動画/プロンプト編集:テキストプロンプトで静止画をアニメーション化、または既存映像を編集(オブジェクトの削除・置換、リタイミング、スタイル変更)。
- 高速な反復&低レイテンシ:クリエイティブワークフローやプロトタイピングに適した迅速なフィードバックループを実現。
- 本番向けAPI:Imagine API はバッチ生成、編集パイプライン統合、エンタープライズ制御のためのプログラマティックなエンドポイントを提供。
- 複数の“モード”/スタイル:ユーザー向けモード(報告例:Normal/Fun/Spicy などのプリセット)により、スタイルや許容度を調整(注:歴史的に “Spicy” モードでは NSFW が有効化されていたとされる)。
| モデル(企業) | 最大解像度(公開情報) | 最大クリップ長(公開情報) | ネイティブ音声 | 強み | 注意点 |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6〜15秒 | あり | 高速な反復、優れたコスト/レイテンシ、編集機能統合、ネイティブ音声 | 720p 上限、モデレーションの懸念、実世界での忠実度にばらつき |
| Sora (OpenAI) | 720p〜1080p(ティアに依存) | 短尺(6〜15秒) | あり | 高い映像忠実度、OpenAI スタックとの強力な統合 | 高コスト、モデレーション/制御が制約される |
| Veo (Google DeepMind) | 最大 1080p+ | 短尺(可変) | あり | 高いフォトリアリズム、安定したモーション | 高コスト、公開での試行が少ない |
| Runway Gen-4.5 | 1080p+ | 短尺(可変) | あり | クリエイティブワークフローでの業界採用、高い忠実度 | より高コスト、クリエイティブツールに注力 |
| Vidu / Kling / Pika (various specialists) | 最大 1080p | 短尺(可変) | 混在 | ニッチ機能を提供するものもあり(Smart Cuts、マルチショット連結) | 音声対応は様々、API の成熟度も異なる |
⚠️ 制約事項
- 最大動画長は 15 秒に制限されています。
- 編集は入力動画の長さを維持します(≤ 8.7 秒)。
- 生成された URL は一時的です — 速やかにダウンロードしてください。
Grok Imagine Video へのアクセスと統合方法
ステップ 1: API キーの取得
cometapi.com にログインしてください。未登録の場合は先に登録を行ってください。CometAPI コンソールにサインインし、インターフェース用のアクセス認証 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。
ステップ 2: Grok Imagine Video API にリクエストを送信
“grok-imagine-video” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し先:GROK[動画生成](https://apidoc.cometapi.com/video/grok/create) および[動画編集](https://apidoc.cometapi.com/video/grok/edit)。
ステップ 3: Grok Imagine Video API にリクエストを送信
テキストを入力するか画像をアップロードします(任意でアニメーション化するソース画像を指定可能)。Grok Imagine AI API が入力を解析し、URL 用のコンテンツを準備します。テキスト→動画と画像→動画の両方に対応しています。
ソース画像は次のいずれかで提供できます:
- 画像を指す公開 URL
- Base64 でエンコードした Data URI(例:
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
ステップ 4: 結果の取得と検証
API レスポンスを処理して生成結果を取得します。送信後、API はタスクのステータスと出力データを返します。提出直後に request_id が返されるため、GET エンドポイントでステータスを確認し、生成された動画を取得してください。動画編集は非同期のため、完了までこのエンドポイントを複数回ポーリングする必要がある場合があります。ダウンロードはお早めに。