Affordable Grok Imagine Video API | image-to-video

📘 Grok Imagine Video の技術仕様

仕様	詳細
モデルID	grok-imagine-video
提供元	xAI
タイプ	動画生成＆編集AI
入力タイプ	テキスト（プロンプト）；任意で画像または動画テキストプロンプト（自然言語）；任意で画像入力（画像→動画）；既存クリップ編集用に任意で video_url。編集用入力動画の最大長はエンドポイントにより異なり、一部の編集フローでは約 8.7 秒と報告。
出力タイプ	一時URL経由の .mp4 動画
生成可能な長さ	1〜15秒
解像度	480p、720p（設定可能）
アスペクト比	1:1、16:9、9:16
編集対応	可 — 最大約 8.7 秒までの動画のアニメーション化・変更に対応
モデレーション	コンテンツモデレーションを搭載
料金	秒単位課金、解像度により変動

🚀 Grok Imagine Video とは？

Grok Imagine Video は、CometAPI を通じて提供される xAI の高度な動画生成・編集AIモデルです。開発者は自然言語のプロンプトから短尺のカスタム動画を生成でき、静止画のアニメーション化や既存クリップの編集も任意で行えます。出力長・解像度・アスペクト比を設定でき、ポリシー遵守のためのコンテンツモデレーションを内蔵しています。

🧠 主な機能（Grok Imagine の特長）

ネイティブ音声＋リップシンク：環境音や効果音、短いスピーチ／ナレーションを生成し、リップシンクに概ね同期。
画像→動画／プロンプト編集：テキストプロンプトで静止画をアニメーション化、または既存映像を編集（オブジェクトの削除・置換、リタイミング、スタイル変更）。
高速な反復＆低レイテンシ：クリエイティブワークフローやプロトタイピングに適した迅速なフィードバックループを実現。
本番向けAPI：Imagine API はバッチ生成、編集パイプライン統合、エンタープライズ制御のためのプログラマティックなエンドポイントを提供。
複数の“モード”／スタイル：ユーザー向けモード（報告例：Normal／Fun／Spicy などのプリセット）により、スタイルや許容度を調整（注：歴史的に “Spicy” モードでは NSFW が有効化されていたとされる）。

モデル（企業）	最大解像度（公開情報）	最大クリップ長（公開情報）	ネイティブ音声	強み	注意点
Grok Imagine (xAI)	720p	6〜15秒	あり	高速な反復、優れたコスト／レイテンシ、編集機能統合、ネイティブ音声	720p 上限、モデレーションの懸念、実世界での忠実度にばらつき
Sora (OpenAI)	720p〜1080p（ティアに依存）	短尺（6〜15秒）	あり	高い映像忠実度、OpenAI スタックとの強力な統合	高コスト、モデレーション／制御が制約される
Veo (Google DeepMind)	最大 1080p+	短尺（可変）	あり	高いフォトリアリズム、安定したモーション	高コスト、公開での試行が少ない
Runway Gen-4.5	1080p+	短尺（可変）	あり	クリエイティブワークフローでの業界採用、高い忠実度	より高コスト、クリエイティブツールに注力
Vidu / Kling / Pika (various specialists)	最大 1080p	短尺（可変）	混在	ニッチ機能を提供するものもあり（Smart Cuts、マルチショット連結）	音声対応は様々、API の成熟度も異なる

⚠️ 制約事項

最大動画長は 15 秒に制限されています。
編集は入力動画の長さを維持します（≤ 8.7 秒）。
生成された URL は一時的です — 速やかにダウンロードしてください。

Grok Imagine Video へのアクセスと統合方法

ステップ 1: API キーの取得

cometapi.com にログインしてください。未登録の場合は先に登録を行ってください。CometAPI コンソールにサインインし、インターフェース用のアクセス認証 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。

ステップ 2: `Grok Imagine Video` API にリクエストを送信

“grok-imagine-video” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。呼び出し先：GROK［動画生成］(https://apidoc.cometapi.com/video/grok/create) および［動画編集］(https://apidoc.cometapi.com/video/grok/edit)。

ステップ 3: `Grok Imagine Video` API にリクエストを送信

テキストを入力するか画像をアップロードします（任意でアニメーション化するソース画像を指定可能）。Grok Imagine AI API が入力を解析し、URL 用のコンテンツを準備します。テキスト→動画と画像→動画の両方に対応しています。

ソース画像は次のいずれかで提供できます：

画像を指す公開 URL
Base64 でエンコードした Data URI（例：data:image/jpeg;base64,<YOUR_BASE64_IMAGE>）

ステップ 4: 結果の取得と検証

API レスポンスを処理して生成結果を取得します。送信後、API はタスクのステータスと出力データを返します。提出直後に request_id が返されるため、GET エンドポイントでステータスを確認し、生成された動画を取得してください。動画編集は非同期のため、完了までこのエンドポイントを複数回ポーリングする必要がある場合があります。ダウンロードはお早めに。

テキストプロンプトと、任意で画像／動画ソースを含めて、モデル 'grok-imagine-video' への POST リクエストを送信します。するとタスク ID が返されるので、動画のステータスが 'done' になるまでこの ID をポーリングします。

自然言語のプロンプトと、アニメーション用の任意の画像 URL（または base64 画像）を受け付けます。編集の場合は、動画 URL を指定します。

このモデルは最大 15 秒までの動画生成と、最大 720p までの解像度をサポートしており、16:9 や 1:1 などのアスペクト比を設定できます。

はい、リクエスト内で画像 URL またはエンコードされた画像を使用して、プロンプトに基づいて静止画に動きを付けることができます。

はい。ソース動画の URL と編集指示を指定すると、出力は元の動画の長さと解像度を維持します。

生成された動画はコンテンツモデレーションの対象となります。問題のあるコンテンツとしてフラグが付けられた場合、生成中にフィルタリングまたはブロックされることがあります。

はい。API はリクエスト ID を返し、その ID をポーリングして動画のダウンロード準備ができたかどうかを確認します。

ダウンロードした動画は速やかに保存してください。一時 URL は期限切れになり、生成後にアクセスできなくなる可能性があります。

Pricing Overview

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Note: When generating video via API, you are charged per second. You will also be charged when using video or images as input.