OpenAI Batch API とは何ですか？

OpenAI Batch API は、大量の API リクエストを非同期で処理するサービスです。複数のリクエストを含む JSONL ファイルをアップロードすると、OpenAI がリアルタイム API 呼び出しと比較して 50% 割引で 24 時間以内に処理します。

Batch API はどのような JSONL フォーマットを必要としますか？

各行は3つのフィールドを持つ JSON オブジェクトである必要があります：custom_id（一意のリクエスト識別子）、method（常に POST）、url（/v1/chat/completions などの API エンドポイントパス）、body（API のフォーマットに一致するリクエストペイロード）。

Batch API のコストはどのくらいですか？

Batch API は、標準 API 価格と比較してすべてのサポートモデルで 50% の割引を提供します。例えば、gpt-4o-mini が通常100万入力トークンあたり $0.15 の場合、Batch API では100万トークンあたり $0.075 になります。

バッチの最大サイズは？

1つのバッチには最大 50,000 リクエストを含めることができます。入力 JSONL ファイルは最大 200MB まで可能です。より大きなワークロードの場合は、複数のバッチを作成してください。各組織は最大 100 の同時バッチを持つことができます。

バッチ処理にはどのくらい時間がかかりますか？

OpenAI は 24 時間以内の完了を保証していますが、ほとんどのバッチはそれよりはるかに速く、通常 1〜4 時間で完了します（リクエスト数と現在のシステム負荷に依存）。バッチステータスをポーリングして進捗を確認できます。

バッチレスポンスのエラーはどう処理しますか？

出力 JSONL ファイルには成功と失敗の両方のリクエストが含まれます。各行には response フィールド（成功の場合）または error フィールド（失敗の場合）があります。各行を解析し、error が null かどうかを確認して成功を判定します。失敗したリクエストにはデバッグ用のエラーコードとメッセージが含まれます。

OpenAI Batch API JSONL フォーマットガイド

OpenAI の Batch API 向けに JSONL ファイルを構造化し、コストを 50% 削減する方法を学ぶ

最終更新：2026年2月

OpenAI Batch API とは？

OpenAI Batch API は、大量の API リクエストを単一のバッチジョブとして送信できます。数千の個別 API 呼び出しを行う代わりに、すべてのリクエストを含む JSONL ファイルをアップロードし、OpenAI が 24 時間以内に非同期で処理します。

重要なメリットはコストです。バッチリクエストはリアルタイム API 呼び出しより 50% 安くなります。これにより、即座のレスポンスが不要なタスク（コンテンツ生成、データ分類、エンベディング計算、評価パイプラインなど）に Batch API は最適です。

JSONL リクエストフォーマット

バッチ入力 JSONL ファイルの各行は1つの API リクエストを表します。すべての行には3つの必須フィールドが含まれ、特定の構造に従います。

custom_id — 各リクエストの一意な識別子。リクエストとレスポンスの照合に使用されます。512文字以内の任意の文字列が使用できます。

method — HTTP メソッド。現在は POST のみサポートされています。

url — API エンドポイントパス。チャット補完の場合：/v1/chat/completions。エンベディングの場合：/v1/embeddings。

body — リクエストボディ。対応する API エンドポイントのリクエストボディと同じフォーマットです。

基本的なリクエスト構造

{"custom_id": "req-001", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "gpt-4o-mini", "messages": [{"role": "user", "content": "Hello"}]}}

Chat Completions バッチ

Batch API の最も一般的な用途は、複数のチャット補完リクエストの送信です。各行には model、messages、max_tokens や temperature などのオプションパラメータを含む完全なリクエストが含まれます。

単一リクエスト

各行には model、messages、オプションパラメータを含む完全なチャット補完リクエストが含まれます。

単一リクエスト

{"custom_id": "task-001", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "gpt-4o-mini", "messages": [{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Summarize the benefits of renewable energy."}], "max_tokens": 500}}

複数リクエスト JSONL ファイル

バッチファイルには通常、数百〜数千のリクエストが含まれます。以下は要約、分類、翻訳の3つの異なるタスクを含むファイルです。

複数リクエスト JSONL ファイル

{"custom_id": "summary-001", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "gpt-4o-mini", "messages": [{"role": "user", "content": "Summarize: Solar energy is a renewable source of power that harnesses sunlight using photovoltaic cells."}], "max_tokens": 200}}
{"custom_id": "classify-001", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "gpt-4o-mini", "messages": [{"role": "user", "content": "Classify this review as positive or negative: Great product, works perfectly!"}], "max_tokens": 50}}
{"custom_id": "translate-001", "method": "POST", "url": "/v1/chat/completions", "body": {"model": "gpt-4o-mini", "messages": [{"role": "user", "content": "Translate to French: Hello, how are you today?"}], "max_tokens": 100}}

Embeddings バッチ

Batch API はエンベディングリクエストもサポートしており、大規模なドキュメントコレクションの処理に便利です。エンベディングバッチは同じ JSONL 構造を使用しますが、/v1/embeddings エンドポイントを対象とします。

エンベディングリクエストは model と入力テキストを含む、よりシンプルなボディ構造を使用します。

Embeddings リクエストフォーマット

{"custom_id": "embed-001", "method": "POST", "url": "/v1/embeddings", "body": {"model": "text-embedding-3-small", "input": "JSONL is a text format for storing structured data."}}
{"custom_id": "embed-002", "method": "POST", "url": "/v1/embeddings", "body": {"model": "text-embedding-3-small", "input": "Each line contains one valid JSON object."}}
{"custom_id": "embed-003", "method": "POST", "url": "/v1/embeddings", "body": {"model": "text-embedding-3-small", "input": "JSONL files use the .jsonl extension."}}

レスポンスフォーマット

バッチジョブが完了すると、OpenAI は各リクエストに対するレスポンスを含む出力 JSONL ファイルを提供します。レスポンスには元の custom_id が含まれるため、レスポンスをリクエストと照合できます。

成功レスポンス

成功レスポンスには custom_id、レスポンスステータスコード、完全な API レスポンスボディが含まれます。

成功レスポンス

{"id": "batch_req_abc123", "custom_id": "task-001", "response": {"status_code": 200, "body": {"id": "chatcmpl-xyz", "object": "chat.completion", "choices": [{"index": 0, "message": {"role": "assistant", "content": "Renewable energy provides numerous benefits including reduced greenhouse gas emissions, lower long-term costs, and energy independence."}}]}}, "error": null}

エラーレスポンス

失敗したリクエストには、問題の原因を説明するコードとメッセージを含むエラーオブジェクトが含まれます。

エラーレスポンス

{"id": "batch_req_def456", "custom_id": "task-002", "response": null, "error": {"code": "invalid_request_error", "message": "The model 'gpt-5' does not exist."}}

完全な Batch API ワークフロー

以下は、JSONL ファイルの作成から結果のダウンロードと解析まで、Python SDK を使用した Batch API の完全な5ステップワークフローです。

11行に1リクエストの JSONL ファイルを作成
2Files API を使用して purpose を batch に設定してファイルをアップロード
3アップロードしたファイル ID を参照してバッチジョブを作成
4バッチステータスが completed、failed、または cancelled になるまでポーリング
5出力 JSONL ファイルをダウンロードして解析し、結果を抽出

Python — Batch API Workflow

from openai import OpenAI
import json
import time

client = OpenAI()

# Step 1: Create the JSONL batch file
prompts = [
    "Summarize the benefits of renewable energy.",
    "Classify this text as positive or negative: Great product!",
    "Translate to French: Hello, how are you?",
]

requests = [
    {
        "custom_id": f"req-{i}",
        "method": "POST",
        "url": "/v1/chat/completions",
        "body": {
            "model": "gpt-4o-mini",
            "messages": [{"role": "user", "content": prompt}],
            "max_tokens": 200,
        },
    }
    for i, prompt in enumerate(prompts)
]

with open("batch_input.jsonl", "w") as f:
    for req in requests:
        f.write(json.dumps(req) + "\n")

# Step 2: Upload the file
batch_file = client.files.create(
    file=open("batch_input.jsonl", "rb"),
    purpose="batch",
)

# Step 3: Create the batch
batch = client.batches.create(
    input_file_id=batch_file.id,
    endpoint="/v1/chat/completions",
    completion_window="24h",
)
print(f"Batch created: {batch.id}")

# Step 4: Poll for completion
while True:
    status = client.batches.retrieve(batch.id)
    print(f"Status: {status.status}")
    if status.status in ("completed", "failed", "cancelled"):
        break
    time.sleep(60)

# Step 5: Download results
if status.output_file_id:
    content = client.files.content(status.output_file_id)
    with open("batch_output.jsonl", "wb") as f:
        f.write(content.read())

Batch API と Real-time API の比較

Batch API と標準のリアルタイム API のどちらを使用すべきかを理解することで、コストとパフォーマンスの両方を最適化できます。

機能

Batch API

Real-time API

コスト

50% 割引

標準価格

レイテンシー

最大 24 時間

数秒

レート制限

より高い制限

標準制限

入力フォーマット

JSONL ファイルアップロード

個別の API 呼び出し

最適な用途

一括処理、評価、データ生成

対話型アプリ、リアルタイムチャット、ストリーミング

OpenAI ファインチューニング用の JSONL フォーマットの詳細については、 OpenAI JSONL フォーマットガイド.

バッチファイルを準備する

無料ツールを使用して、OpenAI に送信する前に JSONL バッチファイルの作成、検証、確認を行えます。

OpenAI JSONL format guide

JSONL splitter

JSONL validator

JSONL ファイルをオンラインで操作

最大 1GB の JSONL ファイルをブラウザで表示、検証、変換。アップロード不要、100% プライベート。

OpenAI Batch API JSONL フォーマットガイド

OpenAI Batch API とは？

JSONL リクエストフォーマット

Chat Completions バッチ

単一リクエスト

複数リクエスト JSONL ファイル

Embeddings バッチ

レスポンスフォーマット

成功レスポンス

エラーレスポンス

完全な Batch API ワークフロー

Batch API と Real-time API の比較

バッチファイルを準備する

JSONL ファイルをオンラインで操作

よくある質問

OpenAI Batch API とは何ですか？

Batch API はどのような JSONL フォーマットを必要としますか？

Batch API のコストはどのくらいですか？

バッチの最大サイズは？

バッチ処理にはどのくらい時間がかかりますか？

バッチレスポンスのエラーはどう処理しますか？