APIを使っていると「429 Too Many Requests」「rate limit」「上限に達しました」といった表示が出て、急に処理が止まることがあります。このとき原因になりやすいのが、レートリミットです。
レートリミットとは、一定時間内にAPIを使える量を制限する仕組みです。短時間に何度もリクエストを送ったり、長い入力文や出力文で大量のトークンを処理したりすると、API側の上限に達して一時的にエラーが返る場合があります。
本記事では、レートリミットの意味、429エラーとの関係、RPM・TPM・RPDなどの単位、料金上限や有料プランとの違い、実際に制限に引っかかったときの確認方法と対処法を、初心者にも分かるように整理します。
次のような人におすすめです。
- APIを使っていて429エラーや上限エラーが出た人
- レートリミット、RPM、TPM、RPDの違いを整理したい人
- 有料プランでもAPIが制限される理由を知りたい人
- Web版の利用上限とAPIのレートリミットを混同したくない人
- APIエラーの原因を感覚ではなく、順番に切り分けたい人
先に結論を言うと、レートリミットは「APIを使わせないための制限」ではなく、APIを安定して使うための上限です。大切なのは429が出たときに慌てて再実行を繰り返すのではなく、どの上限に達している可能性があるのかを確認することです。
レートリミットとは?API上限と429エラーの基本
レートリミットは一定時間内の利用量を制限する仕組み
レートリミットとは、一定時間内にAPIやWebサービスを使える量を制限する仕組みです。AI APIでは、短い時間に大量のリクエストを送ると、サービス側が一時的に処理を止めたり、エラーを返したりすることがあります。これは、特定のユーザーやアプリからのアクセスが急増すると、サービス全体の安定性に影響する可能性があるためです。
重要なのは、レートリミットは「使用を禁止する仕組み」ではなく、「一定時間内に使える量が決まっている仕組み」だという点です。水道の蛇口から一度に流せる水の量に上限があるように、APIにも短時間で処理できるリクエスト数やデータ量に上限が設けられています。
この上限は、サービスやモデル、利用プラン、アカウントの状態によって異なる場合があります。「レートリミットに達した」と感じたときは、まず使っているサービスの公式ドキュメントや管理画面で現在の上限を確認するのが基本的な対処です。
▸ Rate Limit — Basic Flow
💻
リクエスト送信
ユーザー・アプリが
APIを呼び出す
›
›
⛔
上限超過 → 一時停止
429 Too Many Requests
What
一定時間内の使用量を制限する仕組み。利用禁止ではなく、流量の上限が設けられている。
Why
特定ユーザーの急激なアクセス増加がサービス全体の安定性に影響しないよう整えるため。
When
上限に達すると429エラーが返ることがある。上限はサービス・モデル・プランで異なる。
429 Too Many Requestsは上限超過のサイン
レートリミットは、API上限や429エラーと深く関係しています。APIでは、一定時間内に送れるリクエスト数や処理できるデータ量に上限が設定されていることがあり、その上限を超えると429 Too Many Requestsのようなエラーが返る場合があります。
429は「短時間に多くのリクエストを送りすぎている」という意味のHTTPステータスコードです。IETFのRFC 6585でも、429は一定時間内に多すぎるリクエストを送った場合に使われるステータスコードとして定義されています。OpenAIの公式ヘルプでも、429エラーは組織のレート制限に達したときに発生し、1分あたりのリクエスト数やトークン数の上限が関係すると説明されています。
注意が必要なのは、429が出たからといって、サービス全体が停止しているわけではないという点です。自分のアカウント・プロジェクト・組織・モデル・無料枠など、いずれかに設定された上限に達している可能性があります。まず「サービス障害か」と考える前に、自分の利用量がAPI上限に達していないかを確認するのが先決です。
▸ HTTP Status — 429 Too Many Requests
「短時間に送りすぎ」を示すHTTPステータスコード
429 Too Many Requestsは、一定時間内に多くのリクエストを送った場合に返ることがあるステータスコードです。AI APIでは、リクエスト数やトークン量が上限に達したサインとして表示されることがあります。
IETF RFC 6585
OpenAI 公式ヘルプ
Gemini API ドキュメント
Meaning
短時間の使いすぎを示すことがある。必ずサービス全体の障害とは限らない。
Check
自分の利用量や上限を確認する。モデル・プロジェクト・組織単位の制限が関係する場合がある。
Next
429が出ているかを確認し、RPM・TPM・日次上限のどれに近いかを切り分ける。
429エラーが出たときに最初に確認すること
まず429か、401・400・5xxかを切り分ける
▸ Error Code — レートリミットか、別のエラーか
429
Too Many
Requests
短時間の
利用量超過
→ レートリミット系
401
Unauthorized
認証情報の
問題
→ APIキー確認
400
Bad Request
入力内容や
指定形式の問題
→ リクエスト確認
5xx
Server Error
サービス側の
問題の可能性
→ 公式情報確認
429はレートリミットに関係する代表的なサインです。ただし、401・400・5xxは原因が異なるため、まずステータスコードを確認してから対処を分けます。
▸ Check Steps — 429を確認するルート
1
画面に「429」または「Too Many Requests」が表示されているか
エラーメッセージにこの文字があれば、レートリミット系のエラーとして次の確認へ進みます。
確認
2
「エラーが発生しました」とだけ表示される場合
APIレスポンス、コンソール、管理画面のログを確認し、実際のステータスコードが429かどうかを見ます。
確認
3
429が確認できたら、どの上限に達しているか切り分ける
RPM・TPM・RPD・日次上限・無料枠・料金上限のどれに近いかを、公式ドキュメントや管理画面で確認します。
次へ
4
429以外のエラーコードが出ている場合
レートリミットとは原因が異なる可能性があります。401なら認証、400なら入力内容、5xxなら公式ステータスページや公式ヘルプを確認します。
別確認
▸ Decision — 429が確認できたか?
画面またはログに「429 Too Many Requests」が出ているか?
YES → レートリミット系
利用量と上限を確認する
RPM・TPM・日次上限・無料枠・料金上限のどれに近いかを確認します。短時間の上限超過であれば、少し時間を空けてから再実行します。
NO → 別エラーの可能性
別の原因を確認する
401・400・5xxなど、表示されているステータスコードに応じて原因を切り分けます。5xxの場合は、公式ステータスページや公式ヘルプも確認します。
レートリミットで困ったときは、いきなり料金プランやモデル変更を疑う前に、まず何が起きているのかを切り分けることが大切です。その起点になるのが、エラー内容に「429」または「Too Many Requests」が含まれているかどうかの確認です。
画面に「使えません」「エラーが発生しました」とだけ表示される場合は、可能であればAPIレスポンスやコンソール、管理画面のログを確認し、実際のステータスコードが429なのかを見るのが確実です。なぜなら、同じ「使えない」でも、401・400・5xxはレートリミットとは原因が異なるため、対処法も変わってくるからです。
429が確認できれば、次はRPM・TPM・日次上限など、どの上限に達している可能性があるのかを切り分けていきます。この順番で確認することで、「一時的な使いすぎ」なのか、「別の問題」なのかを早く判断しやすくなります。
RPM・TPM・RPDのどの上限に達したか確認する
429が確認できたら、次に「どの上限に達した可能性があるのか」を切り分けます。多くのAI APIでは、リクエスト回数・トークン量・日次利用量など、複数の上限が組み合わさってレートリミットが構成されています。「429が出た=リクエスト回数が多すぎる」とすぐに決めつけず、どの上限に近いかを確認することが大切です。
短時間に何度もAPIを呼び出している場合は、RPM(1分あたりのリクエスト数)の上限に達している可能性があります。一方、リクエスト回数が少なくても、長い文章の入力や長文の出力を繰り返している場合は、TPM(1分あたりのトークン量)の上限に近づいていることがあります。
さらに、短時間の使いすぎではなく1日の利用量そのものが上限に達している場合は、RPDのような日次上限が関係している可能性があります。この場合は少し待っても解消しないことがあるため、管理画面やドキュメントで日次上限の状況を確認するのが先決です。どの上限に該当するかが分かると、「回数を減らす」「入力・出力を短くする」「リセットを待つ」のどれが適切かを判断しやすくなります。
▸ Limit Types — 429に関係する主な上限の種類
1分あたりの
リクエスト数の上限
達しやすい状況
短時間に何度もAPIを呼び出している場合
1分あたりの
トークン量の上限
達しやすい状況
長い入力・出力を繰り返している場合
1日あたりの
リクエスト数の上限
達しやすい状況
1日を通して大量のリクエストを送った場合
▸ Diagnosis — 症状から上限の種類を判断する
症状
短時間に何度もAPIを呼び出している
›
RPM
超過の可能性
›
対処の方向
リクエストの間隔を空ける・回数を減らす
症状
回数は少ないが、長文の入力・出力を繰り返している
›
TPM
超過の可能性
›
対処の方向
入力・出力を短くする・分割して送る
症状
少し待っても解消しない・1日の使用量が多い
›
RPD
超過の可能性
›
対処の方向
日次上限のリセットまで待つ・管理画面で状況を確認する
⚠️
「少し待てばすぐ直る」とは限らない。RPM・TPMは短時間の制限のため、数分待つと再実行できる場合がある。一方、RPDのような日次上限に達している場合は、その日のリセット時刻まで解消しないことがある。どの上限に達しているかを確認することが、無駄な待機を避けるためにも重要。
無料枠・料金上限・日次上限を混同しない
▸ Limit Types — 混同しやすい4つの上限
⚡ レートリミット
短時間の利用量を制限する仕組み
1分あたりのリクエスト数(RPM)やトークン量(TPM)などに上限がある。超えると一時的に429が返ることがある。
確認先
公式ドキュメント・管理画面のUsage
📅 日次上限
1日あたりの利用量の上限
RPD(1日あたりのリクエスト数)やTPDなど。短時間の使いすぎではなく、1日を通した累積量が関係する。
確認先
管理画面のUsage・ティア別上限
🎁 無料枠の上限
無料で使える範囲の上限
無料プランや試用枠に設定された利用量の上限。使い切るとAPIが使えなくなる場合があり、レートリミットとは別の原因になる。
確認先
管理画面のBilling・プラン設定
💳 料金上限
使える金額・支出の上限
設定した支出上限や請求上限に達した場合、短時間の使いすぎとは関係なくAPIが止まることがある。
確認先
管理画面のBilling・支出上限設定
▸ Diagnosis — 状況から原因を切り分ける
状況
短時間に大量のリクエストを送った直後に429が出た
›
レートリミット
超過の可能性
›
確認・対処
少し時間を空けて再実行。RPM・TPMを管理画面で確認
状況
少し待っても解消しない。1日の使用量が多い
›
日次上限
超過の可能性
›
確認・対処
管理画面でRPD・TPDを確認。リセット時刻まで待つ
状況
無料プランや試用枠を長期間使っている
›
無料枠
上限の可能性
›
確認・対処
Billing画面で残量を確認。プラン変更・課金設定を検討
状況
支出上限を設定している・請求情報に問題がある
›
料金上限
到達の可能性
›
確認・対処
Billing画面で支出上限・請求設定・残高を確認
⚠️
「上限に達した」という表示だけでは、原因を特定できない。同じ「APIが使えない」状態でも、原因がレートリミット・日次上限・無料枠・料金上限のどれかによって、確認する場所も対処法も変わる。まず管理画面で状況を確認することが、無駄な再実行や設定変更を避けるための基本ルート。
429エラーや利用制限が出たとき、レートリミット・日次上限・無料枠の上限・料金上限を混同していないかも確認しておきます。これらはいずれも「APIが使えなくなる原因」になりえますが、仕組みも確認場所も対処法も異なります。
レートリミットは短時間の利用量に関する制限で、少し待つと解消する場合があります。一方、無料枠を使い切った場合や支出上限に達した場合は、時間を空けても解消しません。管理画面のBillingセクションで残量や請求設定を確認する必要があります。
特に注意が必要なのは、「上限に達した」という表示だけでは原因を特定できない点です。同じ「APIが使えない」状態でも、原因によって確認すべき場所が変わります。まず図表を参考に4種類の上限を頭に入れたうえで、管理画面・エラーメッセージ・ドキュメントを順番に確認するのが、無駄な手間を避けるための基本的な進め方です。
RPM・TPM・RPDとは?レートリミットの主な単位
RPMは1分あたりのリクエスト数
▸ Unit — RPM とは
1分あたりに送れるリクエスト数の上限
APIに対して1分間に何回までリクエストを送れるかを表す単位。1回あたりの内容の長さではなく、送った「回数」がカウントされる。短時間に何度も呼び出すと、入力が短くても上限に近づく場合がある。
RPMが関係する
リクエスト回数が多い場合
短い入力でも、何度も連続で送るとRPMの上限に近づく可能性がある。並列実行や自動リトライも回数の増加につながる。
RPMでは判断しにくい
1回あたりの情報量が多い場合
長文の入力・出力を繰り返す場合は、回数よりトークン量(TPM)が先に上限に近づく場合がある。
▸ Check — RPMが原因の可能性があるとき
?
同じ処理を短時間に何度も繰り返していないか
ループ処理やバッチ処理でAPIを連続呼び出ししている場合、RPMの上限に近づきやすい
?
並列実行が多すぎないか
複数の処理を同時に走らせると、1分間のリクエスト数が急増する場合がある
?
ツールやアプリが自動で再試行を繰り返していないか
エラー時の自動リトライが短時間に集中すると、RPMをさらに超過しやすくなることがある
RPMで重要なのは、「送った内容の長さ」ではなく「送った回数」がカウントされるという点です。入力文が短くても、短時間に何度もAPIを呼び出せばRPMの上限に近づく可能性があります。逆に1回あたりの入力が長くても、送る頻度が低ければRPMには影響しにくいです。
特に注意が必要なのは、ツールやアプリが自動でリトライを繰り返しているケースです。エラーが出るたびに自動で再送信が走ると、短時間のリクエスト数がさらに増えて上限を超えやすくなることがあります。RPMが原因で制限にかかっている場合は、処理の間隔を広げるか、並列実行の数を減らすのが基本的な対処です。
RPMは「ゲートを1分間に何回通ったか」を見る指標です。1回あたりの情報量を見るTPMとは役割が異なるため、どちらの上限に近いかを切り分けてから対処することが大切です。
TPMは1分あたりのトークン数
▸ Unit — TPM とは
1分あたりに処理できるトークン数の上限
リクエストの回数ではなく、入力と出力を合わせた情報量(トークン数)がカウントされる。回数が少なくても、1回あたりの内容が長ければTPMの上限に近づく場合がある。
▸ 1リクエストのトークン構成
入力トークン
プロンプト
文脈
システム設定
添付テキスト
入力 + 出力 = 合計トークン数としてTPMにカウントされる場合がある。サービスによって計算方法が異なるため、公式ドキュメントで確認するのが安全。
RPM
ゲートを通った回数
「1分間に何台の車が通ったか」
短時間の呼び出し回数が多い場合に上限に近づく。1回あたりの内容の長さは関係しない。
TPM
ゲートを通った荷物の総量
「1分間に運んだ荷物の合計重量」
1回あたりの入力・出力が長い場合に上限に近づく。回数が少なくても処理量が多ければ達する場合がある。
▸ Check — TPMが原因の可能性があるとき
長い記事・議事録・ログをそのまま送っている
大量のテキストを1回で送ると、回数が少なくてもTPMに達しやすい
長文の出力を何度も生成している
出力が長いリクエストは、入力が短くても合計トークン数が増えやすい
システムプロンプトや文脈が長いまま毎回送っている
毎回長い設定文を含めると、1リクエストあたりの入力トークンが増える
「1回しか送っていない」のに429が出た
回数ではなく処理量が原因の可能性がある。TPMを確認するのが先決
▸ Actions — TPM超過への対処
✂️
入力文を短くする
不要な文脈・繰り返し・余分な説明を削る
📏
出力の長さを制限する
max_tokensなどで出力量に上限を設ける
🔀
処理を分割して送る
長いテキストを複数回に分けてリクエストする
🕐
間隔を空けて再実行する
TPMは1分単位のリセットのため、少し待つと解消する場合がある
TPMで特に混同しやすいのは、「1回しか送っていないからレートリミットではない」と判断してしまうケースです。AI APIでは、リクエストの回数だけでなく、入力と出力を合わせた処理量も制限の対象になる場合があります。長文の記事や大量のログをそのまま送った場合、1回のリクエストでもTPMの上限に達することがあります。
TPMが原因の場合、対処の方向はRPMとは異なります。入力文を短くする・不要な文脈を削る・出力量を制限する・処理を分割するといった調整が基本です。システムプロンプトや文脈として毎回長い設定文を含めている場合も、1リクエストあたりのトークン数が増えやすいため、見直しの対象になります。
RPMが「何回通ったか」を見るのに対し、TPMは「何を運んだか」の総量を見る指標です。429が出たとき、回数を減らしても解消しない場合は、TPMの観点から処理量を見直すのが次のステップです。
RPD・TPD・同時実行数が関係する場合もある
▸ Rate Limit Units — 主な上限単位の一覧
1分あたりの
リクエスト数
回数が多いと達しやすい。短時間の連続呼び出しに注意
1分あたりの
トークン処理量
入力・出力の情報量が多いと達しやすい
1日あたりの
リクエスト数
1日を通じた累積回数が上限に達すると翌日まで解消しない場合がある
1日あたりの
トークン処理量
1日を通じた累積トークン量が対象。大量処理を続けると達しやすい
同時に処理できる
リクエスト数
並列処理・バッチ処理で一度に走らせる数が多いと上限に触れる場合がある
▸ Time Scope — 上限が適用される時間軸
1分
単位
RPM
TPM
少し待つと解消する場合がある。数十秒〜数分で再実行できるケースが多い
1日
単位
RPD
TPD
翌日のリセットまで解消しない場合がある。管理画面でリセット時刻を確認する
並列
単位
同時実行数
一度に走らせる処理数が上限を超えると失敗する場合がある。並列数を減らすのが基本対処
▸ Caution — 分単位と日次上限の違い
▸ RPM / TPM(分単位)
少し待つと解消する場合がある
短時間の制限のため、数分後に再実行できることが多い。自動リトライの間隔を広げるのが基本。
▸ RPD / TPD(日次)
翌日まで解消しない場合がある
1日の累積量が上限に達した場合、リセット時刻まで待つ必要がある場合がある。管理画面で確認を。
⚙️
同時実行数(Concurrent Requests)について
バッチ処理や自動化ツールでは、1回ごとの内容が軽くても一度に並列で走らせる数が多すぎると制限に触れる場合がある。RPMやTPMに余裕があっても、同時実行数の上限に達して失敗するケースもあるため、並列数を調整するのが対処の基本ルートになる。設定できる上限値はサービスやティアによって異なるため、公式ドキュメントで確認するのが安全。
RPMやTPMは1分単位の上限ですが、APIによってはRPD・TPDのような日次上限や、同時実行数の制限が設けられている場合もあります。「少し待ったのに解消しない」という状況は、分単位ではなく日次上限に達している可能性があります。この場合、時間を空けて再実行しても改善しないため、管理画面でリセット時刻や累積使用量を確認するのが先決です。
特に注意が必要なのは、RPMやTPMに余裕があっても、日次上限や同時実行数の制限で失敗するケースです。バッチ処理や自動化ツールで複数の処理を並列で走らせている場合、1回ごとの内容が軽くても同時実行数の上限に触れることがあります。上限の種類を一つひとつ確認する習慣が、原因の早期特定につながります。
RPMとTPMが「短時間の混雑メーター」だとすれば、RPDとTPDはその日全体の累積メーターです。継続的にAPIを使う場合や、1日に大量の処理をまとめて実行する場合は、短時間の上限だけでなく日次上限もあわせて把握しておくと判断しやすくなります。
レートリミットに達すると何が起きる?
リクエストが一時的に失敗することがある
▸ Status — レートリミットの3段階
Normal
上限内
リクエストは正常に処理される
200 OK
Warning
上限に近い
処理はされるが、上限に近づいている状態。使いすぎに注意が必要
処理中・要確認
Limited
上限超過
リクエストが一時的に受け付けられなくなる場合がある
429 Too Many Requests
▸ Error Message — 429に含まれることがある表現
rate limit
too many requests
quota exceeded
limit exceeded
rate_limit_error
サービスによって表現は異なる。「使えません」とだけ表示される場合は、APIレスポンスやコンソールで実際のステータスコードを確認するのが確実。
▸ Causes — リクエスト失敗の原因を切り分ける
レートリミット超過
時間を空けて再実行。RPM・TPM・日次上限のどれかを管理画面で確認する
401 / 403
Unauthorized / Forbidden
認証・権限の問題
APIキーや権限設定を確認する。レートリミットとは別の原因
入力内容の問題
パラメータや入力形式を確認する。リクエストの内容自体に問題がある場合
サービス側の問題
公式ステータスページで障害情報を確認する。自分の利用量とは無関係の場合が多い
短時間で解消する場合
RPM・TPMの超過
分単位の上限のため、数分待つと再実行できる場合がある。間隔を空けて再試行するのが基本ルート。
すぐに解消しない場合
日次上限・ティア上限の超過
リセット時刻まで待つ必要がある場合がある。管理画面でリセット時刻や累積使用量を確認する。
レートリミットに達すると、APIへのリクエストが一時的に正常処理されなくなることがあります。これはAPIが完全に使えなくなったわけではなく、一定時間内の処理量が上限を超えたため、サービス側がリクエストの受付を制限している状態です。
重要なのは、リクエストが失敗したからといって、入力内容や認証情報に問題があるとは限らないという点です。429が返っている場合は、単に短時間の利用量が上限を超えている可能性があります。原因を誤って判断すると、不要なAPIキーの再発行や設定変更につながることもあるため、まずエラーコードを確認して原因を切り分けることが大切です。
また、429が出ても必ずしも長時間続くとは限りません。RPMやTPMの超過であれば数分待つと解消する場合がありますが、日次上限や利用ティアの上限に達している場合はすぐには解消しないこともあります。「待てば直る」と判断する前に、どの上限に達しているかを確認するのが、無駄な待機を避けるための基本的な進め方です。
短時間の上限なら待つと再実行できる場合がある
▸ Retry Flow — 429が出たときの再実行ルート
すぐに再送しない重要
エラー直後に連続して再試行すると、リクエスト回数がさらに増えて制限が続きやすくなる場合がある
Retry-After の有無を確認する
エラーレスポンスにRetry-Afterなどの待機時間が含まれている場合は、その時間を参考にする
間隔を空けて再実行する基本ルート
RPM・TPMが原因の場合、数分待つと再び処理できる場合がある。日次上限の場合はリセット時刻まで待つ
自動リトライの設定を確認する見落とし注意
ツールやアプリが裏で自動リトライを繰り返していると、実際のリクエスト数が操作回数より多くなっている場合がある
❌ 避けたい行動
✗
エラー直後に何度も再送する
回数がさらに増えて制限が続きやすくなる
✗
間隔ゼロで自動リトライを繰り返す
429をトリガーにした連続リトライは逆効果になる場合がある
✗
原因を確認せずにただ待つ
日次上限なら数分待っても解消しない
✓ 基本の進め方
✓
まずエラー内容を確認する
どの上限に達しているかを切り分ける
✓
間隔を空けてから再実行する
RPM・TPM超過なら数分待つのが基本ルート
✓
自動リトライの間隔・回数を確認する
ツール側の設定が過剰になっていないか見直す
▸ Retry-After — 待機時間の情報を確認する
▸ 待機時間が含まれている場合
Retry-After ヘッダーを参考にする
エラーレスポンスにRetry-Afterや待機秒数が含まれている場合は、その時間を目安に再実行する
▸ 待機時間が表示されていない場合
少し間隔を空けてから再実行する
明確な時間が示されていない場合も、数十秒〜数分程度の間隔を空けてから試すのが基本的な対処
⚠️
自動化ツールやアプリの「見えないリトライ」に注意。自分では1回しか操作していないつもりでも、ツールが裏で何度も再試行していると、実際のAPIリクエスト数は操作回数より多くなっている可能性がある。リトライ間隔・最大回数・バックオフ設定などを確認するのが安全。
レートリミットに達しても、少し時間を空けると再実行できる場合があります。RPMやTPMのような分単位の上限であれば、時間枠がリセットされることで再びリクエストを送れるようになることがあります。ただし、すぐに解消するかどうかは、どの上限に達しているかによって変わります。
注意が必要なのは、エラー直後に何度も再送を繰り返すことで、かえって制限が続きやすくなる場合がある点です。エラーレスポンスに「Retry-After」などの待機時間が含まれている場合はその時間を参考にし、含まれていない場合も数十秒〜数分の間隔を空けてから再試行するのが基本的な進め方です。
自動化ツールやアプリを使っている場合は、ツールが裏で自動リトライを繰り返している可能性があります。自分では1回しか操作していないつもりでも、実際のリクエスト数が多くなっているケースがあるため、リトライの間隔や回数の設定も確認しておくと安心です。
日次上限や利用ティア上限ではすぐに解消しない場合がある
▸ Reset Speed — 上限の種類ごとの解消速度
1分あたりの上限に達した場合。数分待つと再実行できる場合がある。時間枠のリセットで解消することが多い
当日中は解消しない場合
RPD・TPD
(日次上限)
1日の累積量が上限に達した場合。翌日のリセット時刻まで解消しないことがある
待つだけでは解消しない
ティア上限・
無料枠・料金上限
利用ティア・無料枠・請求上限に達した場合。管理画面で設定・プラン・Billingを確認する必要がある
▸ Decision — 「待っても直らない」ときの判断
数分待っても同じ429エラーが続いている
→ 日次上限の可能性
管理画面でRPD・TPDの使用量を確認。その日のリセット時刻まで待つのが基本ルート。
→ ティア・枠・Billingの可能性
利用ティア・無料枠残量・請求設定・支出上限を管理画面で確認する。待つだけでは解消しない。
▸ Check — 待っても解消しないときに確認する項目
📊
使用量・上限の確認
管理画面のUsageで日次の累積使用量と上限を確認する
💳
請求・支出上限の確認
Billing画面で請求設定・残高・支出上限に問題がないかを確認する
🏷️
利用ティアの確認
現在のティアで設定されている上限値と、上限引き上げの可否を確認する
🎁
無料枠残量の確認
無料枠や試用枠を使い切っていないかをプラン設定画面で確認する
レートリミットに達したとき、「待てば直る」とは限りません。RPMやTPMのような分単位の上限であれば、数分待つと再実行できる場合がありますが、日次上限や利用ティアの上限に達している場合は、翌日のリセット時刻まで解消しないことがあります。
特に注意したいのは、「待っても直らない=サービス側の不具合」とすぐに判断しないことです。短時間のレートリミットではなく、日次上限・無料枠・利用ティア・請求上限に達しているだけのケースも多くあります。まず管理画面で使用量・Billing・ティア設定を確認するのが先決です。
何度待っても同じエラーが続く場合は、エラーメッセージだけでなく管理画面を確認するのが基本ルートです。短時間の混雑なのか、日次上限なのか、プランや請求設定の問題なのかを切り分けることで、次に取るべき行動が判断しやすくなります。
レートリミットと料金上限・有料プランの違い
レートリミットは短時間の利用量の上限
▸ Two Meters — レートリミットと料金上限は別の指標
⚡
Rate Limit
レートリミット
短時間の利用量を制限する仕組み。料金残高に関係なく、一定時間内に使いすぎると一時的に制限される。
1分あたりのリクエスト数(RPM)
1分あたりのトークン量(TPM)
1日あたりの利用量(RPD・TPD)
同時実行数
💳
Billing Limit
料金上限
使える金額・費用を制限する仕組み。設定した支出上限や無料枠に達すると、利用量に関係なく止まる場合がある。
月間の支出上限設定
無料枠の残量
クレジット残高
請求設定・支払い情報
▸ Common Mistakes — 混同しやすいシナリオ
▸ シナリオ A
料金残高があるのに429が出た
料金枠が残っていても、短時間のリクエスト数やトークン量が上限に達すればレートリミットが発動する場合がある。料金の問題ではない。
▸ シナリオ B
リクエスト数は少ないのに使えない
レートリミットに余裕があっても、無料枠の使い切り・支出上限・請求設定の問題でAPIが止まる場合がある。Billingを確認する。
▸ シナリオ C
有料プランにしたのに制限された
有料プランでもレートリミットはゼロにはならない。ティアによって上限は変わるが、一定の制限は設けられている場合がある。
▸ シナリオ D
支払いを増やしたら上限も増えると思った
料金上限の引き上げとレートリミットの引き上げは別の設定になる場合がある。ティアや上限引き上げ申請を確認するのが安全。
▸ Where to Check — 原因別の確認先
⚡ レートリミットが原因の場合
公式ドキュメントのRate Limits
管理画面のUsage・上限値
リクエスト間隔・並列数の見直し
入力・出力の長さの調整
💳 料金上限が原因の場合
管理画面のBilling・支出上限
無料枠・クレジット残量の確認
請求設定・支払い情報の確認
プラン変更・上限引き上げの検討
レートリミットと料金上限は、どちらも「上限」という言葉で表現されますが、仕組みも確認先も対処法も異なります。この2つを混同すると、エラーが出たときに原因を誤って判断しやすくなります。
レートリミットは「短時間にどれだけ使ったか」を見る制限です。料金残高があっても、支払い設定に問題がなくても、短時間のリクエスト数やトークン量が上限に達すれば一時的に制限される場合があります。逆に、リクエスト数が少なくても無料枠や支出上限に達していればAPIが止まることもあります。つまり、2つの上限は独立して機能している場合があります。
エラーが出たときは、まず「料金の問題か」「短時間の使いすぎか」を切り分けることが大切です。レートリミットが原因であれば使用量やリクエスト間隔を見直し、料金上限が原因であれば管理画面のBillingや請求設定を確認するのが基本的な進め方です。
料金上限は使える金額や無料枠の上限
▸ Billing Limit — 料金上限に関係する要素
📅
月間支出上限
設定した月あたりの支出上限に達するとAPIが止まる場合がある。Billing画面で確認・変更できることが多い
🎁
無料枠・試用クレジット
無料枠や試用クレジットを使い切った場合、課金設定がないとAPIが使えなくなる場合がある
💰
クレジット残高
購入済みクレジットや付与されたクレジットの残量が不足している場合に影響することがある
🏦
請求設定・支払い情報
カード情報の期限切れや請求設定の問題で利用が停止される場合がある
▸ Behavior — 超過したときの動作の違い
▸ Check — 料金上限が原因の可能性があるときの確認順
1
現在の利用額・残高を確認する
今月の利用額、クレジット残高、無料枠の残量が上限に達していないかを確認する
Billing
2
支出上限の設定を確認する
月間の支出上限が低く設定されていないか、設定値が現在の利用量に合っているかを確認する
Limits
3
請求設定・支払い情報を確認する
カード情報の期限切れや請求エラーが原因でAPIが止まっていないかを確認する
Billing
4
プラン・ティアの上限を確認する
現在のプランやティアで設定されている上限を確認し、上限引き上げの可否を調べる
Quota
⚠️
「429が出た=料金上限」とは限らない。429はレートリミット超過でも出ることがある。料金上限に達している場合は、エラーの種類や管理画面の表示が異なることがある。エラーメッセージと合わせて、Billing・Usage・Limitsをあわせて確認するのが確実。
料金上限は、APIで使える金額を管理するための仕組みです。月間の支出上限・無料枠の残量・クレジット残高・請求設定などが関係する場合があります。レートリミットとは異なり、時間を空けても解消しないため、管理画面のBillingやLimitsを確認するのが基本的な対処になります。
混同しやすいのは、「429エラーが出た=料金上限に達した」と判断してしまうケースです。429はレートリミット超過でも発生する場合があり、料金上限に達している場合は別のエラーや通知が表示されることもあります。まずエラーの内容と管理画面の両方を確認することで、どちらが原因かを切り分けやすくなります。
料金上限が原因の場合は、現在の利用額・残高・支出上限の設定・請求情報を順番に確認するのが確実です。サービスによって確認できる画面の名称が異なる場合があるため、Billing・Usage・Limits・Quotaといったメニューを探すのが基本ルートです。
有料プランでもAPIが無制限になるとは限らない
有料プランを使っていても、レートリミットが完全になくなるとは限りません。多くのAPIサービスでは、有料プランになると利用できる上限が引き上がる場合がありますが、それは「無制限に使える」という意味ではありません。モデル・利用ティア・プロジェクト・組織ごとに上限が設定されている場合があります。
特に混同しやすいのが、「Web版の有料プランに加入しているからAPIも自由に使えるはず」という認識です。サービスによっては、Web版(画面上で使うチャット機能など)とAPI利用で、料金体系や上限の考え方が分かれている場合があります。Web版を有料で使えていても、API側では別の支払い設定や利用ティアの確認が必要なケースがあります。
「有料なのに使えない」と感じたときは、まず現在のプラン・API側の利用ティア・モデル別の上限・請求設定・管理画面の使用量を順番に確認するのが基本的な進め方です。有料プランは利用できる範囲を広げる選択肢ですが、レートリミットそのものをなくすものではないため、自分の利用量がどの上限に近いかを把握しておくことが大切です。
▸ Myth vs Reality — 有料プランについてよくある誤解
❌ よくある誤解
有料プランなら
レートリミットはなくなる
有料プランに加入すれば、APIを無制限に使えると思いがちだが、実際には上限が残っている場合がある
✓ 実態
有料プランは上限を
引き上げる選択肢のひとつ
有料プランや上位ティアに移行すると上限が緩和される場合があるが、上限そのものはモデル・ティア・組織ごとに設定されている
▸ Still Applies — 有料プランでも設定されている上限の例
⚡
RPM・TPM(短時間の利用量)
有料プランでも1分あたりのリクエスト数・トークン量に上限が設定されている場合がある
有料でも
適用
🤖
モデル別の上限
同じプランでもモデルによって上限が異なる場合がある。高性能モデルは上限が低めに設定されていることもある
モデルで
変わる
🏷️
利用ティアによる上限
有料プランの中でも利用実績・支払い額・ティアによって上限値が段階的に設定されている場合がある
ティアで
変わる
📁
プロジェクト・組織単位の上限
プロジェクトやチームごとに個別の上限が設定されている場合がある
単位で
変わる
▸ Web vs API — 料金体系・上限が分かれている場合がある
🖥 Web版(画面上のサービス)
月額プランで使う画面機能
ChatGPT・Gemini・Grokなどの画面
月額プランで利用量の上限が変わる
API利用とは別の仕組みで管理される場合がある
⚙️ API版(開発者向け)
APIキーでリクエストを送る
APIキー・課金設定・ティアを別途確認
利用量・上限はAPI管理画面で確認
Web版プランとは独立して管理される場合がある
Web版の有料プランとAPI利用は、料金体系や上限の管理が分かれている場合がある。Web版を有料で使えていても、API側では別の支払い設定・ティア・上限を確認する必要があるケースがある。
▸ Check — 「有料なのに使えない」ときの確認項目
🏷️
API側の利用ティアを確認
Web版プランとは別に、API側のティアと上限を管理画面で確認する
🤖
使用中モデルの上限を確認
モデルごとにRPM・TPMが異なる場合があるため、使用モデルのドキュメントを確認する
💳
API側の課金・請求設定を確認
API利用の支払い設定・残高・支出上限をBilling画面で確認する
📊
現在の使用量を確認
管理画面のUsageで、RPM・TPM・日次上限のどれに近いかを確認する
Web版の利用上限とAPIのレートリミットの違い
ChatGPTやGrokの画面上の上限とは別に考える
▸ Two Lanes — Web版とAPI版は別のレーンで動いている
🖥️
Web / App
Web版・アプリ版
ChatGPT・Grok・Geminiなどの画面上で使う機能
上限に達すると画面上にメッセージが表示されることがある
⚙️
API
API版(開発者向け)
RPM・TPM・日次上限などのレートリミットが設定されている
▸ Signal — エラー表示の出どころを判断する
▸ 表示内容
「一定時間後に再度お試しください」「上限に達しました」と画面に表示される
›
Web版の制限の可能性
アプリ・サービス設定を確認する。API側のレートリミットとは別の原因の場合がある
▸ 表示内容
APIレスポンスに「429 Too Many Requests」「rate limit」が返ってくる
›
API側のレートリミットの可能性
API管理画面・ドキュメントでRPM・TPM・上限を確認する
▸ Where to Check — 使っている環境で確認先を分ける
今、どちらを使っているか?
🖥 Web版・アプリ版を使っている
アプリや画面上の案内を確認する
月額プランの利用上限・残量を確認する
サービス設定画面でプラン内容を確認する
時間を空けて再試行するのが基本ルート
⚙️ APIを使っている
APIレスポンスのステータスコードを確認する
公式ドキュメントのRate Limitsを確認する
API管理画面のUsage・上限を確認する
ティア・モデル・Billingもあわせて確認する
⚠️
Web版で使えるからといって、APIでも同じ条件で使えるとは限らない。同じサービス名・モデル名が使われていても、Web版とAPIでは料金体系・上限の管理・確認場所が分かれている場合がある。まず「自分はWeb版を使っているのか、APIを使っているのか」を確認するのが、エラー切り分けの起点になる。
ChatGPTやGrokなどのAIサービスでは、画面上で使うWeb版の利用上限と、APIのレートリミットは別の仕組みで管理されている場合があります。同じサービス名やモデル名が登場するため混同しやすいですが、利用する場所・料金体系・確認方法がそれぞれ異なります。
画面上に「一定時間後に再度お試しください」と表示される場合はWeb版の制限の可能性があり、APIレスポンスに429が返る場合はAPI側のレートリミットに達している可能性があります。Web版で使えているからといって、APIでも同じ条件で使えるとは限りません。逆に、APIの上限に達していても、Web版の利用枠には影響しないケースもあります。
上限やエラーを確認するときは、まず「自分はWeb版を使っているのか、APIを使っているのか」を切り分けることが起点になります。Web版ならアプリや設定画面を、APIなら管理画面や公式ドキュメントのレートリミットセクションを確認するのが基本的な進め方です。
APIはモデル・プロジェクト・組織単位で制限される場合がある
▸ Limit Scope — 上限が設定される単位の例
モデルごとに上限が異なる場合がある
同じAPIでも、軽量モデルと高性能モデルで上限や料金の考え方が分かれている場合があります。モデル変更で上限が変わるケースもあります。
プロジェクト単位で上限が共有される場合がある
どのプロジェクトから呼び出しているかによって、確認すべき上限が変わる場合があります。APIキー単位だけで判断しないことが大切です。
組織全体・チーム全体の累積量が影響する場合がある
同じ組織内の別処理が動いていると、自分の操作が少なくても組織全体の上限に近づいている場合があります。
利用ティアによって上限が変わる場合がある
利用実績や支払い設定によってティアが変わり、上限が緩和される場合があります。現在のティアは管理画面で確認します。
▸ Shared Quota — 上限は「自分1人の使用量」だけで決まらない場合がある
👤 個人での利用
自分の使用量が直接反映される
個人アカウントでAPIを使っている場合、自分のリクエスト数・トークン量が上限の基準になることがあります。
🏢 チーム・組織での利用
組織全体の累積量が上限に影響する場合がある
同じプロジェクト・組織内で複数の処理が並行して動いている場合、自分の操作が少なくても上限に近づくことがあります。
▸ Check — 制限の単位を確認するときの順番
1
使用中のモデルを確認する
公式ドキュメントでモデルごとのRPM・TPM・日次上限を確認します。モデルによって上限が大きく異なる場合があります。
2
プロジェクトの割り当てを確認する
どのプロジェクトから呼び出しているかを確認し、そのプロジェクトに設定された上限を管理画面で見ます。APIキー単位だけで判断しないことが大切です。
3
組織・チーム全体の使用量を確認する
チームや組織で使っている場合は、自分の操作だけでなく組織全体の累積使用量も確認できると原因を特定しやすくなります。
4
現在の利用ティアを確認する
管理画面でティアと上限引き上げの可否を確認します。ティアを上げることで上限が緩和される場合があります。
⚠️
「自分は1回しか送っていない」でも上限に達することがあります。同じプロジェクトや組織内で別の処理が動いていれば、全体の利用量として上限に近づいている場合があります。原因を切り分けるには、自分の操作回数だけでなく、モデル・プロジェクト・組織・ティア単位での使用量を管理画面で確認するのが確実です。
APIのレートリミットは、必ずしも「1人のユーザーが何回使ったか」だけで判断されるとは限りません。サービスによっては、モデル・プロジェクト・組織・利用ティアなどの単位で上限が設定されている場合があります。同じAPIを使っていても、どのモデルを使うか、どのプロジェクトから呼び出すかによって、確認すべき上限が変わることがあります。
チームや組織でAPIを運用している場合は特に注意が必要です。自分の操作が少なくても、同じプロジェクト・組織内で別の処理が並行して動いていれば、全体の累積量として上限に近づいていることがあります。「自分は1回しか送っていないのに429が出た」という状況は、このパターンが原因の可能性があります。
原因を正確に切り分けるには、「自分が何回使ったか」だけでなく、対象モデル・プロジェクト・組織・ティアごとの使用量を管理画面で確認するのが基本的な進め方です。ティアを上げることで上限が緩和される場合もあるため、現在のティアと上限引き上げの可否もあわせて確認しておくと判断しやすくなります。
APIキーを増やしても回避できるとは限らない
▸ Myth vs Reality — APIキーを増やせば解決するという誤解
❌ よくある誤解
APIキーを増やせば
レートリミットを回避できる
別のAPIキーを用意すれば上限が倍になると思いがちだが、上限はAPIキー単位だけで管理されているとは限らない
✓ 実態
上限はプロジェクト・組織単位で
共有されている場合がある
同じプロジェクトや組織に紐づくAPIキーを増やしても、利用枠が共有されている場合は上限は変わらないことがある
▸ Structure — 上限が管理される構造の例
🏢 組織・アカウント全体の上限(例)
📁 プロジェクトの利用枠
APIキー A
APIキー B
APIキー C
APIキーを増やしても、プロジェクト・組織の利用枠が共有されている場合、合計の上限は変わらない。キーを分けることでアクセス管理はできるが、レートリミットの上限が増えるとは限らない。
▸ Right Actions — APIキーを増やす前にやること
1
上限がどの単位で管理されているか確認する
APIキー単位か、プロジェクト単位か、組織単位かを公式ドキュメントや管理画面で確認する
最初に
2
リクエスト間隔・並列数・処理量を調整する
間隔を空ける・並列実行を減らす・入力や出力を短くすることで上限に達しにくくなる場合がある
基本対処
3
利用ティアの引き上げ・上限申請を確認する
上限が足りない場合はティアの引き上げや上限申請の可否を管理画面で確認する。利用実績に応じて変わる場合がある
上限拡張
⚠️
レートリミットを避ける目的でAPIキーやアカウントを増やす使い方は、サービスの利用規約に反する可能性がある。APIキーはAPIを利用するための認証情報であり、上限を増やすための手段ではない。制限に達したときは、まずどの単位で上限が管理されているかを確認し、利用量の調整やティア引き上げを検討するのが安全な進め方。
レートリミットに達したとき、「APIキーを増やせば回避できる」と考えることがありますが、必ずしもそうとは限りません。サービスによっては、上限がプロジェクト・組織・アカウント単位で管理されており、同じ枠に紐づくAPIキーを増やしても利用上限は変わらない場合があります。
また、レートリミットを避ける目的でAPIキーやアカウントを増やす使い方は、サービスの利用規約に反する可能性があります。APIキーはAPIを利用するための認証情報であり、上限を自由に増やすための手段ではありません。まずどの単位で上限が管理されているかを確認したうえで、適切な方法で対処することが大切です。
現在の上限では足りない場合は、利用ティアの引き上げや上限申請の可否を管理画面や公式ドキュメントで確認するのが基本的な進め方です。利用実績や支払い状況に応じて上限が変わる場合もあるため、まず管理画面でティアと申請の可否を確認することをおすすめします。
自分のレートリミットを確認する方法
公式ドキュメントで上限の考え方を確認する
レートリミットを確認するときは、まず公式ドキュメントで上限の考え方を把握するのが基本的な順番です。レートリミットはサービスごとに単位や管理範囲が異なるため、古い記事やSNSの情報だけをもとに判断すると、現在の仕様とズレる可能性があります。特にAI APIではモデル名・利用ティア・無料枠・提供状況が変わることがあるため、具体的な数値は公式情報で確認するのが安全です。
公式ドキュメントで確認したい主な項目は、使われている単位(RPM・TPM・RPDなど)・上限が適用される範囲(APIキー・プロジェクト・組織)・利用ティアと無料枠の違い・リセット間隔です。これらを把握することで、429が出たときにどの上限を超えたのかを切り分けやすくなります。
公式ドキュメントで全体の考え方を確認したうえで、自分の管理画面に表示されている現在の上限を見るという順番が、思い込みや古い情報による判断ミスを避けるための基本ルートです。
▸ Check Order — 公式情報を先に確認する理由と順番
公式ドキュメントで「上限の考え方」を確認する
使われている単位・適用範囲・ティア・リセット間隔など全体の仕組みを把握する。古い記事やSNS情報との照合より先に公式を確認するのが基本
管理画面で「自分の現在の上限」を確認する
ドキュメントで仕組みを理解したうえで、自分のアカウント・プロジェクト・ティアに設定されている実際の上限値を管理画面で確認する
モデル・ティア・枠・提供状況をあわせて確認する
使用中のモデル・現在のティア・無料枠と有料枠の違い・そのモデルが利用可能かどうかも同時に確認する
▸ What to Check — 公式ドキュメントで見るべき項目
▸ 使われている単位
RPM・TPM・RPD・TPD・同時実行数
どの指標が上限として設定されているかを確認する。複数の単位が組み合わさっている場合もある
▸ 上限が適用される範囲
APIキー・プロジェクト・組織・モデル
どの単位で上限が管理されているかを確認する。組織単位で共有されている場合は切り分け方が変わる
▸ ティアと枠の違い
無料枠・有料枠・ティア別の上限値
ティアによって上限が大きく異なる場合がある。現在のティアで何が適用されるかを確認する
▸ リセットと対処
リセット間隔・Retry-After・エラー案内
上限に達したときの待機時間の目安・エラーレスポンスの形式を把握しておくと対処しやすくなる
▸ モデル別の差異
モデルごとの上限値・対応状況
同じAPIでもモデルによって上限が異なる場合がある。使用モデルに対応したドキュメントページを確認する
▸ 提供状況
モデルの利用可能状況・地域制限
モデル名が変わっていたり、提供が終了・変更されていたりする場合もあるため、ドキュメントで現在の状況を確認する
▸ Source Priority — 情報源の優先順位
公式
ドキュメント
各サービスのRate Limits・API Referenceページ。最も信頼できる一次情報。仕様変更も反映されやすい
最優先
管理画面
(Console)
自分のアカウントに適用されている実際の上限値・使用量・ティアを確認できる
次に確認
解説記事
ブログ
概念理解の参考にはなるが、公開時点の情報のため、数値・仕様は公式で確認が必要
参考程度
SNS・
口コミ
変わりやすい情報が多く、古い仕様や個別ケースの可能性がある。公式での確認が先決
要注意
管理画面で現在の上限と使用量を確認する
公式ドキュメントで上限の仕組みを確認したら、次に管理画面で自分の現在の上限と使用量を確認します。レートリミットはアカウント・プロジェクト・組織・利用ティアによって変わる場合があるため、公式ドキュメントの一般的な説明と、自分に実際に適用されている上限は異なることがあります。
管理画面では、現在の利用量・適用されている上限・利用ティア・無料枠の残り・モデル別の制限などを確認できる場合があります。「RPMに余裕があってもTPMに達している」「短時間の上限ではなく日次上限に達している」といった状況は、管理画面を見ることで初めて気づけるケースがあります。
チームや組織でAPIを使っている場合は、自分以外の処理が同じ上限を消費している可能性もあります。自分では少ししか使っていないつもりでも、同じプロジェクト内の自動処理や別メンバーの利用によって全体の使用量が増えていることがあるため、組織全体の使用量もあわせて確認するのが確実です。公式ドキュメントで仕組みを把握したうえで管理画面の数値を見ることで、エラーの原因を判断しやすくなります。
▸ Console Check — 管理画面で確認できる主な項目
▸ 利用量・上限
現在の使用量と上限値
RPM・TPM・RPD・TPDの現在値
上限に対して何%使っているか
モデル別の使用量
▸ ティア・プラン
現在のティアと適用される上限
現在の利用ティア
ティア別の上限値
上限引き上げ申請の可否
▸ Billing・残高
料金・無料枠・支出上限
今月の利用額・残高
無料枠の残り
支出上限の設定値
▸ プロジェクト・組織
プロジェクト・チーム全体の使用量
プロジェクト単位の利用量
組織全体の累積使用量
APIキーごとの割り当て
▸ Screen Names — 管理画面でよく使われる項目名の例
Rate Limits
/ Limits
RPM・TPM・日次上限などの上限値が一覧で確認できることが多い。ティア別の上限も載っている場合がある
Usage
現在の使用量・履歴・モデル別の消費量が確認できることが多い。日次・月次の推移を見るのに使いやすい
Billing
/ Quota
請求設定・残高・支出上限・無料枠の残りを確認できることが多い。料金上限が原因の場合はここを確認する
Project
Settings
プロジェクトごとのAPIキー・上限・メンバーの利用状況を確認できる場合がある
画面名称はサービスによって異なる。見つからない場合は、公式ドキュメントの「Rate Limits」「Billing」「Console」などのセクションから管理画面へのリンクを探すのが確実。
▸ Steps — 管理画面で確認する順番
1
現在の使用量と上限値を確認する
Usage・Rate LimitsでRPM・TPM・日次上限のどれに近いかを確認する
2
使用中モデルと適用ティアを確認する
モデルごとの上限・現在のティアで設定されている値を確認する
3
Billing・無料枠・支出上限を確認する
料金上限が原因の可能性がある場合はBilling画面で残高・支出上限・請求設定を確認する
4
プロジェクト・組織全体の使用量を確認する
チーム利用の場合は自分以外の処理による消費量もあわせて確認する
⚠️
「自分は少ししか使っていない」でも上限に近づくことがある。チームや組織でAPIを使っている場合、同じプロジェクト内の自動処理や別メンバーの利用が累積使用量に含まれる場合がある。個人の使用量だけでなく、プロジェクト・組織全体の使用量も確認するのが確実。
モデル名・利用ティア・無料枠・提供状況をあわせて見る
▸ Four Axes — レートリミット確認の4つの軸
🤖
Model
使用中のモデル
軽量モデル・高性能モデル・画像生成・音声など、モデルによってRPM・TPMが異なる場合がある
モデル別ドキュメントを確認
🏷️
Tier
現在の利用ティア
無料・有料・利用実績によって適用される上限値が段階的に変わる場合がある
管理画面のティアを確認
🎁
Free Quota
無料枠の範囲と上限
無料枠でも短時間のレートリミットは別に設定されている場合がある。「無料枠=制限なし」ではない
無料枠内の制限を確認
🔬
Status
モデルの提供状況
Preview・Beta・Experimentalは仕様や上限が変更される可能性がある。安定版と異なる制限が設けられる場合もある
提供状態をドキュメントで確認
▸ Model Types — モデルの種類と上限の傾向
軽量モデル
(Lite / Mini)
処理負荷が低めのため、RPM・TPMが比較的高めに設定される場合がある。高頻度の呼び出しに向いていることが多い
上限高め
の傾向
高性能モデル
(Pro / Ultra)
処理負荷が高く費用もかかるため、RPM・TPMが低めに設定される場合がある。1回あたりの処理量が大きい
上限低め
の傾向
画像・音声
生成モデル
テキスト生成とは別の上限体系が設けられている場合がある。画像枚数・秒数などの単位が使われることもある
別体系
の場合あり
推論向け
(Thinking系)
1回あたりの出力トークン数が多くなりやすいため、TPMに達しやすい場合がある。回数が少なくても上限に近づくことがある
TPM注意
の傾向
▸ Availability — モデルの提供状態と注意点
Stable / GA
安定版・正式提供
仕様・上限が比較的安定している状態。ドキュメントの情報が最も信頼しやすい
Preview
プレビュー提供中
正式版に向けた試験提供。仕様・上限が変更される可能性がある。公式情報を定期的に確認するのが安全
Beta
ベータ提供中
機能・制限が変わる可能性がある段階。本番利用では安定版との違いを確認してから使うのが安全
Experimental
試験的提供
仕様が固まっていない段階。上限・機能・提供継続が変わる可能性が高いため、試用目的での利用が基本
▸ Final Check — レートリミット確認時にセットで見る4項目
「このAPIはいくつまで使えるか」を確認するときに見ること
使用中のモデル名と種類
現在の利用ティア
無料枠・有料枠の区分
モデルの提供状況
レートリミットを確認するときは、上限の数値だけでなく、対象モデル・利用ティア・無料枠の範囲・モデルの提供状況をセットで確認するのが基本です。同じAPIでもモデルによって上限が異なる場合があるため、「このAPIはRPMがいくつか」と一般化するのではなく、「自分のティアで使っているモデルに何が適用されているか」を確認する必要があります。
無料枠についても注意が必要です。「無料枠がある=レートリミットがない」という意味ではありません。無料枠内でも短時間のリクエスト数やトークン量に制限が別に設けられている場合があります。無料枠の残量と、短時間の制限は別々に確認するのが確実です。
また、Preview・Beta・Experimentalのような試験的提供中のモデルは、仕様や上限が変更される可能性があります。安定版(Stable / GA)と同じ前提で使おうとすると、想定と異なる制限に当たることがあります。新しいモデルを使う場合は、公式ドキュメントで現在の提供状態も確認しておくのが安全です。
レートリミットに引っかかったときの対処法
時間を空けて再実行する
▸ Action Flow — 429が出たときの対処の流れ
すぐに再送しない最初に
エラー直後の連続再送はリクエスト数をさらに増やして制限が続きやすくなる場合がある
エラーレスポンスに待機時間が示されているか確認する確認
Retry-Afterヘッダーや待機秒数が含まれている場合はその時間を参考にする
間隔を空けて再実行する基本対処
RPM・TPMが原因なら数分待つと再実行できる場合がある。日次上限ならリセット時刻まで待つ
自動リトライの設定を確認する確認
ツールやアプリが裏で自動リトライを繰り返していないかリトライ間隔・回数・バックオフ設定を確認する
待っても解消しない場合は管理画面で原因を確認する次のステップ
日次上限・ティア・無料枠・料金上限のいずれかに達している可能性がある。管理画面で使用量を確認する
▸ Wait Time — 上限の種類ごとの解消目安
⚡
数分で解消する場合
RPM・TPM超過
数分待って再実行するのが基本ルート
📅
翌日まで解消しない場合
RPD・TPD超過
リセット時刻まで待つか管理画面で確認
💳
待っても解消しない場合
ティア・料金・枠の問題
管理画面でBilling・ティアを確認する
❌ 避けたい行動
✗
エラー直後に何度も再送する
回数が増えて制限が続きやすくなる
✗
原因を確認せずにひたすら待つ
日次上限なら数分待っても解消しない
✗
自動リトライの設定を確認しない
裏で連続リクエストが走り続けることがある
✓ 基本の進め方
✓
エラー内容を確認してから対処する
どの上限に達しているかを切り分ける
✓
間隔を空けてから再実行する
RPM・TPMなら数分待つのが基本ルート
✓
解消しない場合は管理画面を確認する
使用量・ティア・Billingを順番に見る
⚠️
「待てば直る」と「待っても直らない」は原因によって変わる。RPM・TPMなら数分で解消する場合があるが、日次上限・ティア・料金上限が原因の場合は待つだけでは解消しない。エラーが続く場合は管理画面で原因を確認するのが時間を無駄にしないための基本ルート。
レートリミットに引っかかったときの基本対処は、時間を空けてから再実行することです。RPMやTPMのような分単位の上限であれば、時間枠がリセットされることで再びリクエストを送れるようになる場合があります。エラーレスポンスに待機時間が示されている場合はその案内に従い、示されていない場合も数十秒〜数分の間隔を空けてから再試行するのが基本的な進め方です。
注意が必要なのは、エラー直後に何度も再送を繰り返すことで、かえってリクエスト数がさらに増えて制限が続きやすくなる場合がある点です。特に自動化ツールやアプリを使っている場合は、裏で自動リトライが走っていないかリトライ間隔・回数・バックオフ設定を確認しておくと安心です。
数分待っても同じエラーが続く場合は、短時間のレートリミットではなく日次上限・利用ティア・無料枠・料金上限が関係している可能性があります。この場合は待つだけでは解消しないため、管理画面で使用量・ティア・Billingを順番に確認するのが次のステップです。
リクエスト数や並列実行を減らす
▸ Patterns — RPM超過につながりやすい状況
🔁
複数の処理を一度に並列実行している
1つひとつは軽い処理でも、同時に走らせる数が多いと短時間のリクエスト数が急増する場合がある
⚡
エラー時に間隔ゼロで自動リトライしている
429が出るたびに即座に再送する設計だと、リクエスト数がさらに増えて制限が続きやすくなる場合がある
👥
複数ユーザーの操作が同じAPIに集中している
チーム・組織で同じAPIを使っている場合、それぞれの操作が合算されて短時間の上限に達しやすくなる場合がある
🤖
バッチ処理・自動化ツールが裏で動いている
手動操作は1回だけでも、ツール側が自動で何度もAPIを呼び出している場合がある。実際のリクエスト数を確認する必要がある
▸ Actions — リクエスト数・並列数を減らす具体的な方法
▸ 並列数を減らす
同時に走らせる処理数を絞る
一度に実行する処理を1〜2件ずつに絞ると、短時間のリクエスト数が安定しやすくなる
▸ 間隔を空ける
リクエストの送信間隔を広げる
次のリクエストまで数秒〜数十秒の待機を入れることで、1分あたりの呼び出し数を抑えやすくなる
▸ 不要なリトライを止める
自動リトライの回数・間隔を見直す
エラー時のリトライ設定を確認し、間隔ゼロの連続再送になっていないかを確認する
▸ バックオフを設定する
再試行のたびに待機時間を広げる
エラーが続くほど再試行の間隔を段階的に広げる設計にすると、同じエラーを繰り返しにくくなる
▸ Flow Pattern — リクエストの集中と分散
❌ 集中パターン
短時間に一気に送る
最初の数秒でRPMの上限に達しやすく、その後しばらく制限が続く場合がある
✓ 分散パターン
間隔を空けて均等に送る
1分あたりの使用量が上限を超えにくくなり、安定してリクエストを送りやすくなる
🔄
エクスポネンシャルバックオフについて
エラーが続くほど再試行の間隔を段階的に広げる設計をエクスポネンシャルバックオフと呼ぶ。たとえば、1回目は1秒後、2回目は2秒後、3回目は4秒後…と待機時間を増やすことで、同じエラーを繰り返しにくくなる。自動化ツールやAPIクライアントではこの設計を採用することが推奨されている場合がある。
RPMの上限に達している場合、1回あたりの入力内容が短くても短時間に呼び出す回数が多いだけで制限にかかることがあります。意識的に何度も押しているケースだけでなく、アプリやツールの裏側で複数のリクエストが同時に送られているケースも多くあります。まず「実際に1分間に何回APIを呼び出しているか」を確認することが切り分けの起点です。
対処の基本は、並列実行数を絞る・リクエストの間隔を広げる・不要なリトライを止めるの3点です。特にエラー時の自動リトライが間隔ゼロで走っている場合は、429が出るたびにリクエスト数がさらに増えて制限が続きやすくなることがあります。エラーが続くほど再試行の間隔を広げる設計(バックオフ)を取り入れることで、同じエラーを繰り返しにくくなります。
レートリミットはAPIを速く使うこと自体を禁止するものではありません。短時間に処理を集中させすぎると制限に達しやすくなるという仕組みを理解したうえで、リクエストを均等に分散させる設計にすることが、安定したAPI利用への基本的なアプローチです。
入力文や出力文を短くする
▸ TPM Patterns — 入出力が多くてTPMに達しやすい状況
📄
記事・議事録・ログをそのまま送る
1回でも入力トークンが多すぎてTPMに達することがある
💬
長い会話履歴を毎回すべて渡す
文脈を全部含めると累積トークンが増えやすくなる
📝
詳細な条件を詰め込んだ長いプロンプト
システムプロンプトが長いと毎回の入力トークンが増える
📖
長文回答を毎回求める
出力が長いほど出力トークンもTPMに加算される場合がある
「1回しか送っていない」でもTPMに達することがある。回数ではなく、入力+出力の合計トークン量が上限に影響する点を意識して見直す。
▸ Output — 出力トークンを減らす方法
▸ 出力形式を指定する
「箇条書き」「要点だけ」を指定する
プロンプトで出力形式を指定することで不要な長文回答を防ぎやすくなる
「要点を3行で」
「箇条書きで簡潔に」
▸ 文字数を指定する
出力の長さに上限を設ける
文字数やトークン数を指定することで出力量をコントロールしやすくなる
「200字以内で」
「max_tokens: 300」
▸ 必要な情報だけ求める
「結論だけ」「答えのみ」を指定する
背景説明や理由を省略させることで出力トークンを大幅に減らせる場合がある
「結論だけ答えて」
「理由は省略して」
▸ 段階的に処理する
大きな処理を小さく分けて順番に行う
1回の出力量を抑えながら複数のステップで処理することでTPMを管理しやすくなる
「まず要約だけ」
「次に詳細を」
▸ Before / After — 入出力を見直す前後の違い
TPMが関係していそうな場合は、リクエスト回数を減らすだけでは解決しないことがあります。1回あたりの入力が長すぎたり、出力が長くなりすぎたりすると、回数が少なくてもTPMの上限に達することがあるためです。記事全文・長い議事録・過去の全会話履歴などをそのまま渡しているケースは、入力トークンを見直す余地がある可能性があります。
入力側では、今回の処理に関係のない情報を削り、必要な部分だけに絞って送るのが基本的な対処です。出力側では、「要点を3行で」「箇条書きで」「200字以内で」など、出力形式や文字数を指定することで、不要に長い回答を防ぎやすくなります。APIのパラメータでmax_tokensを指定できる場合は、それを活用するのも有効な方法のひとつです。
「1回しか送っていないのにTPMに達した」という場合は、回数ではなく情報量の問題である可能性があります。入力と出力を少し軽くするだけでも、レートリミットに達しにくくなり、APIをより安定して使いやすくなります。
必要なら上限引き上げやプラン変更を確認する
時間を空けても、リクエスト数を減らしても、入出力を短くしても制限にかかり続ける場合は、管理画面で利用ティア・支払い設定・上限申請の可否を確認するのが次のステップです。現在の使い方に対して上限が低い場合は、ティアの引き上げやプラン変更が選択肢になることがあります。
ただし、プランを変更すればレートリミットがなくなるとは限りません。有料プランや上位ティアに移行すると利用できる量が増える場合がありますが、モデル別のRPMやTPM・日次上限・同時実行数などの制限が残ることもあります。変更前に、どの上限がどう変わるかを公式ドキュメントで確認するのが安全です。
上限引き上げには支払い状況・利用実績・アカウント状態などが関係する場合があり、すぐに反映されるとは限りません。大量のAPIリクエストを使う予定がある場合は、事前に現在の上限を確認し、必要であれば余裕をもって申請しておくのが現実的な進め方です。上限引き上げやプラン変更は、利用量の調整で対応できない場合の最終的な選択肢として位置づけるのが基本です。
▸ Priority — 対処の優先順位と上限引き上げの位置づけ
時間を空けて再実行するまず試す
RPM・TPM超過なら数分待つと解消する場合がある
リクエスト数・並列実行を減らす利用量調整
間隔を空ける・並列数を絞る・自動リトライを見直すことで上限に達しにくくなる場合がある
入力・出力を短くする利用量調整
不要な情報を削る・出力形式を指定することでTPMへの影響を抑えられる場合がある
上限引き上げ・プラン変更を確認する最終手段
1〜3で対応できない場合に管理画面でティア・支払い設定・上限申請を確認する
▸ Tiers — 利用ティアと上限の関係(一般的な考え方)
無料枠
Free
試用向けの枠。RPM・TPM・日次上限が最も低めに設定されていることが多い
上限
低め
Tier 1
入門
課金設定後の初期ティア。無料枠より上限が広がる場合がある
↑ 緩和
Tier 2〜3
中級
一定の利用実績・支払い実績で移行できる場合がある。上限がさらに引き上がることが多い
↑ 拡張
Tier 4〜5
上位
高い利用実績・支払い実績が必要になる場合が多い。より高い上限が設定されることがある
↑ 大幅拡張
Enterprise
法人向け
個別契約・交渉で上限の引き上げや専用枠が設定される場合がある
個別対応
ティア名・移行条件・上限値はサービスによって大きく異なる。上記はあくまで一般的な考え方。実際の条件は使用するサービスの公式ドキュメントで確認するのが安全。
▸ Check — 上限引き上げを検討するときの確認先
🏷️
現在のティアと上限値を確認
管理画面のLimits・Rate Limitsで適用中の上限とティアを確認する
💳
支払い設定・残高を確認
Billing画面で課金設定・残高・支出上限に問題がないかを確認する
📋
上限申請の可否を確認
管理画面やドキュメントで上限引き上げの申請フォームや条件を確認する
📖
変更後の上限を事前確認
プラン変更後にどのモデル・上限がどう変わるかを公式ドキュメントで確認してから変更する
⚠️
上限引き上げはすぐに反映されないことがある。支払い状況・利用実績・審査などが関係する場合があり、急ぎで大量のAPIを使う予定がある場合は事前に現在の上限を確認し、必要であれば余裕をもって申請しておくのが安全な進め方。
レートリミットを知るとAPIエラーを切り分けやすい
レートリミットの考え方を知っておくと、APIエラーが出たときに「何が原因か」を順番に確認できるようになります。「サービスが落ちているのか」「料金の問題か」「自分の使いすぎか」と漠然と考えるのではなく、429が出ているか → どの上限に達しているか → Web版かAPIか → 管理画面でどう表示されているかという順番で見ていくことで、対処法を判断しやすくなります。
この切り分けができると、無駄に同じリクエストを繰り返したり、原因が分からないまま設定を変えたりする可能性を減らせます。RPMが原因ならリクエスト間隔を空ける、TPMが原因なら入出力を短くする、日次上限が原因ならリセット時刻を待つ、という判断が自然にできるようになります。
レートリミットはAPIを難しくするための制限ではなく、短時間のアクセス集中を調整し、サービス全体を安定して動かすための仕組みです。エラーが出たとき、慌てて回避策を探す前に、まずどの上限に達している可能性があるかを確認するのが、安定したAPI利用への基本的なアプローチです。
▸ Decision Map — APIが使えないときの原因切り分けマップ
⛔ APIが使えない・429エラーが出た
›
RPM超過
›
▸ 対処
間隔を空けて再実行。並列数・リトライを見直す
›
TPM超過
›
▸ 対処
入出力を短くする。出力形式・文字数を指定する
›
日次上限
›
▸ 対処
リセット時刻まで待つ。管理画面でRPD・TPDを確認
›
Billing・ティア
›
▸ 対処
Billing・ティア・無料枠を管理画面で確認する
▸ Before / After — レートリミットを知る前と後
❌ 知らない状態
✗
Web版とAPIの上限を同じものとして判断する
✓ 知っている状態
✓
429・RPM・TPM・日次上限を順番に確認できる
🔲
レートリミットは「壁」ではなく「制御ゲート」
レートリミットは、アクセスを拒否するための壁ではなく、APIへのリクエストの流れを整える制御ゲート。429はそのゲートで一時停止がかかったサイン。RPMは通れる回数、TPMは通れる情報量。料金上限やWeb版の利用上限とは別に確認する必要がある。この切り分けができると、APIエラーを感覚ではなく、原因ごとに対応できるようになる。
よくある質問
Q
Definition
レートリミットとは何ですか?
▼
▸ Answer
Rate Limitレートリミットとは、一定時間内にAPIやWebサービスを使える量を制限する仕組みのことです。
AI APIでは、1分あたりのリクエスト数(RPM)、1分あたりのトークン数(TPM)、1日あたりの利用量(RPD・TPD)などに上限が設定される場合があります。この上限を超えると、リクエストが一時的に失敗したり、429エラーが返ったりすることがあります。
レートリミットは「使用禁止」の仕組みではなく、APIの流量を整えるための制御ゲートです。上限はサービス・モデル・利用ティアによって変わるため、公式ドキュメントや管理画面で確認するのが基本です。
Q
Error
429エラーはレートリミットが原因ですか?
▼
▸ Answer
429429 Too Many Requestsは、レートリミットに達したときに返ることがあるHTTPステータスコードです。短時間に多すぎるリクエストを送った場合に使われるコードとして、IETFのRFC 6585でも定義されています。
ただし、429が出てもサービス全体が停止しているわけではありません。自分のアカウント・プロジェクト・組織・モデル・利用ティアなどに設定された上限に達している可能性があります。
また、401(認証エラー)・400(入力エラー)・5xx(サービス障害)はレートリミットとは原因が異なります。まずステータスコードを確認し、429かどうかを切り分けることが対処の起点になります。
Q
Wait
レートリミットに達したら何分待てばいいですか?
▼
▸ Answer
Wait Time何分待てば必ず解消するとは断定できません。上限の種類によって異なるためです。
RPM・TPM(分単位)の上限に達している場合は、数分待つと再実行できる場合があります。一方、RPD・TPD(日次上限)に達している場合は、その日のリセット時刻まで待つ必要があることがあります。
エラーレスポンスにRetry-Afterなどの待機時間が示されている場合はその案内を参考にします。表示がない場合も、すぐに連続で再送するのではなく、一定の間隔を空けて再試行するのが安全な進め方です。
Q
▼
▸ Answer
RPMRPM(Requests Per Minute)は、1分あたりに送れるリクエスト数の上限です。APIを何回呼び出せるかを見る指標で、入力内容の長さには関係なく、送った「回数」がカウントされます。
TPMTPM(Tokens Per Minute)は、1分あたりに処理できるトークン数の上限です。リクエスト回数が少なくても、入力文や出力文が長い場合はTPMの上限に達することがあります。
比喩で整理すると、RPMは「1分間にゲートを通れる回数」、TPMは「1分間に運べる荷物の総量」です。両方が独立した上限として設定されている場合があるため、429が出たときはどちらが原因かを確認することが大切です。
Q
▼
▸ Answer
日次上限RPD(Requests Per Day)は1日あたりに送れるリクエスト数、TPD(Tokens Per Day)は1日あたりに処理できるトークン数の上限です。
RPMやTPMが「短時間の混雑メーター」であるのに対して、RPDやTPDは1日全体の累積使用量を見る指標です。日次上限に達している場合は、数分待つだけでは解消しないことがあります。
同様に、同時に処理できるリクエスト数(同時実行数)に上限が設けられているサービスもあります。バッチ処理や自動化ツールを使っている場合は、この点も確認しておくと原因を切り分けやすくなります。
Q
Plan
有料プランならレートリミットはなくなりますか?
▼
▸ Answer
Plan有料プランや上位ティアに移行すると利用できる上限が引き上がる場合がありますが、レートリミットが完全になくなるとは限りません。
モデル別のRPM・TPM・日次上限・同時実行数などの制限は、有料プランでも残ることがあります。また、Web版の有料プランとAPI利用は料金体系・上限の管理が分かれている場合があるため、同じと考えない方が安全です。
現在のプランで適用されている上限は、公式ドキュメントや管理画面のLimits・Rate Limitsから確認するのが確実です。
Q
Key
APIキーを増やせばレートリミットを回避できますか?
▼
▸ Answer
KeyAPIキーを増やしても、レートリミットを回避できるとは限りません。
上限はAPIキー単位ではなく、プロジェクト・組織・アカウント・モデル・利用ティアなどの単位で管理される場合があります。同じプロジェクトや組織に紐づくAPIキーを増やしても、利用枠が共有されていれば上限は変わらないことがあります。
また、上限を避ける目的でAPIキーやアカウントを増やす使い方は、サービスの利用規約に反する可能性があります。制限に達した場合は、まず利用量の調整・ティアの確認・上限申請の可否を管理画面で確認するのが基本的な進め方です。
Q
Billing
レートリミットと料金上限は同じですか?
▼
▸ Answer
Billingレートリミットと料金上限は別の仕組みです。
レートリミットは、短時間にどれだけAPIを使えるかを制限する仕組みです。料金上限は、月間の支出上限・無料枠・クレジット残高など、使える金額に関する制限です。
この2つは独立しているため、料金枠が残っていても短時間に使いすぎるとレートリミットに達する場合があります。逆に、レートリミットに余裕があっても料金上限に達してAPIが止まることもあります。エラーが出たときは、どちらが原因かを管理画面で切り分けることが大切です。
Q
Web vs API
Web版の利用上限とAPIのレートリミットは同じですか?
▼
▸ Answer
Web vs APIWeb版の利用上限とAPIのレートリミットは、別に考える必要があります。
ChatGPTやGrokなどの画面上に表示される「一定時間後に再度お試しください」などの制限は、Web版・アプリ版の利用制限である場合があります。一方、APIのレートリミットは開発者向けにリクエストを送る仕組みに対して設定される上限で、確認場所・料金体系・上限の考え方が異なります。
まず「自分はWeb版を使っているのか、APIを使っているのか」を確認することが、エラー切り分けの起点になります。
Q
Check
レートリミットはどこで確認できますか?
▼
▸ Answer
Where to Checkまず公式ドキュメントのRate Limits・API Referenceページで、使われている単位・適用範囲・ティア別の上限の考え方を確認するのが基本です。
そのうえで、管理画面のLimits・Rate Limits・Usage・Billing・Quota・Project settingsなどの項目で、自分のアカウントに適用されている現在の上限と使用量を確認します。表示名はサービスによって異なります。
モデルや利用ティアによって上限が変わる場合があるため、使用中モデルのページと現在のティアをあわせて確認すると、より正確に把握しやすくなります。
Q
Action
レートリミットに達したときはどう対処すればいいですか?
▼
▸ Answer
Actionまずは時間を空けて再実行します。RPM・TPMが原因なら数分待つと再実行できる場合があります。エラーレスポンスにRetry-Afterが含まれていればその時間を参考にします。
それでも同じエラーが続く場合は、以下の順番で切り分けます。
① リクエスト数・並列実行を減らす(RPMが原因の場合)
② 入力・出力を短くする(TPMが原因の場合)
③ 管理画面で日次上限・ティア・Billingを確認する(待っても解消しない場合)
④ ティアの引き上げ・上限申請の可否を確認する(利用量調整で対応できない場合)
エラー直後に連続再送するのは逆効果になる場合があるため、まず原因を確認してから対処するのが基本的な進め方です。
まとめ:レートリミットはAPIを安定して使うための上限
レートリミットは、APIを難しくするための制限ではなく、短時間のアクセス集中を整えてサービス全体を安定させるための制御ゲートです。429エラーが出たとき、原因をひとつに決めつけず「RPMか・TPMか・日次上限か・料金上限か・Web版とAPIの違いか」を順番に確認することが、最短で対処できるルートになります。
エラーが出てから慌てて対処するより、事前にレートリミットの考え方を理解し、自分の利用環境でどの上限が適用されているかを確認しておくことが、APIを安定して使い続けるための基本です。使っているモデル・ティア・プロジェクト・管理画面の数値を把握しておくだけで、トラブル時の判断スピードが変わります。
APIの基本から確認したい場合は「APIとは?」の記事へ、トークン量・長文入力との関係を知りたい場合は「コンテキストウィンドウとは?」の記事へ、具体的な429エラーの対処を知りたい場合は各サービスのエラー対処記事へ進むと理解が深まりやすくなります。
🔲
レートリミットは「使用禁止の壁」ではなく、APIへのリクエストの流れを整える制御ゲート。429はそのゲートで一時停止がかかったサイン。RPMは通れる回数、TPMは通れる情報量。料金上限やWeb版の利用上限とは別に確認する必要がある。
▸ Key Points — この記事の要点
POINT 01
レートリミットは複数の上限で構成される
RPM・TPM・RPD・TPD・同時実行数など、複数の上限が組み合わさっている場合がある
POINT 02
429が出たら原因を切り分ける
「短時間の使いすぎ」なのか「日次上限」なのか「料金上限」なのかによって対処法が変わる
POINT 03
待つだけで解消しない場合がある
RPM・TPMは数分で解消する場合があるが、日次上限・ティア・料金上限は待つだけでは解消しないことがある
POINT 04
有料プランでも上限は残ることがある
有料プランでモデル・RPM・TPMの上限が緩和される場合があるが、完全になくなるとは限らない
POINT 05
Web版とAPIの上限は別に確認する
同じサービス名でもWeb版とAPIで上限・料金体系・確認場所が異なる場合がある
POINT 06
公式ドキュメントと管理画面で確認する
上限の数値はモデル・ティア・無料枠によって変わるため、公式情報での確認が基本ルート
▸ Action Steps — 429が出たときの対処の流れ
›
2
時間を空けて再実行する
RPM・TPM超過なら数分待つ
›
›
4
管理画面で原因を確認する
日次・ティア・Billing
›
5
ティア引き上げ・上限申請を確認する
最終手段として
▸ Next Steps — 次に読むと理解が深まる
📡
APIの基本から知りたい
APIとは?
仕組み・キー・リクエスト・レスポンスの基本を理解する
📏
トークン・長文入力の制限を知りたい
コンテキストウィンドウとは?
1回で送れるトークン数の上限とTPMの違いを整理する
🔧
具体的なエラー対処を知りたい
各サービスのエラー対処記事
Gemini・Grok・ChatGPTのエラーごとの対処法を確認する
引用元・参考情報
※ 上記の公式情報は、記事公開時点での参照内容です。料金・上限数値・モデル名・提供状況・APIの仕様は予告なく変更される場合があります。実際にAPIを利用する際は、各公式ページで最新情報をご確認ください。
あわせて読みたい記事
最後までご覧いただきありがとうございました。
コメント