Pricing
Inference
トレーニング
モデル ストレージ
制限
-
Inference の同時実行制限: デフォルトでは、Serverless RL は現在、ユーザーごとに最大 2000 件、project ごとに最大 6000 件の同時リクエストをサポートしています。レート制限を超えると、Inference API は
429 Concurrency limit reached for requestsレスポンスを返します。このエラーを回避するには、トレーニング ジョブまたは本番ワークロードから同時に送信するリクエスト数を減らしてください。より高いレート制限が必要な場合は、support@wandb.com で申請できます。 - 地理的制限: Serverless RL は、サポート対象の地域でのみ利用できます。詳細は、Terms of Serviceを参照してください。