概要
当社のAPIは同期型です。これは、入力パラメータを持つAPIリクエストをエンドポイントに送信すると、即座に応答が得られることを意味します。
サービスAPI
推論API
😎 以下でGPU推論を実行
- Automatic1111 (例:SD-XL 1.0、Stable Diffusion v2.1)
- vLLM (例:Mistral、LLaMA、MPT)
- Audio (text2speech) (例:Whisper)
トラブルシューティング
HTTP 429 Too Many Requestsエラーの対処法
HTTP 429ステータスコードは、一定期間に過剰なリクエストが送信されたことを示します(「レート制限」)。当社のサービスは、リソースの過負荷を防ぐために過剰なリクエストを拒否します。これは、単一のユーザーやアプリケーションによって短期間に過剰なリクエストが送信された場合に発生する可能性があります。
ユーザーは、429ステータスコードの応答を受け取った場合に対処するために、リトライロジックを実装する必要があります。
同意してHuggingFaceのリポジトリにアクセス
HuggingFaceの一部のリポジトリ(モデル)は、ユーザーがリポジトリの作成者に許可を与え、連絡先情報(メールアドレスとユーザー名)を提供する必要があります。リポジトリにアクセスすると、次のメッセージが表示される場合があります:
クリックして同意を与えてください。これはモデルを使用するために必要です。クリックすると、次のメッセージが表示されます: