エンドポイント
最初のエンドポイントを作成
エンドポイントは完全に管理されており、あらゆるAIワークロードを処理できるようにスケーラブルです。さまざまなアプリケーションに対応しており、Automatic1111、vLLM、Whisperなどの環境をサポートしています。各エンドポイントは、現在の負荷に応じた特定の数のワーカー(GPU付き)によって動作します。
最初のエンドポイントを構成するには、次が必要です:
- 有効なmodelserve AIアカウント
- 生成されたアクセストークン
- アカウントに十分な資金(USD)
最初のAIエンドポイントを生成するには、以下のエンドポイントを使用してください:
curl -s -X POST \
-H 'Accept: application/json' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer X' \
-d '{"name": "string", "gpu_segment": 0, "package_type": "automatic", "model_repo_name": "string", "model_url": "string", "huggingface_auth_token": "string", "startup_script_url": "string"}' \
'https://api.modelserve.ai/api/v1/clusters/'
import requests
r = requests.post(
"https://api.modelserve.ai/api/v1/clusters/",
headers={
"Accept": "application/json",
"Content-Type": "application/json",
"Authorization": "Bearer X",
},
data={
"name": "string",
"gpu_segment": 0,
"package_type": "automatic",
"model_repo_name": "string",
"model_url": "string",
"huggingface_auth_token": "string",
"startup_script_url": "string",
},
)
fetch('https://api.modelserve.ai/api/v1/clusters/', {
"method": "POST",
"headers": {
"Accept": "application/json",
"Content-Type": "application/json",
"Authorization": "Bearer X"
},
"body": JSON.stringify({"name": "string", "gpu_segment": 0, "package_type": "automatic", "model_repo_name": "string", "model_url": "string", "huggingface_auth_token": "string", "startup_script_url": "string"})
});
Values:
"name": "string"
- エンドポイントのカスタム名"gpu_segment": 0
- セグメントID (詳細はセグメントセクションをご覧ください)"package_type": "string"
- 環境のタイプ。以下から選択できます:automatic
- Automatic1111vllm
- vLLMspeech2text
- audio (例. Whisper)
"model_repo_name": "string"
- HuggingFaceのモデルリポジトリのアドレス"model_url": "string"
- HuggingFaceのモデルURLのアドレス"huggingface_auth_token": "string"
(オプション) - 追加のセキュリティトークン"startup_script_url": "string"
(オプション) - 環境を変更するための追加スクリプト
例のペイロード:
data={
"name": "My own Stable Diffusion",
"gpu_segment": 8,
"package_type": "automatic",
"model_url": "https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned-emaonly.ckpt",
},
data={
"name": "My own Mistral",
"gpu_segment": 9,
"package_type": "vllm",
"model_repo_name": "mistralai/Mistral-7B-v0.1",
},
data={
"name": "My own Whisper",
"gpu_segment": 9,
"package_type": "speech2text",
"model_repo_name": "openai/whisper-tiny",
},
⚠️ vLLMおよびWhisperで実行されるモデルには model_repo_name を使用し、Automatic1111で実行されるモデルには model_url を使用してください。
エンドポイントのリストを表示
最初のエンドポイントを作成した後、そのIDを取得するためにリストを表示できます。この方法で、現在のエンドポイントのリスト、設定、および状態を確認することができます。
エンドポイントのリストを表示するには、以下のエンドポイントを使用してください:
-
"results": [
{
"id": "eca2785b-d094-432b-8722-6c7d2f957eb2",
"name": "SD 1.5",
"gpu_segment": 3,
"package_type": "automatic",
"status": "terminated",
"model_repo_name": null,
"model_url": "https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned-emaonly.ckpt",
"startup_script_url": null,
"address": "https://6c7d2f957eb2.app.modelserve.dev-test.golem.network",
"running_workers": [],
"created_at": "2024-01-22T09:24:19.947509Z",
"last_update": "2024-01-22T12:38:42.907606Z"
}]
例の値:
- ```"id": "eca2785b-d094-432b-8722-6c7d2f957eb2"``` - エンドポイントのユニークID
- ```"name": "SD 1.5"``` - エンドポイントの名前
- ```"gpu_segment": 3``` - セグメントID
- ```"package_type": "automatic"``` - 環境のタイプ
- ```"status": "terminated"``` - 現在のステータス
- ```"model_repo_name": null``` - HuggingFaceのモデルリポジトリのアドレス
- ```"model_url": "https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned-emaonly.ckpt"``` - HuggingFaceのモデルURLのアドレス
- ```"startup_script_url": null``` - 環境を変更するための追加スクリプト
- ```"address": "https://6c7d2f957eb2.app.modelserve.ai"``` - エンドポイントのアドレスURL
- ```"running_workers": []``` - ワーカーに関する詳細情報
- ```"created_at": "2024-01-22T09:24:19.947509Z"``` - エンドポイントの作成日
- ```"last_update": "2024-01-22T12:38:42.907606Z"``` - エンドポイントの最終更新日
最も重要な値は:
- ```"id": "eca2785b-d094-432b-8722-6c7d2f957eb2"``` - エンドポイントのユニークID
- ```"address": "https://6c7d2f957eb2.app.modelserve.ai"``` - エンドポイントのアドレスURL
「Bearer X」を実際のアクセストークンに置き換えることを忘れないでください。アクセストークン(Bearer)の見つけ方については、クイックスタートセクションで詳細をご覧ください。