モデルサーバーのパラメーター¶
モデル構成オプション¶
オプション |
値形式 |
説明 |
---|---|---|
|
|
gRPC および REST API 経由で公開されるモデル名 (コマンドラインで |
|
|
Google Cloud ストレージ、Azure ストレージ、または S3 パスを使用している場合は、クラウド・ストレージ・ガイドを参照してください。パスは次のようになります。 |
|
|
一部のモデルでは再形状操作はサポートされていません。モデルを再形成できない場合、モデルは元のパラメーターであり、互換性のない入力形式を持つ要求はエラーになります。特定のエラーの詳細については、ログを参照してください。すべての制限を含む、サポートされるモデル・グラフ・レイヤーの詳細については、形状推論ドキュメントを参照してください。 |
|
|
オプションです。デフォルトでは、バッチサイズは、OpenVINO モデル・オプティマイザーを通じて定義されたモデルから派生します。 |
|
|
|
|
|
オプションです。モデルバージョンのポリシーを使用すると、OpenVINO モデルサーバーが提供するモデルのバージョンを決定できます。デフォルトでは、サーバーは最新バージョンを提供します。この引数を使用する理由の 1 つは、サーバーのメモリー消費を制御することです。受け入れられる形式は json または文字列です。 |
|
|
デバイス・プラグイン・パラメーターのリスト。完全なリストについては、OpenVINO のドキュメントとパフォーマンス・チューニング・ガイドを参照してください。 |
|
|
内部要求キューのサイズ。0 に設定するか、値を設定しない場合、値は利用可能なリソースに基づいて自動的に計算されます。 |
|
|
推論操作の実行に使用されるデバイス名。受け入れられる値は次のとおりです: |
|
|
true に設定すると、モデルはステートフルとしてロードされます。 |
|
|
true に設定すると、モデルは定期的なシーケンス・クリーナー・スキャンの対象になります。アイドルシーケンスのクリーンアップを参照してください。 |
|
|
モデルのインスタンスによって同時に処理できるシーケンスの数を決定します。 |
|
|
true に設定すると、モデルサーバーはモデルの読み込み時に低レイテンシーの変換を適用します。 |
|
|
rest_port でメトリックのエンドポイントを有効にするフラグ。 |
|
|
カンマで区切られたメトリックのリスト設定しない場合、デフォルトのメトリックのみが有効になります。 |
注: : config_path を指定することと、CLI にモデル・パラメーターを入力することは相互に排他的です (複数のモデルを提供)。
オプション |
値形式 |
説明 |
---|---|---|
|
|
json 設定ファイルへの絶対パス。 |
サーバー構成オプション¶
サーバーの構成オプションはコマンドライン・オプションを介してのみ定義され、提供されるすべてのモデルに共通の構成を決定します。
オプション |
値形式 |
説明 |
---|---|---|
|
|
gRPC サーバーによって使用されるポートの番号。 |
|
|
HTTP サーバーが使用するポートの番号 (指定しない場合、または 0 に設定した場合、HTTP サーバーは起動されません)。 |
|
|
gRPC サーバーがバインドするネットワーク・インターフェイス・アドレスまたはホスト名。 |
|
|
REST サーバーがバインドするネットワーク・インターフェイス・アドレスまたはホスト名。 |
|
|
gRPC サーバー・インスタンスの数 (1 から CPU コア数まで)。 |
|
|
HTTP サーバーのスレッドの数。 |
|
|
構成バージョンとモデルバージョンの変更を検出する時間間隔 (秒単位)。 |
|
|
次のシーケンス・クリーナー・スキャンの時間間隔 (分単位)。アイドルシーケンスのクリーンアップの対象となっており、最後のスキャン以降非アクティブなモデルのシーケンスは削除されます。値をゼロにすると、シーケンスクリーナーは無効になります。アイドルシーケンスのクリーンアップを参照してください。また、ヒープから空きメモリーを解放するスケジュールも設定します。 |
|
|
2 つの連続するリソースのクリーンアップ・スキャンの時間間隔 (秒単位)。 |
|
|
カスタムレイヤーが実装されたライブラリーへのオプションのパス。 |
|
|
サービスのログレベル |
|
|
ログファイルへのオプションのパス。 |
|
|
モデルのキャッシュストレージへのパス。このパラメーターが定義されている、またはデフォルトのパス /opt/cache が存在する場合、キャッシュが有効になります。 |
|
|
grpc サーバーに渡される引数のカンマ区切りのリスト。 |
|
|
grpc サーバーが使用できるスレッドの最大数。 |
|
|
grpc サーバーのバッファーメモリー割り当て上限。 |
|
|
ヘルプメッセージを表示して終了します |
|
|
バイナリーのバージョンを表示します |