common-sign-language-0001#
ユースケースと概要説明#
Jester データセット認識シナリオ用の人間ジェスチャー認識モデル (ジェスチャー・レベルの認識)。このモデルは、MobileNet V3 バックボーンを備えた S3D フレームワークを使用します。このモデルで認識されるジェスチャーのリストを確認するには、Jester データセット仕様を参照してください。
このモデルは、一定のフレームレート (8 フレーム) でサンプリングされたフレームのスタックを受け入れ、入力クリップに対して予測を生成します。
仕様#
メトリック |
値 |
---|---|
トップ 1 の精度 (連続ジェスター) |
93.58% |
GFlops |
4.2269 |
MParams |
4.1128 |
ソース・フレームワーク |
PyTorch* |
入力#
元のモデル#
形状: 1, 3, 8, 224, 224
、形式: B, C, T, H, W
の画像のバッチ、ここで:
B
- バッチサイズC
- チャネルT
- シーケンス長H
- 髙さW
- 幅
チャネルの順番は RGB
です。
変換されたモデル#
形状: 1, 3, 8, 224, 224
、形式: B, C, T, H, W
の画像のバッチ、ここで:
B
- バッチサイズC
- チャネルT
- シーケンス長H
- 髙さW
- 幅
チャネルの順番は RGB
です。
出力#
モデルは、形状 B, 27
のテンソルを出力します。各行は、実行されたジェスター・ジェスチャーのロジットベクトルです。
元のモデル#
形状: 1, 27
、形式: B, C
のブロブ、ここで:
B
- バッチサイズC
- 予測ロジットサイズ
変換されたモデル#
形状: 1, 27
、形式: B, C
のブロブ、ここで:
B
- バッチサイズC
- 予測ロジットサイズ
モデルをダウンロードして OpenVINO™ IR 形式に変換#
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
元のモデルは、Apache License 2.0 に基づいて配布されています。