common-sign-language-0002#

ユースケースと概要説明#

共通手話言語ジェスチャー認識シナリオ向けのジェスチャー認識モデル。このモデルは、12 の一般的な片手ジェスチャーをサポートしています:

このモデルは、MobileNet V3 バックボーンを備えた S3D フレームワークを使用し、一定のフレームレート (15 FPS) でサンプリングされたフレームのスタック (8 フレーム) を受け入れ、入力クリップの予測を生成します。

画像シーケンス、名前: input、形状: 1, 3, 8, 224, 224、形式: B, C, T, H, W、ここで:

モデルは、形状 1, 12 のテンソルを B, L 形式で出力します。ここで:

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。