midasnet#

ユースケースと概要説明#

MidasNet は、複数のデータセットを混合することでトレーニングされた単眼奥行き推定用のモデルです。次の論文で説明されているとおりです: ロバストな単眼深度推定に向けて: ゼロショット・クロスデータセット転送のためのデータセットの混合

モデル入力は、RGB 順に 1, 3, 384, 384 の単一イメージで構成されるブロブです。

モデルの出力は、未知のスケール係数まで定義された逆深度マップです。

#

こちら を参照

仕様#

メトリック

タイプ

Monodepth

GFLOPs

207.25144

MParams

104.081

ソース・フレームワーク

PyTorch*

精度#

メトリック

rmse

0.07071

入力#

元のモデル#

画像、名前: image、形状: 1, 3, 384, 384、形式: B, C, H, W、ここで:

  • B - バッチサイズ

  • C - チャネル

  • H - 髙さ

  • W - 幅

チャネルの順番は RGB です。

平均値: [123.675、116.28、103.53]スケール値 - [51.525、50.4、50.625]

変換されたモデル#

画像、名前: image、形状: 1, 3, 384, 384、形式: B, C, H, W、ここで:

  • B - バッチサイズ

  • C - チャネル

  • H - 髙さ

  • W - 幅

チャネルの順番は BGR です。

出力#

元のモデル#

逆深度マップ、名前 - inverse_depth、形状 - 1, 384, 384、形式 - B, H, W、ここで:

  • B - バッチサイズ

  • H - 髙さ

  • W - 幅

逆深度マップは、未知のスケール係数まで定義されます。

変換されたモデル#

逆深度マップ、名前 - inverse_depth、形状 - 1, 384, 384、形式 - B, H, W、ここで:

  • B - バッチサイズ

  • H - 髙さ

  • W - 幅

逆深度マップは、未知のスケール係数まで定義されます。

モデルをダウンロードして OpenVINO™ IR 形式に変換#

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: