fcrn-dp-nyu-depth-v2-tf

ユースケースと概要説明

これは、完全畳み込み残差ネットワークによる深度予測の論文で説明されている、NYU Depth V2 データセットでトレーニングされた単眼深度推定のモデルであり、ResNet-UpProj と呼ばれています。モデル入力は単色の画像です。モデルの出力は、未知のスケール係数まで定義された逆深度マップです。詳細は、以下のリポジトリーを参照してください。

仕様

メトリック

タイプ

Monodepth

GFLOPs

63.5421

MParams

34.5255

ソース・フレームワーク

TensorFlow*

精度

メトリック

RMSE

0.573

log10

0.055

rel

0.127

NUY Depth V2 データセットで取得された精度数値。log10 メトリックは対数絶対誤差であり、abs(log10(gt) - log10(pred)) として定義されます。ここで、gt はグラウンドトゥルース深度マップ、pred は予測深度マップです。rel メトリックは、グラウンドトゥルース深度マップ値で正規化された絶対誤差として定義される相対絶対誤差です (abs(gt - pred) / gt、ここで、gt はグラウンドトゥルース深度マップ、pred は予測深度マップ)。

入力

元のモデル

画像、名前: Placeholder、形状: 1, 228, 304, 3、形式: B, H, W, C

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順番は RGB です。

変換されたモデル

画像、名前: Placeholder、形状: 1, 228, 304, 3、形式: B, H, W, C

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順番は BGR です。

出力

元のモデル

逆深度マップ、名前 - ConvPred/ConvPred、形状 - 1, 128, 160、形式 - B, H, W

説明:

  • B - バッチサイズ

  • H - 高さ

  • W - 幅

逆深度マップは、未知のスケール係数まで定義されます。

変換されたモデル

逆深度マップ、名前 - ConvPred/ConvPred、形状 - 1, 128, 160、形式 - B, H, W

説明:

  • B - バッチサイズ

  • H - 高さ

  • W - 幅

逆深度マップは、未知のスケール係数まで定義されます。

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。