ノイズ抑制 Python* デモ

この README では、ノイズ抑制デモ・アプリケーションについて説明します。

どのように動作するか

起動時に、デモ・アプリケーションはコマンドライン・パラメーターを受け取り、モデルを OpenVINO™ ランタイムプラグインにロードします。また、音声とノイズが混在したユーザーが提供するサウンドファイルを読み取り、小さな連続したパッチでネットワークにフィードします。ネットワークの出力も、クリーンな音声を含む連続したオーディオパッチです。パッチはまとめて出力オーディオファイルに保存されます。

実行の準備

デモでサポートされるモデルリストは、<omz_dir>/demos/noise_suppression_demo/python/models.lst ファイルにあります。このファイルは、モデル・ダウンローダーおよびコンバーターのパラメーターとして使用され、モデルをダウンロードし、必要に応じて OpenVINO IR 形式 (*.xml + *.bin) に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --list models.lst

モデル・コンバーターの使用例:

omz_converter --list models.lst

サポートされるモデル

  • noise-suppression-denseunet-ll-0001

  • noise-suppression-poconetlike-0001

注: 各種デバイス向けのモデル推論サポートの詳細については、インテルの事前トレーニング・モデルのデバイスサポートパブリックの事前トレーニング・モデルのデバイスサポートの表を参照してください。

実行

次のコマンドでデモを実行します (Open Model Zoo からモデルをモデル・ダウンローダーでダウンロードし、“–name noise-suppression*” パラメーターで実行)。

    python3 noise_suppression_demo.py \
                                    --model=<path_to_model>/noise-suppression-poconetlike-0001.xml \
                                    --input=noisy.wav \
                                    --output=cleaned.wav

デモの入力

アプリケーションは、指定された入力ファイルからオーディオウェーブを読み取ります。入力ファイルは 16kHz の離散化周波数が必要です。モデルにはデモ引数も指定する必要があります。

デモの出力

アプリケーションは、クリーンなウェーブを出力ファイルに出力します。デモレポート

  • レイテンシー: 入力データの処理に必要な合計処理時間 (データの読み取りから結果の表示まで)。