ACM RecSys Challenge 2022 のインテル® SIHG4SR ソリューション

マシンラーニング

この記事は、The Parallel Universe Magazine 51 号に掲載されている「The Intel® SIHG4SR Solution for the ACM RecSys Challenge 2022」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


parallel_v51_05

課題

米計算機学会 (ACM: Association for Computing Machinery) の推薦システム・カンファレンスでは、毎年 RecSys Challenge と呼ばれるデータサイエンス・コンテストを開催しています。インテルは、このコンテストに 2年前から参加しています。2022年、インテルは SIHG4SR: Side Information Heterogeneous Graph for Session Recommender (英語) ソリューション (『ACM Digital Library』に掲載) を発表し、最終リーダーボードで 4 位に入賞しました (チーム名「MooreWins」)。

RecSyc Challenge 2022 (英語) は Dressipi (英語) によって企画され、課題はファッション推薦でした。提供されたデータセット (英語) には、18 か月間にわたる 110 万件の匿名化されたオンライン小売セッションが含まれていました (図 1 と図 2)。各セッションには、購入されたアイテムをラベルとする、1日の顧客の行動が含まれており、記述的なファッション特性のセットに基づいて、顧客がどのアイテムを購入するかを予測することが課題でした。コンテストに参加したソリューションは、MRR (Mean Reciprocal Rank) スコアによって順位が付けられました。具体的には、各セッションにおいて、購入される可能性のあるアイテムのリストに対して、実際に購入されたアイテムがより上位に表示されれば、MRR は高くなります。逆に、アイテムが予測リストの下位に表示された場合、MRR は低くなるか、ゼロになります。例えば、予測リストが [item2, item3, item1, item0] で、item3 が実際に購入されたアイテムの場合、以下のようになります。


図 1. オンライン・ショッピング・セッションの例


図 2. アイテム特徴の例

インテルのソリューション

SIHG4SR ソリューションは、グラフ・ニューラル・ネットワーク (GNN) を使用して各セッションから学習し、閲覧したアイテムと最終的に購入したアイテムの間のつながりを明らかにします (図 3)。まず、各セッションを DGL (Deep Graph Library) (英語) を使用して実装したグラフで表現し、それをネットワークに投入します。このモデルは 3 つの段階に分けることができます。第 1 段階では、入力グラフをアイテム、特徴、カテゴリーの 3 つの学習可能な埋め込みテーブルにエンコードします。第 2 段階では、特徴とカテゴリーをアイテムの埋め込みと同じ形状に再整形し、アテンション読み出し層を適用して特徴をデコードします。そして、第 3 段階では、アイテムとサイド情報を基に 2 つの独立した予測を 1 つに融合して、アイテムの最終予測を行います。


図 3. SIHG4SR アーキテクチャー

この新しいモデルは、ヘテロジニアス・グラフを利用して各セッションを表現し、新しい集約手法でサイド情報とシーケンス特徴を融合します。サイド情報としてアイテムの特徴を組み込みユーザーの意図を有効活用するこのソリューションは、再帰的特徴量エンジニアリング、2 段階トレーニング手法、マルチレベルの組み合わせ、ハイパーパラメーター・チューニングにより、MRR 0.20762 を達成し、総合 4 位を獲得しました。

このソリューションでは、表形式のセッションデータをグラフ化します (図 4)。各セッションは 1 つのグラフに変換され、合計 110 万個のグラフが作成されます。各グラフには 3 種類のエッジが存在します。閲覧順にアイテムをつなぐエッジ、アイテムとその特徴をつなぐエッジ、そして、特徴と対応するカテゴリーをつなぐエッジです。アイテムの順序は推薦において重要です。閲覧履歴を学習することで、グラフ・ネットワークは異なるパターンを検出し、最終的に次にクリックされるアイテムや購入されるアイテムを予測できます。さらに、各アイテムの記述的特徴と対応するカテゴリーにより、この豊富なコンテキストを利用してユーザーの意図を有効活用できます。ここでは、これらのアイテムの特徴やアイテムの特徴カテゴリーをサイド情報と呼びます。

タイトルとURLをコピーしました