レコメンダシステムのための個人化ランキング
==========================================

前の節では、明示的フィードバックのみを考慮し、モデルは観測された評価値で学習・テストされていた。このような手法には2つの欠点がある。第1に、現実世界のシナリオではフィードバックの大半は明示的ではなく暗黙的であり、明示的フィードバックの収集にはより高いコストがかかることである。第2に、ユーザーの興味を予測するうえで有用である可能性のある、未観測のユーザー・アイテム対が完全に無視されてしまうため、評価値がランダムに欠損しているのではなく、ユーザーの嗜好によって欠損している場合には、これらの手法は適していない。未観測のユーザー・アイテム対は、実際の負のフィードバック（ユーザーがそのアイテムに興味を持っていない）と欠損値（将来そのアイテムと相互作用するかもしれない）の混合である。行列分解と
AutoRec
では、未観測の対を単純に無視していた。明らかに、これらのモデルは観測済み対と未観測対を区別できず、通常、個人化ランキングタスクには適していない。

このため、暗黙的フィードバックから順位付けされた推薦リストを生成することを目的とした推薦モデル群が人気を集めている。一般に、個人化ランキングモデルは
pointwise、pairwise、listwise
のいずれかのアプローチで最適化できる。Pointwise
アプローチは一度に1つの相互作用を考慮し、分類器または回帰器を学習して個々の嗜好を予測する。行列分解と
AutoRec は pointwise の目的関数で最適化される。Pairwise
アプローチは各ユーザーについてアイテムのペアを考慮し、そのペアに対する最適な順序を近似することを目指す。通常、pairwise
アプローチは、相対的な順序を予測することがランキングの本質に近いため、ランキングタスクにより適している。Listwise
アプローチは、アイテム全体のリストの順序を近似する。たとえば、Normalized
Discounted Cumulative Gain
(`NDCG <https://en.wikipedia.org/wiki/Discounted_cumulative_gain>`__)
のようなランキング指標を直接最適化する。ただし、listwise アプローチは
pointwise や pairwise
よりも複雑で計算コストが高くなる。この節では、2つの pairwise
目的関数／損失である Bayesian Personalized Ranking loss と Hinge
loss、およびそれぞれの実装を紹介する。

Bayesian Personalized Ranking Loss とその実装
---------------------------------------------

Bayesian personalized ranking (BPR)
:cite:`Rendle.Freudenthaler.Gantner.ea.2009`
は、最大事後推定量から導かれる pairwise
の個人化ランキング損失である。これは既存の多くの推薦モデルで広く用いられている。BPR
の学習データは、正例と負例（欠損値）の両方のペアから構成される。これは、ユーザーが正例アイテムを他のすべての未観測アイテムより好むと仮定する。

形式的には、学習データは :math:`(u, i, j)`
の形のタプルで構成され、これはユーザー :math:`u` がアイテム :math:`i`
をアイテム :math:`j`
より好むことを表す。事後確率を最大化することを目的とする BPR
のベイズ的定式化は次のように与えられる。

.. math::


   p(\Theta \mid >_u )  \propto  p(>_u \mid \Theta) p(\Theta)

ここで :math:`\Theta`
は任意の推薦モデルのパラメータを表し、\ :math:`>_u` はユーザー :math:`u`
に対する全アイテムの望ましい個人化された全順序を表す。最大事後推定量を定式化することで、個人化ランキングタスクの一般的な最適化基準を導ける。

.. math::


   \begin{aligned}
   \textrm{BPR-OPT} : &= \ln p(\Theta \mid >_u) \\
            & \propto \ln p(>_u \mid \Theta) p(\Theta) \\
            &= \ln \prod_{(u, i, j \in D)} \sigma(\hat{y}_{ui} - \hat{y}_{uj}) p(\Theta) \\
            &= \sum_{(u, i, j \in D)} \ln \sigma(\hat{y}_{ui} - \hat{y}_{uj}) + \ln p(\Theta) \\
            &= \sum_{(u, i, j \in D)} \ln \sigma(\hat{y}_{ui} - \hat{y}_{uj}) - \lambda_\Theta \|\Theta \|^2
   \end{aligned}

ここで
:math:`D \stackrel{\textrm{def}}{=} \{(u, i, j) \mid i \in I^+_u \wedge j \in I \backslash I^+_u \}`
は学習集合であり、\ :math:`I^+_u` はユーザー :math:`u`
が好んだアイテム、\ :math:`I` は全アイテム、\ :math:`I \backslash I^+_u`
はユーザーが好んだアイテムを除くその他すべてのアイテムを表す。\ :math:`\hat{y}_{ui}`
と :math:`\hat{y}_{uj}` は、それぞれユーザー :math:`u` に対するアイテム
:math:`i` と :math:`j` の予測スコアである。事前分布 :math:`p(\Theta)`
は、平均0、分散共分散行列 :math:`\Sigma_\Theta`
をもつ正規分布である。ここでは :math:`\Sigma_\Theta = \lambda_\Theta I`
とする。

|Illustration of Bayesian Personalized Ranking| 基底クラス
``mxnet.gluon.loss.Loss`` を実装し、\ ``forward``
メソッドをオーバーライドして Bayesian personalized ranking loss
を構成する。まず、Loss クラスと np モジュールをインポートする。

.. |Illustration of Bayesian Personalized Ranking| image:: ../img/rec-ranking.svg

BPR loss の実装は次のとおりである。

Hinge Loss とその実装
---------------------

ランキングのための Hinge loss は、SVM などの分類器でよく使われる gluon
ライブラリ提供の `hinge
loss <https://mxnet.incubator.apache.org/api/python/gluon/loss.html#mxnet.gluon.loss.HingeLoss>`__
とは異なる形をしている。レコメンダシステムにおけるランキング用の損失は、次の形をとりる。

.. math::


    \sum_{(u, i, j \in D)} \max( m - \hat{y}_{ui} + \hat{y}_{uj}, 0)

ここで :math:`m`
は安全マージンの大きさである。これは、負のアイテムを正のアイテムから遠ざけることを目的としている。BPR
と同様に、絶対的な出力ではなく正例と負例の相対的な距離を最適化しようとするため、レコメンダシステムに非常に適している。

これら2つの損失は、推薦における個人化ランキングで互換的に使用できる。

まとめ
------

-  レコメンダシステムにおける個人化ランキングタスクには、pointwise、pairwise、listwise
   の3種類のランキング損失がある。
-  2つの pairwise 損失である Bayesian personalized ranking loss と hinge
   loss は、互換的に使用できる。

演習
----

-  BPR と hinge loss には、利用可能な変種はあるか？
-  BPR または hinge loss を使用する推薦モデルを見つけられますか？