協調フィルタリングとコンテンツフィルタリング

2009-07-14 06:50

というわけで情報推薦には、大別して協調フィルタリングとコンテンツフィルタリングがある。(土方さんの文書受け売り)

平たくいえば

・コンテンツフィルタリング:推薦するものの中身を見て、どうしようか考える
・協調フィルタリング:あんたと似た人これ好きみたいだから、どう?中身がなんだか知らないけど

両者のハイブリッドがあったり、いや、結局両方重要なのだ、という考え方もあるが、Amazonで使っているのは協調フィルタリング出し、例えば楽曲推薦だと協調フィルタリングの圧勝である。

これは何を意味しているかといえば



人間にとって"面白いもの"が理解できるのは人間しかいない



ということではなかろうか。

推薦するものの中身を見て、あーだこーだとルールを定義したりしたところで結局"あんたと似た人はこれが好きだよ"に勝てない。つまりなぜそれを好むかを推薦対象の中身から推定することはできない、ということなのだ。

人口知能という言葉は定義がはっきりしないから"いや、協調フィルタリングも人口知能である"ともいえるのだろうけど、"人間の知能をあれこれプログラムしてコンピューターの中に再現させる"ことを夢見ていた人たちにとっては、昨今の現実はひどく気がめいるものではなかろうか。

ゲシュタルト崩壊の"ゲシュタルト"がなんであるかについて人間はほとんど知らないままである。であるから、コンテンツの要素から"面白さ"につながる橋はあることだけはわかっているが手掛かりすら見つからない。

この認識を根底に持って置くことは重要だと思う。音声認識の精度はいつまでも実用レベルに達しないが、ここにも同じ問題がある、、とか結構



育てればものになる分野と、天井が見えている分野



の区別をつけるために必要な考えだと思うのだけど。

-----------------
はて、なんでこんなこと書いているのだ。私。

疲れたSIerの窓際がこんなこと書いてなんになるのか