人工知能セミナー「情報の曖昧化」に出席してきたよ

2012-10-24 06:53

というわけで昨日の午後は標題のセミナーに出席してきた。

というわけで内容について滔々と書くべきなのかもしれんが、どちらかといえば聞いている間Twitterで話したりしたことをネタに書いてみようと思う。

まず京都大学の中村さんが「ネタバレ」について語る。インターネットが発達する前は、たとえばNFLのスーパーボールの結果を知りたくなければ、Nifty-serveのフォーラムで「情報規制」をすれば事足りた。

しかし今やWebやらTwitterやらFacebookでもってどこから情報が飛び込んでくるかわからない。しかし試合を見終わるまで結果がしりたくなければどうすればよいのか。

もちろんいろいろな手法で「ネタバレ情報」を検知することはできるが、所詮100%の精度は望めない。そこを例えば「似たような偽情報をたくさん散りばめる」などの方法で解決しようとするところが面白い。というか私が思うところの「アルゴリズムとインタラクションは車輪の両輪」からみれば見事な具現化である。

真面目な話は中村さんの論文を読んでもらうとして、強敵はTwitterである。断片的な言葉が飛び交うだけだから、フィルタリングのしようがないのだ。この点を質問したところ「その間はしょうがないからTwitterにアクセスしなかった」とのこと。私は「結局事前に"この人はいつもサッカーについてつぶやいている"という情報を元に、人で切るしかないのかな」とコメントした。

-------
2番めは信州大学小松氏による「情報の氾濫とユーザの認知的特性」人間の認知に関して、私のような素人にもちゃんとわかるように説明してくれたのがうれしい。

本題と少しそれるのだが、一番おもしろかったのが
「短期記憶では7くらいチャンクしか保持できない」
という実例だった。チャンクとは何か?これは情報の「固まり」である。

例をあげよう

SADOUOFTCONKOOM

だと覚えられないが

SOFTBANKAUDOCOMO

だとすぐ覚えられる。なぜかといえば、前者はランダムに並んでいるから文字数そのまま全部覚えなくては行けない。後者は、Softbank Au Docomoだから3つということ。

なぜこれを面白いと思ったかと言えば、「熟練者の認知と記憶」に関連していると思うからだ。

どういうことか?例えばサッカーに詳しい人は、私が見ても「みんな走ってるなあ」というような画面をみて「ここにスペースがある」とか「今のDFの動きはおかしい」と認識することができる。American Footballでも同様、あるいは将棋でも同じ事だ。

なぜこんなことができるのだろうか?思うに熟達した人は、いくつかのパターンを頭の中に持っているのではなかろうかね。でもってその「チャンク」がどのように組み合わさっているかだけを認識しているのだと。

とか考えているうちに話は進む。中村さんも引用していたが

「アガサ・クリスティーの本を、結末を教えた場合とそうでない場合でおもしろさを比較したが、おもしろさは変わらなかった」

という有名な論文があるらしい。小松氏のこの論文への反論が「被験者は、早く終えて謝礼をもらって帰ることばかり考えていたに違いない。だから、ネタバレが影響しなかったのだ」というものだった。これについては判断を差し控えたい。

しかし

そこから派生してこんなことを考えた。

刑事コロンボは、犯人は最初からネタバレしているわけだから、「どうやってあばかれるのか」がネタバレだったわけだなあ。あれはやっぱり最後のオチがばらされると面白さ半減なのだろうか。今みても面白いことはおもしろいが。

via: Twitter / grgr56: 刑事コロンボは、犯人は最初からネタバレしているわけだ ...

これに関しては、中村さんから以下のコメントが来た。

コロンボは何度見ても面白いですが,ワクワク感は薄れてますよね

via: Twitter / nakamura: コロンボは何度見ても面白いですが,ワクワク感は薄れて ...

ということで「おもしろさ」というものは非常に複合的なものであり、(特にアガサ・クリスティーの名作においては)それを単純に比較することはできない、というのが先ほどの論文が意味しているところではなかろうかなあ。

-----
次が東工大 高村氏による「自然言語処理技術による文書自動要約の基礎と応用可能性」
基本的には「自動要約」のお話。話の途中で「本来だったら、機械が文章の意味を理解して要約すればいいのですが、それができないので、表層的な手がかりでやるしかない」というコメントされていたように思う。

こういった面からも、自然言語処理とか文書処理というのはある程度行き詰まった領域なのかなあと素人は失礼な事を考えるのであた。Office2007にはあった「文章要約機能」がOffice2010から削除された、という。文書要約の必要性が薄れたとは思えないので、やはりいつまでたっても精度が向上しないという問題があったのだろう。


自然言語処理は結局のところ「コンピュータは意味を理解するのは無理」という大前提の上で、あれこれアルゴリズムをこねくり回しているのがここ数十年続いているように思う。となるとまたHALはどこに行った、、というボヤキになるのでここらへんでやめておく。

もう一つ印象的だったのが「リード法」という最初の数文をとる方法があり、新聞記事の漸くだとどんなすごいアルゴリズムを使ってもこれには勝てないのだそうな。これも結局新聞記事は「人間」が最初に要旨をもってくるということで「考えることは人間にしかできません」という事実に直面するわけだ。とかなんとか言っているが、こういうことを正直に述べる高村氏はすごいと思う。

と要約の話しを聞いているうち、こんなことをつぶやいた。

新幹線の扉の上に流れる文章にはいつも感心させられる。企業のCMになると途端に文体が変わることがわかる。企業CMを読んでいるとイライラする。

via: Twitter / grgr56: 新幹線の扉の上に流れる文章にはいつも感心させられる。 ...

と間髪をいれず中村氏から賛同のコメントをもらった。新幹線に流れるニュースというのは、実に見事に文を圧縮している。それを読んだあとに

「未来、創造、たのしさを作る企業。いつもわくわく●●から。●●電工」

とかいうどうしようもないバズワードの固まりのような文章を見せられるとイライラする。新幹線に広告を出している企業は、コンシューマー相手というよりはB toBで商売をしている企業が多いように思う。広告代理店に口車に乗せられているかどうかはしらんが、もう少し文章を考えたほうがいいと思う。

などと考えているうち話は終盤になる。情報要約と、曖昧化がどのように関連するかについて情報要約で最新のトピックが情報曖昧化に面白い形で応用できそうだ、という話は実に興味深かった。

-----

最後は大阪大学の土方氏である。まず「有害情報フィルタリング」と「ネタバレ防止」は全然違い、後者のほうがとても難しい、ということを力説する。例として挙げられた言葉を検索してみて驚いた。

JK.JC,ホ別イチゴで@三也

世の中にはいろいろな世界があるのだな。

でもってネタバレである。「イベントの詳細までは知りたくないが、何かが起こっていることだけを知りたい」という例であげられた研究がおもしろかった。しかしもっとインパクトがあったのが

「痛車イベント」

の実例だった。と言われても読んでいる側はなんともわからんわな。しかしあれは「痛い」
一昨年のインタラクションで、Tweetの時間変化と地理情報をマップしたものを観た。

カートグラムを用いた空間のアフォーダンスの可視化

これはすごい。やっていることは比較的シンプルで、GeoタグつきのTweetを数に応じて地図上にプロットしたもの。

何がすごいといって、(動画が見つけられないのが残念だが)本当に「都市が呼吸している」ように見えるのだ。朝が来ると人が集まる箇所がふくらみ、深夜にしぼむ。これを世界規模で見えるようにしたら、朝のウェーブとか、アフリカに広まる民主化の波が可視化できるのではないか。

via: ごんざれふ

この研究ともちょっと関連しているかもしれん。「通常の都市の呼吸」をデータとしてとっておき、そこからの逸脱を「突発的なイベント発生」として検知するととてもおもしろいのではなかろうかな、と自分で作るきがない人間は考えるのだった。

------
でもってその後パネルディスカッションがあった。聞いているうちに思いついたことを最後に質問した。

ネタバレ防止の技術は「まずい書き込み警告」に応用できないだろうか。読みたくない情報を検知できるのであれば、「誰かが読むとまずい情報」を書き込む際にも事前に検知できるだろう。最近Twitterが馬鹿発見器と化しているが、こうした「発言の安全性を増す」という方向性もあるのではなかろうか、と。

全くの思いつきのideaだが、それをちゃんと聞いてくれるところが、発表者さんたちのすごいところだなあと思う。

その後こんなTweetを観た。

情報の曖昧化は可視化の観点からも注目してます。曖昧化したい部位をわざと下手な手描き風で表示すると効果があるというユーザテスト結果も発表されてますw

via: Twitter / 1T0T: @nakamura @100kw ...

この発言の趣旨と合っているかどうか全くわからんのだが

「わざと情報を曖昧にすることで、注目を集め、人間の想像を掻き立てる」

という方向性もあるのではないだろうか、と思った。いわゆるプレゼンの「もんたメソッド」ですよ。文の一部が隠されていると「そこに何があるのだろう?」と思うでしょ?あるいはこの例(クリックすると品位に欠ける「とおもわれる」写真がでます。Parental Discretion Advised)

http://minus-k.com/nejitsu/loader/up198675.jpg
http://maimi.shigurui.com/maimi/maimie15825.jpg

これなどまさしく「情報を曖昧にすることで、人間の想像力をかき立てた」例だと思う。機械がどう頑張ったところで、人間の想像力を超えることはできんのだ。だったらどうやってその想像力を掻き立てるかを考えたほうがいいのではないか、、などと

といわけで、情報の曖昧化、というキーワードにはもっといろいろな可能性が秘められていると思うわけだ。

というわけで、聞いた話自体もためになったし、そこから派生して考えたことにもあれこれ広がりがあるように思う。こういう新しい分野が生まれる瞬間、というのは不安と可能性がごちゃまぜで楽しい時期でもあるな、と傍観者は思うのであった。

その後の懇親会にとても行きたかったのだが、いかんせんその日は、子供をお迎えに行ってご飯を食べさせなくてはならない日なのであった。大慌てで帰り、洗濯物をたたみ、ご飯の準備(温め直すだけ)をやって、、という日常がまた戻ってくる。