WISS2012に行ってきたよ(その2)

2012-12-11 06:48

というわけで、WISS2012で見聞きした研究について。

VocaRefiner: 歌を歌って歌い直して統合できる新しい歌声生成インタフェース
中野倫靖,後藤真孝(産総研)
音楽制作における歌声パートの生成において、気に入らない箇所を何度も歌い直して統合できるインタラクティブシステムVocaRefiner(ボーカリファイナー)を提案する。VocaRefinerでは、複数回の歌唱それぞれについて、音素の時刻と音の三要素(音高・音量・音色)を推定し、音素と三要素単位で一つの歌声へ統合できる。さらに、それらの要素を時間軸上で伸縮したり、個別に補正したりするインタラクションも可能とする。

via: プログラム - WISS2012

いや、これはものすごい。自分で歌を歌っていて、音程は正しかったが歌詞を間違えた、あるいはその逆でも、個別に編集できるのだ。「歌ってみた」を作る人にとっては、必携のツールである。

後藤さん達がこのように素晴らしい成果を発表できるには、やはり明確な「将来像」というビジョンがあり、それに向けて一歩一歩積み重ねを行なっているからだと思う。そうした「理念」を説く人は多いが、実際にやってみせることができる人は滅多にいない。

産総研からのもう一件発表Songriumについては別途項を改めて書きます。

TimeFiller:生活を無理なくコンテンツで満たすメディアプラットフォーム
渡邊 恵太(JST ERATO),石川 直樹(農工大),栗原 一貴(産総研),稲見昌彦(慶大/JST ERATO),五十嵐健夫(東大/JST ERATO)
録画装置や映像配信によっていつでも好みの映像を見られる環境が実現した。 一方で視聴時間の確保が難しい。今日「何を見るか」より「いつ見るか」が課題である。ユーザはコンテンツへのアクセスが比較的自由になった一方で日常生活の時間制約からは自由になれていない。本研究ではユーザの時間の制約を解消しながら見たいコンテンツとの接点を無理なく拡大する環境 TimeFiller を提案する。

via: プログラム - WISS2012

私が認識している範囲で(このもって回った言い方の説明はあとでします)最もチャットで議論が沸騰した研究。プレゼンを観た限り

「スケジュール帳で、開いているところに全部TVの番組を埋める」

というシステムに見えた。そうまでしてTVを見たいのだろうか?考える時間はどうする、とかなんとかチャットは大騒ぎである。

彼が届けたかったメインメッセージは

「コンテンツではなく、空き時間に応じた情報推薦を」

ということでありそれは同意できるのだが、だからといってスケジュール帳の開いているところに全部TVを突っ込まれても困る。しかし最近の渡邊氏の研究を見ていると、あえてそうした議論を呼ぶ方向を狙っているようにも思える。

Lighty: ロボティック照明のためのペインティングインタフェース
橋本 直(JST ERATO),盧 承鐸,山中 太記(東大/JST ERATO),神山 洋一(JST ERATO),稲見 昌彦(慶大/JST ERATO),五十嵐 健夫(東大/JST ERATO)
室内の輝度分布をペインティングによって自在にデザインできる「Lighty」というシステムを提案する.Lightyは明るさと方向を制御可能なロボティック照明群とタブレットデバイスを用いたペインティングインタフェースから構成される.ユーザは所望の輝度分布を天井カメラのライブ映像上でペイントすることによって指定できる.システムの概要について説明し,プロトタイプ上で行った被験者実験の結果について報告する.

via: プログラム - WISS2012

この研究は、その内容もさることながら用途についてあれこれ議論が巻き起こった。例えばこうだ。私の部屋の天井照明はLEDでもってあれこれ調節ができるのだが、気が付けば基本的なON/OFFしか使っていない。それはなぜだろう。このように調節ができるとどんな場所で使えるのだろう、とかなんとか。

個人的には、こうした照明はそれこそ「自然なジェスチャー」で入力できたり制御できたりせんか、と思う。ここで「自然なジェスチャー」というのはKinectとかではないよ。それこそジェスチャー認識のブレークスルーが必要なところだ。

この「室内の照明の制御インタフェース」というのは古くて新しい話題だ。つまり既存の「スイッチを四角に並べた」インタフェースがゴミだというのは誰もが考えている。しかしいつまでたっても改善されない。まだまだ議論とideaが出そうな分野だと思う。

Squama: プログラマブルな建築のための構成要素
暦本 純一(東大/ソニーCSL)
建築空間がその物理的な特性を動的に変化させるようになるというビジョン「プログラマブル建築」を提案し,その構成要素として部分的に透明度を制御できるプログラマブルな壁面あるいは窓システムについて報告する。眺望をたもちながらも見たくない/見せたくないものだけを居住者の視点に基づいて選択的にマスクする「実世界モザイク」や、居住空間の採光を影の指定によって定義する「プログラマブルな影」などの応用が可能になる。

via: プログラム - WISS2012

ガラス面が、全体的にすりガラスになったり透明になったりというのは既に実用化されている。ここで提唱されているのは、それが部分的に行えるもの。

「プログラマブル建築」というビジョンを明確な姿として提案したのが興味深い発表だった。論文賞も納得。私が一番いいな、とおもったのは

「ホテルのカフェなどで、人がいるところに影を作る」

という用途だが。

もう一つ印象的だったのが「最近TVの価格が下落し、高級ガラスより安くなっている」という言葉。つまり壁面全体がTVのような液晶であっても構わないわけだ。

Panasonicから参加されていた人は、この意見に不満のようだったが、チンピラサラリーマンからすれば「どうせTV作っても儲からないんだから、いっそ建材にしては」とも思う。

KikuNavi: 集合知に基づいた歩行者用リアルタイムナビゲーションシステム
長坂 瑛(電通大),岡部 誠(電通大/JST PRESTO),尾内 理紀夫(電通大)
SNSによって築かれた友人関係の集合知を利用することで、より広範囲な問題を解決できるリアルタイムな歩行者ナビゲーションを提案する。本研究において、我々は次の2点について議論を希望する。・事業化という観点から提案システムを実運用するための課題は何か。・SNSの普及によって人の繋がり方が空間的、心理的にどう変化したか。

via: プログラム - WISS2012

ものすごく単純に言えば「行き方がわからなければ、SNSで知り合いに聞けばいいじゃん」というものである。これはその内容よりチャットの盛り上がりが興味ぶかかった。

「友達いないし」

このあとも何度か繰り返されることになるのだが、「僕は友達が少ない」人にとってSNSでどうとか言われても困る。もちろん私の数少ない有人は助けてくれようとするだろうが、絶対数が少ないのでリアルタイムに助けが来る可能性は限りなく低い。

というわけでWISS2012では「僕は友達が少ない」ネタは鉄板となったのであった。今にして思うのだが、一時お茶大から発信されていた「遠距離恋愛支援システム」など発表されていたらチャットはどうなっていたんだろうか。というかそれが発表された時私参加していたのだがチャットの様子を覚えていない。もはや

「僕には彼女がいない」

と言う気力もなく沈黙していたのかもしれん。


以下デモ発表。

家事を楽しくするための家電装着型ロボット:大野敬子(お茶大),塚田浩二 (JST),椎尾一郎(お茶大)

via: デモ - WISS2012

マグネットで小さなロボットを家電に装着する。でもってロボットがその家電の特性にあった動きをしてくれる。そうすれば家事が楽しくなるだろう、というもの。

他のお茶大の発表にも共通して言えることだが、機構の実装に力点が置かれすぎている印象がある。何が言いたいかというと

「家事を楽しくするロボットはどんな動きをするべきか」

というところにフォーカスしたほうがいいと思うのだ。人間は決まりきった動きをするロボットにすぐ飽きてしまう。人を飽きずに楽しませる。フォーカスしたほうがユニークな研究になると思うのだけどね。実装勝負ではそれこそ高専には勝てん。

見せてくれた例では、ダイソンの掃除に人形をつけると、進む方向に応じて「ひゅーん」と体を傾けてくれる、というのは楽しかった。しかしそれが持続する楽しさかどうかについては考える必要がある。

表現を和らげてネガティブ感情伝染を防止するブラウザ:大家眸美(明治大),宮下芳明(明治大)

via: デモ - WISS2012

例えば誰かが「死にたい」などとTwitterに書き込むと、そうしたネガティブな気分が伝染する。これはいけない。というわけでこのようなネガティブな表現を自動的に

「まだ生きてる!」

とかに書き換えてしまおう、というシステム。知識の獲得を集合知で集めるのが今風だ。

これについてはあれこれ考えさせられた。確かに誰かが「死にたい」などと書くと周りの気分が悪くなる。しかし書いた本人はどうなのか?なぜそんなことを書くかといえば「かまってほしい」という気持ちの屈折した表現である場合もある、ように思う。

リグレトというサイトがある。負の感情をぶつけるとそれに人があれこれ書いてくれるというものだ。何度か会社の愚痴とか書いたが

「ドンマイ!」「まだ大丈夫!」

とか見知らぬ人に言われると無性に腹がたつことに気がついた。そう考えるとネガティブな表現を自動的に書き換えることにより、書いた本人の鬱屈した気持ちがどこに行くのかが心配だ。書いた本人はそうした書き換えをされて楽しいのだろうか?

かまってほしい、でも周りにネガティブな気分をばらまきたくない、というのであれば書き換えではなく伏字でどうか、と提案した。つまり「●にたい」というやつである。直接読まないが周りは伏字になっていることから、何かまずい心理状態である事をしる、とかなんとか。

いかん。だいぶ削ったのにまだ一日目ではないか。とはいっても二日目以降はとっても簡略化される予定。何故かというと自分の発表の緊張感でよれよれになっていて人の話しを聞いてなかったからである。