「ぼかりす」について今の時点でわかっている事

2008-04-30 00:00



事の始まりは「はてなブックマーク」でこの動画を観た事だった。


<script type="text/javascript" src="http://ext.nicovideo.jp/thumb_watch/sm3128145" charset="utf-8"></script>


D


私のブックマークは4番目「この「声」はなんなんだ。釣りなのか?ブレークスルーなのか?」と書いた。本当にその正体がわからなかったのだ。




翌朝動画を訪れてみると、ほぼ正体が判明していた。インターネットの人力検索は偉大だ。




どうやらこれは、「VocaListener」(略して「ぼかりす」^^;)と呼ばれる技術が用いられているらしい。詳細は謎で、いったい何をどうしたらこうなるのかは皆目不明。とりあえずググッてみたところ、2008年5月28日(水)に開催される「第75回音楽情報科学研究会」で研究成果として発表されるらしい。また、うp主コメ欄には「これからもロングバージョンとか別の曲とか、どんどん投稿していきたいと思います・・・」と書いてあるので、詳細は次第に明らかになるかと思われ。これは大注目でつな。

>初音ミクみく 出た!科学の限界を超えた新技術「VocaListener」による神調教ミク!初音ミクみく 出た!科学の限界を超えた新技術「VocaListener」による神調教ミク!


First Authorが中野氏であることは承知した上で、これをやった人たちを「後藤一派」と表記させていただく。


「彼らの犯行」であることはまず間違いないと思う。なぜかと言えば、本歌がRWC研究用音楽データベースのものだからだ。普通にニコニコ動画とかみていても、まずこのRWCという言葉に出くわす事は無い。研究用途だからだ。


さて、いきなりここで話は「研究」について


私が研究にかかわっていたころ「花も実もあるインタフェースが目標」と言っていた。あるいは「素人を驚かせ、玄人をうならせる研究が目標」と。


私が自分でやったことは結局この域に達しなかったわけだが、後藤一派の研究は見事にこの言葉を実現している。この動画がニコニコで話題になっており、そして多分ほとんどの人がこれをまねできない事が何よりの証拠。


今の時点でこのVocaListenerの機能を推定してみる。


人間の歌唱から、Vocaloid用の「調教パラメータ」を抽出するプログラム。この抽出結果と、Vocaloidの通常入力(先ほどの動画で画面に表示されている類い)を合わせることで、Vocaloidに人間のような声で歌唱させることを可能とする。


となると(勝手に話を進めるが)頭に浮かぶ疑問はいくつかある。「玄人をうならせる」面では私にコメントのしようはないので「素人を喜ばせる」観点から書く。



これらは「素人が喜ぶかどうか」に大きく関わってくる事柄だ。この二つの質問に対する答えがNoであればそれは「神調教ツール」。公開されれば影響は計り知れない。しかし仮に質問への答えがYesであり、「初音ミクへのボイスチェンジャー」だとするとその有用性はかなり限定される。


この疑問はこれから他の楽曲がアップロードされるに従い、明らかになると思われる。最終的には研究会を待たねばならないが。


仮に今後RWCにある曲ばかりアップロードされるとすれば、このプログラムの有用性もその範囲、ということになる。


では「みくみく」の人間っぽい歌唱がアップロードされたらどうなるか?


私がツールを持っていれば「みくみくを歌ってみた」の中から上手なものを選び、そこからパラメータを抽出する。しかし真面目な研究者である後藤一派にはこれはできまい。みも知らぬ人の「歌ってみた」から勝手にパラメータを抽出して公開することは先ほど揚げた疑問から難しいのではなかろうか。


いずれにせよ今後の展開に要注目である。


---


後藤一派の研究は本当にすごいなあ。。俺は結局3流だったなあ。。