題名:Java Diary-70章

五郎の 入り口に戻る

日付:2006/2/27

目次に戻る


Goromi-TV Part7 & Gards part2

着想を得たのは→5/26(木曜日)出張に行く日の朝 バスを待ちながら青空を眺めているとき そうだ。今度のアプリケーションはローカルにデータをもっているからそれができるんだ。 それがもっと結合できると気がついたのは6/1(水曜)に連想検索エンジンGETAについて調べていたとき。これをおそらくもっと簡便な方法で実現できる はずだ。(精度を気にしなければ)実際そのときは「お昼検索システム」でSVMを用いた小数データからの嗜好抽出が動き始めていたときであった。 どっちにしろ正しくないのだから、直感的に判断できるデータを大量に提示することで、より早くユーザーの興味を収束させることができるのではないか。

というのが私のPCに残っていたメモである。いきなりこんなこと書かれても私以外の人間にとっては何のことかわからぬだろうし、私 にだってよくわからん。しかしなんとか記憶を発掘し適当に脚色するとこんなことになる。

元々のGoromiというのはあくまでも単語を使って検索を行うものであった。こーんな単語とこーんな単語、と指定することはでき るが、それをやっていると

「このページ(というか題名と写真)に似た物」

というような指定をしたくなる。しかしGoromiの裏で動いているのは所詮Googleなので、その「類似ページ指定検索」をど のようにやればよいのかわからない。だから知らんぷりをしていた。

しかしGoromi-TVではそれを避けることはできない。というか単語使って検索もいいけど、やっぱり「これいい。これイヤ」的 ないいかげんな探索もできなければならぬのではないだろうか。とはいってもどうしたものやら、と考えているうちにふと思いついたのである。Gardsで使っている方法を応用すればいいではないか、と。

この方法はGoromiのような検索エンジン上のデータ(及びそれがさしているWebページ)には応用できない。何故なら検索の対象となるデータ については事前にはなんにもわからないからだ。(それをやろうとすればGoogleのシステム内で行う必要がある)しかし今回使おうとしているデータは全 て(少なくとも検索の対象となるものは)ローカルのハードディスク上にあるのが前提だからそんな心配をしなくてよい。

というわけで頭の中で話はまとまる。そして別個の裏プロジェクトだった渋谷お昼検索とGoromi-TVも一つにまとまることになり、「未踏ソフトの開発が遅れるのではないか」という心の叫びに蓋をして渋 谷お昼検索の開発、論文書きにいそしむことができるわけだ、、と強引に理屈をつけたところで話は2005年のWISSになる。

去年発表して結構好評だった、と自分では日記に書いた。簡単に調子に乗る私は今年も出したいと思う。ネタは開発中の渋谷お昼検索である。論文の締め切りは8月30日、ということ でその前にあれこれやりだす。論文募集要領がサイトに掲載された。ほれほれと見てみるとどうやら今年はLaTexというもので書かなくてはいけないらしい。 (去年はWordでもよかったのだが)うげげげ。このLaTexというのは今まで
「あちこちでよく聞くけど、なんだかめんどうみたいだなあ」
と思って避けて通ってきたものだ。しかしどうやらそんなことは言っていられないようだ。

というわけでネットであれこれ調べLaTexの使い方を調べる。数ページ見てダウンロードをあれこれしてまず分かったのは

「Texで文章を書き、提出するためにはたくさんのプログラムファイルを組み合わせて使う必要が有る」

ということだ。つまりMicrosoft Wordのように単一のアプリケーションがあり、それをインストール、ばしゃばしゃキーを叩けば出来 上がり、というものではないらしい。というわけであれこれ読みながらプログラムのインストールを試みる。そのうちあまりに面倒なので、

「ひょっとしたらMacでやったほうが楽なのか」

などと考えてみるが、それほど世の中はうまくできていない。やっぱり面倒なのだ。7月12日、某所に私はこう書いた

「よんどころない事情があってLatexというものを使おうと悪戦苦闘している。

これの存在価値はわかってきたのだが、如何せんまともに動いてくれない。普通の人はどうしているのかな。。  」

それに対して有る人はこう書いた

「論文ですか?
Latexは大昔から近くに使いこなしている人がいないと初めての人は使えないというものでした... 」

左様であるか。とはいっても近くに使いこなしている人いそうもないし。ええい、なんとかならんかなあ、とあれこれやっていたらそのうち動くようになった。いざ動き出して みると確かにこれは快適だ。原稿を書くのはまるでHTMLか何かを書いているように感じる。タグのようなものがあって、それをちゃんと指定しておけばあと はプログラムがちゃんとした原稿にしてくれる。慣れてくると確かにWordでレイアウトと格闘するよりましな気がしてくる。特に参考文献の作り方は 感動してしまった。参考文献欄にはやれ名前は頭文字だけだとか掲載された文書の題名はどうする、だとか細かい規則がたくさんある。それを一度に直すのは大変 なのだが、これはデータだけ定義してやればよい。整形のほうはプログラムが一括してやってくれる、ということでついさっきまでLaTexの神様をのろっていた 私はいきなり「それなりに」LaTexのファンになる。

というわけでがりがり書いて、提出、とする前に自分で何度か読み返す。前に出したときは誤字をいくつか指摘された。今度こそはと思いチェックすると時分でもいくつか誤字が見つかる。それどころか問題点も見つかる。しくしく泣いている暇があれば書き直さなくてはならない。

提出にあたってはもう一つ難物があった。ビデオである。私が作るものは人が見て触るものだから、文章だけでは何のことやらわからん。というわけでビデオが 必須なのだが、これがとても面倒である。去年はビデオの作り方もしらなかったので、会議室のプロジェクターに画面を映し出し、それを手持ちのデジカメで録 画したものを提出した。今から考えればよくあれで見てくれたものだと思う。その後いろいろなカンファレンスで配布されるビデオを見てそれではいかん、とい うということに気がついた。もっとちゃんと作らなくちゃ。

さて、ここで問題です。コンピュータで操作している様子をビデオに取るためにはどうすればいいでしょう。調べてみるとスキャンコンバーターなるものがありそれを 使えばいいのだそうな。というわけでさっそく注文したのが8月の17日。早く届かないかな。届いたらこうやってビデオを作るんだ、と構想だけは立てるのだ が、物がなかなか届かない。8月22日の月曜日、会社に行ってみればなにやらメールが届いている。読んでみれば

「誠に申し訳ございませんがご注文いただいた以下の商品がまだ確保
できておりません。
  "SSC120EX ダウンスキャンコンバーター"
       [エレクトロニクス]
   商品の発送が1‾2週間ほど遅れます。」


私はがびーんとなる。締め切りはもう一週間後に迫っているというのに、この始末。これから別の機種を頼んだとしてそれからビデオを編集し、、などとやって間に合うのだろうか。思えばスキャンコンバーターを注文するところでうじうじ考えたのがいけなかった。ええい。

と泣いていてもしょうがない。なんとか代替手段はないか、と考えてあることに思い当たった。会社にあるThinkPadからはHi-8のビデオ出力が取れ るはずではないか。あれをビデオにつっこめば映像が取れるのではないか。さっそくThink Padにプログラムを移す。動かしてみるととてもいやな予感がする。なんだかとっても遅い。多少遅いほうが説明用にはいいのさ、などと自分をだまそうとす るがうまくいかない。

そのうち「解像度が細かすぎるのでは」と気がつきもっと大まかな解像度で表示する。するとそれなりの速度で動き出しほっとする。さて、その出力をビデオに つなぎ、というところでも結構手間取ったのだが(ビデオの操作がわからなかったのだ)なんとかビデオに録画できた。さて、これでMac miniで取り込みiMovieで編集すればおしまいだ、とはならなかった。

毎度のことながらiMovieの操作性はすばらしい。なーんとなく使っていてもそれなりのビデオができあがる。問題はその後だった。去年は何も考えず Quicktimeフォーマットで提出していた。しかし今年はサイトにあった以下の文句(この文句が去年あったかどうか覚えていないのだが)がとても気に なっていた。いわく

「すべての査読者がデモビデオを必ず見るとは限りません。できるだけ多くの差読者のコンピュータ環境で見られるように、MPEG-1などの標準的なファイルフォーマットで、なおかつ手頃なファイルサイズにして提出されることをお勧めします。」


さて、問題です。このムービーをどうやったらMPEG-1もしくはWindows,Macを使っている人が「●●をインストール」とか面倒なことをせずに見られるようなフォーマットに変換できるでしょう。ここから私の動画フォーマットとの戦いが始まったのである。

まずは一番どこでも見ることができるMPEG-1への変換を試みる。あれこれユーティリティを探しほれほれ、とできあがった。さて見てみようと思いダブル クリックしてぎょっとする。画像がとても荒いのだ。なーんとなく何が動いているかわかる程度であり、とても詳細まではわからない。これはいかなることか。

私は未だにMPEG-NのNが変わると何が変わるかよく知らないままなのだが、MPEG-1というのはその定義によって解像度が低く抑えられてしまうので はないかと思う。何故こう書くかといえば、いろいろなユーティリティをつかってMPEG-1を作成してもどれもこれも荒い絵になってしまうからだ。という わけでMPEG-1は没。

次に試みたのはAVIと呼ばれるフォーマットだった。これはWIndowsではメジャーなようだが、Macではマイナーである。しかし物によっては(ここ が問題なのだが)Quicktimeで再生できるようだ。というわけであれこれ作ってみる。しかしどうやっても「WIndowsでもMacでもダブルク リックでOK」とはならない。そもそもAVIという名前で呼ばれているものの中にもずいぶんと種類があるらしいのだ。

というわけで次にはMPEG-4というのをやってみる。しかしこれでも目的は達成されない。そもそもMPEG-4とはいいながらこーデックがたくさんあっ たり(このコーデックというのが何かは気にしないとして)ややこしいことおびただしい。最終的に一つだけうまくいくパターンを見つけた。もうこれでいい や、と割り切ってしまう。しかし問題はちゃんと残っている。ファイルのサイズがでかいのだ。20MB以上もある。短気な人なら

「こんなものダウンロードしていられるか」

と切れてしまい見てくれないかもしれない。というわけで一旦割り切ったつもりでもまたあれこれトライし、やっぱりうまくいかず、、、とビデオの準備(の フォーマット変換)だけでずいぶん時間を使ってしまった。そういう不毛な作業の中にも一つの慰めがある。例のスキャンコンバーターに早めに見切りをつけた のは正解だった。締め切り間際になってビデオを作り始めていたらどうなっていたかわからない、と。

などとすったもんだのあげく、なんとか論文を提出することができた。となるともうできることはあまりない。9月30日と明示されている査読結果通知の日ま でのんびり、、などとしている場合ではない。Goromi-TVのほうをあれこれいじりながらも日は過ぎていく。

前の章 | 次の章


注釈