Podcast 検索エンジン

ついに音声検索エンジンが登場。TVEyes launches Podscope, first spoken word index and search engine[TUAW] によると、

Enter Podscope. Podscope is a service of TVEyes that plans to index every single word in every single podcast by every single "known" (to whom?) podcaster by the end of August. It's like Google for podcast content. Now that's a lofty goal.

とある。実際に Podscope にいって、適当な単語を検索してみたところ、一応それなりに検索できるようだ。音声認識の精度は今後向上するとして、検索精度をどう向上させるかが課題だろう。Google でいうところの PageRank のようなものは音声データに適用できるのだろうか。HTML の link のような明確なタグは音声データにはないので、別の視点から検索精度を向上させる必要があるかもしれない。

もちろん Podcast を配信しているページに関しては従来の技術が適用できるから、まずはそこから始めるべきかもしれないが、音声データならではの何らかのキーを見つけ出せると面白い。