SiriとWatson


現在、iPhone4Sでのみ利用できるサービスの1つが“Siri”です。今回のiOS5の目玉機能であり、なおかつ日本語対応は2012年という点が非常に残念なのですが、大阪弁バージョンの動画で有名になったように“人間の自然言語を理解してくれアシスタント”なワケです。日本時間の10月5日午前2時にアップルのイベント終盤『One more Thing...』でその機能が明らかになり、自分がSiriを知ったのはその4時間後くらいの朝のニュースなのですが、「アレ?」と思ったのです。IBMの、もしくはそうでなくともエンタープライズ関係で仕事をしている方はIBMの“ワトソン”を思い出したのではないでしょうか。今日はやや脱線しますが、そんなワトソンとSiriに関してご紹介させて頂きます。


最初に申し上げますと、Watsonはオフラインで処理、Siriはクラウド上で処理をする点で大きく性質が異なっています。
このブログをご覧になっている方ならSiriはご存知の事かと思います。「今日は傘がいるかな?」という人間の言葉を理解して天気予報を示してくれたりするアレですな。
Watsonに関しましては「クイズ番組で優勝」で有名になったのでもしかするとご存知の方も多いかも知れませんな。IBMのサイトに載っているのでご覧ください。以下抜粋です。
クイズ番組に挑戦した IBM Watson - Japan

歴史的な1日となった2011年2月16日
2011年2月16日(米国時間)、コンピューターの歴史に新たな1ページが加わりました。IBMリサーチの4年間にわたる研究成果である質問応答(QA)システム「Watson(以下ワトソン)」が、米国の人気クイズ番組「Jeopardy!」(以下「ジョパディ!」)に挑戦し、2ゲームを通じて、ワトソンが最高金額を獲得しました。IBMは賞金100万ドルの全額を慈善事業に寄付します。ワトソンは研究者の英知の結集でもあり、「ジョパディ!」の勝者は「人間」である、と出場者たちは今回の対戦を締めくくっています。
ワトソンとは
ワトソンは、質問応答技術の更なる向上を目的に、自然言語処理技術をさらに進化させることを目的に設計されました。「ジョパディ!」で出題されるバラエティーに富んだ複雑な問題に対して、100万冊の本を読むのに相当する自然言語で書かれた情報の断片を分析し、短時間で最も適した解答を導き出す分析コンピューティング・システムです。この研究開発プロジェクトには、IBM東京基礎研究所からも2名の研究者が参加し、グローバルの技術力を結集して取り組んできました。
「ジョパディ!」への挑戦の意義
「ジョパディ!」は、歴史、文学から科学など幅広いジャンルを扱うクイズ番組として全米で親しまれています。出場者は短時間のうちに正確な解答を返すために、質問に含まれる微妙な意味、風刺や謎掛けなどの複雑な要素の分析をしなければなりません。本来、人間とは異なり、自然言語を正確に理解することのできないコンピューターにとっては大きな挑戦であり、質問応答技術の進歩に貢献できる格好のチャンスでもありました。
テクノロジーイノベーション
ワトソンは、システム設計と分析において技術を進歩させました。瞬時に複雑な質問文を解析して正しい解答を導かねばならないため、ワトソンのソフトウェアは、大量のタスクを処理できるよう最適化されたIBMのPOWER7〓サーバーで動作します。このシステムには、リアルタイムで情報を分析しながら莫大な量の並列タスクとデータを処理するという特殊な要求を満たすため、独自の技術が数多く取り入れられています。ワトソンは、Linuxが稼働する「IBM Power 750サーバー」のラック10本分、総メモリー容量15TB、総プロセッサー・コア数は2,880個で構成されており、インターネットには接続されていない完全に自己完結したシステムです。
今回の成果を実社会へ
ワトソンの研究開発プロジェクトは、非構造データ分析、自然言語処理、ワークロード最適化システムの設計分野におけるテクノロジーを前進させました。ワトソンを支える技術は、今後より迅速で正確な医療診断支援、潜在的な薬物間相互作用の検査、弁護士や裁判官による過去の判例の参照、金融分野の仮説シナリオと法令順守など、様々な分野への応用が期待されています。
IBMのチャレンジはこれからも続きます。この壮大なチャレンジは、私たち人類の生活や社会、地球を真に豊かに、よりスマートなものにするための支援につながると強く信じているからです。


現時点における能力は恐らくWatsonの方が優秀です。しかしSiriはiPhone側で行う処理は人間の言葉の解析とサーバーへの受け渡しまでであり(だからiPhone4S限定なのでしょう)、そこから実際に回答に辿り着くまでの処理はクラウドで行っているのです。つまり、今後Siriのクラウド側のバックグラウンドがWatsonのように成長すればするほどその可能性は無限大になるのです。
Watsonは2880個のPowerプロセッサを独り占めしてクイズのチャンピオンに勝利したということですが、ウン千万台のiPhoneから飛んでくる音声情報を同レベルで処理するとなると途方も無い資源が必要になるワケで・・・さらなる技術の向上に期待したいところですな。



ちなみにこのPowerプロセッサというのはIntelMac以前のメインであったPowerPCの流れを汲むものであり、妙な因縁を感じます。