2014年度前期
「情報処理概論a」レポート(1)
期日、期日と表紙
- [提出場所]
- 授業中で回収
- [回収日]
- 2014年6月18日(水曜)
- [指定の表紙]をつかう
- ただし、剽窃(盗用)を行っていない旨の署名と日付を自筆で書くこと(レポートを書く参照)。
- [分量]
- 自分の提案が期待されている箇所(以下の論旨の3)にあるように、分かりやすく丁寧に説明することを求められているので、当然、ページ枚数は多くなる。
課題
意味論(semantic)なコンピュータ情報処理について、後で説明する論点について報告し、自分の考察を丁寧に述べなさい。
課題の背景にあるもの
人工知能
人工知能を学ぶための教科書の1つに1970年台に書かれた P.H. Winston(ウィンストン)の「人工知能」(培風館, 1980)は、1992年のArtificial Intelligence (3rd Edition)を経てもなお世界で最も広く読み続けられている名著である(最新は2005年の4版)。
そこに書かれている基本的なテーマはパターン認識であった。 パターン認識の1つに文字認識がある。 既に定められた枠内にある数字認識としての郵便番号は超高速で処理されている。 一方、活字文字認識は既に実用域に達している(99%--100文字で1文字を誤る--では全く実用的ではない。 実用のための99.99%--1万文字で1文字誤る(原稿用紙25枚で1文字)--以上の精度が必要)。 また、手書き文字列の認識については大いに研究が進んでいる。 CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)として、歪んだ文字列をユーザが読み取って入力するという方法は、パターン認識能力は人と(現在の)コンピュータを区別できるという前提に基づいている。 この認知バリアは、機械登録による登録乱用を避けるために広く利用されてきた。 しかし、Google MapsのStreet Viewの画像認識アルゴリズムがCAPTCHAのほとんどを解読にあるように、CAPTCHAを意図した文字列認識法ではもはや人の文字認識能力とコンピュータとの境目が消滅しつつあることを示している。
Winstonの「人工知能」では、パターン認識として、3次元に配置された物体の二次元画像(平面に描かれた絵)から、その物体間の相互位置関係を推論させることに焦点を当てている。ステレオ画像(左右の角度を持たせて写し取った平面図)を生成し視覚処理してから認識する(どのような処理が脳内でなされているのかが解明されている必要がある)のではなく、物体が複雑に配置された様子を写し取った1枚の平面図からでも、人は状況を理解した上でそれぞれの物体の前後関係を推定することができる(常に可能ではないが)。
このことは、パターン認識が「人の知能」に深く関係していることの証左であることを示唆している。 パターン認識は人工知能の基本問題であることを看破し、深く考察したWinstonの本が今も広く読まれる理由がここにある。 ただし、物体Aと物体Cの前後が論理的に特定できない場合があったり、人の経験が逆にアダとなって思わぬ誤りを犯す場合がある(計算錯覚学)。 パターン認識過程における「誤解」の発見は人の認知能力のありように鋭い光を当てるのである。
意味を求める人の認知
人の認知能力のさらに上位の概念には、人の「心」「精神」の領域があると多くの人々は信じて疑わない。 そのような分野の研究を心理学といい、一般には「知能」研究とは一線を画している。 心理学的現象を知能・認知のレベルから「科学的方法」によって解明できるとは限らないからだ(そもそも、知能の姿が科学的に解明され尽くしてもいないのが現状なのだが)。
「人は同じ現実に直面しても、自分が見たいものしか見ない」(これは、ユリウス・カエサル「自分の望むことを信じる」 『ガリア戦記』第3巻18節から派生して広く解釈され、使われてきたことばである)。 誰しもこの言葉が正しいと経験しているはずだ。 同じ世界に生き、同じ体験をしたとしても、ひとそれぞれに受け止め方が違うということは皆が知っていることである。 人は自分の体験から(パターン認識の場合のように)「論理」によって分析し、そこから「事実」を帰結するような認知過程だけで人生を体験していないのだ。
別な言い方をすると、人は体験から「意味」を取り出す能力があり、しかも同じ体験から取り出した「意味」は人によって違うのである。 なぜ、意味の取り出し方は人によって違うのだろうか。 それは人を人たらしめているその時々の心理状態や精神構造が違うからであるという、ほぼ否定しがたい根拠に拠って説明されている。 たとえば、それ自体では格別な意図によって作成されたのではない偶然的なパターン(インクのしみなど)を見せて得られる被験者の言語表現から、被験者の思考過程やその障害を推定できるとするロールシャッハ(Rorschach)テストはこうした人の個別的な意味作用を前提している。
パターンから生じる意味作用の分析は、たいへん高次の意味作用であるがゆえに「科学的」に精密化することはたいへん困難である。 意味作用の解明は、人の話す言語処理過程においてももっとも深く研究されており、すくなくない結果が得られている。 言語には、そこで登場する語と語の仕組みである統語論(構文論 syntax)がある。 さらに、その上位には言語が伝達する(または我々がそこから取り出す)意味論がある。 人は、自らの体験から生成される意味作用から自由であることはほぼ不可能である。 何かを認知したときには、かならず意味を生成してしまう(「美味しい」、「まずい」、「何も感じない」など)。 人はその認知活動、すなわち何かを体験し見たり聞いたりしたとき、あるいは言語的交流があるところには不可避的に意味を取り出してしまう存在である。
情報処理の行方
コンピュータの進歩は、より高速に、より小型に、より安価にコンピュータが提供されるだけでなく、より「賢い」処理のためのソフトウエア進歩とととに歩んできた。 これから先、コンピュータによる「処理」の姿はどうなるだろうか。 このときはたいへん興味深い。 人の認知活動をコンピュータで模倣(シミュレーション)したり、代替することができるのだろうか。
アメリカ計算機科学学会(ACM)は1970年から、コンピュータチェスプログラムの大会を開いてきた( )。 日本でもコンピュータ将棋協会によって世界大会が毎年開催されている。 こうしたコンピュータプログラムははたして「考えている」といえるのだろうか。
レポート課題の論旨
レポートは、以下の問いかけに詳しく説明するようにして構成される(非専門家に子供でも十分理解できるように丁寧に記載する)。
ただし、図書館やインターネットで資料を参考するのは当然であるが、文中の何処で参考資料を使ったのかを参考文献番号で明記し、レポート最後に参考にした全ての文献番号つきの参考文献リストを掲載すること(単にリストするだけでは不可。かならず、それらが本文中のどこで利用されたかを本文中で読者に分かるように文章・文体を工夫すること)。
1. 意味論的とは何か意味論とは何かを定義し、詳しく説明する。
2. 意味論的情報処理の必要性1.に基づいて、何故、意味論的情報処理が必要になってくるのかを分かりやすく丁寧に、しかも現実的な状況を設定して説明する。
3. 将来に期待される意味論的情報処理の具体例を3つ以上挙げる今のICTでは実現は難しいとしても、将来可能となれば有用だと思われる意味論的な情報処理の応用例を具体的に3つ以上挙げて、それぞれの応用例について a) どこが意味論的な処理であるのか、b) どうして有用なことなのか、c) どこかが難しい技術なのか、について丁寧に説明する。
この3.では、他の人のアイデアや提案を調べるのではなく、自分の現在の不満や課題・体験に基づいて考えるようにすることが求められている。
4. 報告や考察に利用した全ての資料についての番号付き参考文献リストただし、その資料を使った本文箇所では、例外なく、文献番号で引用した旨を明記すること(参考:参考文献情報は必須である)。 参考文献リストだけでは不可(評価せず)。可能な限り、1次資料を探し、伝聞に基づくような資料は不可(評価せず)。
レポートの書式
レポートを書くに準ずる。 体裁や書式の不適レポートは評価せず。 標準的レポート書式がどのようなものであるのかを身につけていることは、今後あらゆる局面で大切なことである。 この機会に身につけよう。