意味論的(語用論)的情報への量的アプローチ

こんにちは。昼ゼミ2年の青木です。今年成人式を迎えましたが、若干はしゃぎすぎてしまったことを反省しつつ、今年1年慎重に頑張っていきたいと思います。
さて、今回は自分が興味ある語用論等に関係すると考え、読んだ論文について報告します。

加藤雅人(2005)「意味論的情報の可能性と限界」『関西大学総合情報学部紀要』第23号 pp.37-50.

この論文では、「情報」という概念を、意味論の対象とする質的概念と情報理論の対象とする量的概念に区別し、その関係性について、「意外性」という概念を用い情報理論をもとに質的情報の量化を考察している。そしてそれが可能なのは、(1)音素や文字などの非意味論レベル、(2)形態素、語、文などの意味論レベル、(3)、実際の使用という語用論レベルという三つのうち、(1)のレベルに限定されると指摘している。以下、各概念の説明とともに加藤が考察した内容をまとめていく。

加藤は、まず「情報」を質的側面から捉えると、(1)コミュニケーション(伝達)(2)『ニュース』の伝達を意味し、「情報」はデータの集まりといった静的な名詞的概念ではなく、「伝達し、他者に共有化させること」すなわち「知らせる」という動的な動詞的概念であるとし、受け手にとって情報性を有するのはニュース(新情報的)価値をもつメッセージのみであるとした。つまり、メッセージの情報価値を決定する要因には、発信者の意図や受信者の理解度といったコミュニケーション次元における語用論的要素も関連しているということであると、加藤は述べている。

次に、情報を量的側面から捉えた場合(情報理論)、情報はメッセージの「確率的特性」とみなされ、意味とは無関係なものと規定されるとしている。ある信号が情報を持つのは、「その代わりに出現しうる代替信号を排除する限りにおいて」であるとし、具体的意味を加藤が用いた例を挙げ説明すると次のようになる。
“Give me the a-”という断片的メッセージにおいて、「a-」という文字には何の意味もないが、それは「a-以外の文字で始まるその他の語」を排除する。さらにapr-の後に-icotが出現しとたき-icotはapr-に比べて情報量は遥かに少ない。というのも英語においてapr-で始まる語はapricotかapronの二つ(確率は50%)しかなく、排除量が極めて少ないからである。
・「a-」=「a-以外の文字で始まるその他の語」を排除
・「ap-」=「ap-以外の文字で始まるその他の語」を排除
以上のように、メッセージの確率論的特性が情報の量化を決定する鍵となっているとした。

続いて、「情報」の二つの側面を踏まえ共通点を続いて述べている。質的概念としての情報の鍵は「ニュース性」であり、既知のものや予想通りのものは情報価値をもっていないことから、「意外性」と言い換えができる。一方、量的概念として情報の鍵を握るのも、予想される出現確率の低い信号(意外な信号)ほど多くの情報価値をもっているとする、「意外性」である。すなわち、情報とはどちらにせよ、メッセージの「意外性」の尺度であり、質的情報、量的情報はこの「意外性」という概念に通底していると、加藤は考察している。

以上のように「情報」の質的概念、量的概念に共通性があることから、加藤はさらに情報理論をもとに質的側面(言語)の量化を試みている。言語の量化をする上で、その適用は三つのレベルで適用する必要があるとして、(1)音素や文字という非意味論レベル、(2)語や形態素そして文という意味論レベル、(3)言語の実際の使用という語用論(コミュケーション)レベルに分けている。
(1)の場合、加藤は、個々の音素や文字の出現頻度、それらの組み合わせや語の中でも占める位置という文脈条件が情報値を決定するとし、量化可能であると述べている。すなわち音素の使用頻度や、音素の組み合わせ、文脈条件(例:英語の場合、qの後にuが来ることがほぼ100%決まっている)により、情報理論に基づく(1)の量化が可能であるということである。
(2)、(3)の場合、言語の量化は容易ではないとして、加藤は意味論的情報への量的アプローチの限界を考察している。(2)において、自然言語は意味論レベルにおいて、話者の語彙や言語レパートリの多様性が情報値に影響を与え、さらに個人の情報空間を数値化するのは困難であるため、量化は可能ではないということである。「個人の情報空間」とは、メッセージに対する「関心」や「信念」の強さ、メッセージの「有用性」や「信頼性」の程度、メッセージの「新しさ」や「確かさ」の程度であるとし、(3)においても同様に個人の情報空間の数値化という問題が量化の可能性を阻んでいるとしている。また、(3)では、情報の受信者の期待、好奇心、退屈、驚き、緊張、不安について量化することも不可能であるため、情報理論の語用論レベルの適用が困難であるとしている。

以上、加藤の考察を述べたが、自然言語を数値化・量化する試みに非常に興味を持った。また、情報理論からみる意味論・語用論レベルにおける個人の情報空間の数値化が困難であることから、意味や語用論が拡がりを持ち、曖昧な表現やポライトネスなど多彩な表現があるということが分かった。一方で、加藤のコミュニケーションにおける「情報」についても考察が必要であると感じた。