@Author Masasi.Sanae @Version 1.02;2002.3.16
情報化社会においては発信者から受信者への情報の伝達が重要な役割を果たします。更にその情報の伝達を如何に効率よく行うか,如何に正確に行うかが重要となります。そうした分野を対象としているのが「情報理論」と呼ばれているものです。
情報理論を支えているのが数学の確率・統計に関する基本的な理論です。身の回りを取り巻くディジタルな世界を情報理論を通して解析し,実生活に直結する話題であることを体感してみましょう。
1_1 集合
あるものの集まりを集合という。集合は要素(元)から成り立っている。
A={a1,a2,a3,・・・an}
任意の集合Sの要素の一つをxとするとき,xは集合Sに属するといいx∈Sのように表す。また,要素のない集合を空集合といい,φで表す。
集合Aの要素が全て集合Bの要素であるとき,集合AはBの部分集合であるといいA⊂Bで表す。2つの集合A,Bに対して,次の集合演算を定義する。
(例)A={1,2,3,4,5} B={0,1,2,3}
1_2 試行と事象
結果が確率的である行為を試行といい,試行を何度も行ったつながりを試行列という。
起こりうる全ての試行列の集合を標本空間という。また,標本空間Sの部分集合を事象という。
(例)サイコロを1回振る。事象Eiを次のように定める。
Ei:目iが出る事象 (i=1,2,…6)
1_3 事象の演算
2つの事象A,Bに対して,次のような演算を定義する。
2つの事象A,Bの間に共通部分がない場合(A∩B=φ),A,Bは排反であるという。
(例)サイコロを1回振るとき,事象Ei,A,Bを次の様に定める。
Ei:目iが出る事象 (i=1,2,…6) A:偶数の目が出る B:5以上の目が出る
1_4 確率の定義
n個の事象からなる標本空間SをS={E1,E2,E3,…,En}とする。n個の事象Eiの起こりやすさは同様に確からしいとする。
事象Aは標本空間Sの中のm個の要素からなるとする。このとき事象Aの起きる確率を
P(A)=m/n
で定める。このとき余事象Acの起こる確率は,次の様になる。
Ac=1-P(A)
(例)サイコロを1回振るとき,事象Ei,Aを次の様に定める。
Ei:目iが出る事象 (i=1,2,…6) A:偶数の目が出る B:5以上の目が出る
1_5 完全事象系
互いに排反なn個の事象からなる標本空間S={E1,E2,E3,…,En}に対して,各事象の生起確率をP(E1),P(E2),P(E3),…,P(En)とする。
Σ P(Ei)=1
が成り立つとき,Sを完全事象系といい次のように表す。
| S= | ( | E1 | E2 | ・・・ | En | ) |
| P(E1) | P(E2) | ・・・ | P(En) |
(例)サイコロを1回振るとき,目iが出る事象をEi(i=1,2,…6)とする。標本空間S={E1,E2,E3,…,E6}は完全事象系である。
1_6 乗法定理
2つの事象A,Bを,この順で試行する。このときAが起こったことがわかっているときのBの起こる確率を,条件付確率といいP(B|A)で表す。
2つの事象A,Bの積(A,Bがともに起こる)確率を結合確率といいP(A∩B)で表す。条件付確率と結合確率の間には,次の関係式が成り立つ。
P(A∩B)=P(A)・P(B|A)
2つの事象A,Bが互いに相手に影響を及ぼさないとき独立という。このときP(B)=P(B|A)であるから
P(A∩B)=P(A)・P(B)
(例)2つの事象A,Bの起こる確率を3/10,3/5とし,A,Bがともに起こる確率が1/10とする。
Aが起こったという条件のもとでのBの起こる確率P(B|A)を求める。
P(B|A)=P(A∩B)/P(A)=(1/10)/(3/10)=1/3
1_7 ベイズの定理
互いに背反な完全事象系{A1,A2,・・・,An}に対して,Aiが原因となって事象Bが起こるとする。
Aiが原因でBが起こる確率P(B|Ai)を事前確率,Bという条件のもとでAiが起こったと考えられる確率P(Ai|B)を事後確率という。
事前確率P(B|Ai)と事後確率P(Ai|B)の間には,次の関係が成り立つ。
P(Ai∩B)=P(B)・P(Ai|B), P(B)=ΣP(Ai)・P(B|Ai)
∴ P(Ai|B)=P(Ai∩B)/P(B)=P(Ai)・P(B|Ai)/ΣP(Ai)・P(B|Ai)
(例)事象Bを胃痛の発生とする。Bの原因として,次の3つの事象を考える。
A1:ストレス A2:胃潰瘍 A3:胃がん
そしてそれぞれが原因で胃痛の起こる確率(事前確率)を0.4,0.5,0.1とする。また,それぞれの事象の発生確率を0.6,0.35,0.05とする。
| A1 | A2 | A3 | |
| B | 0.4 | 0.5 | 0.1 |
1_8 平均値
標本空間Sにおいて定義される変数Xを考える。変数Xが具体的にxという値をとるときの確率を
P(X=x) または p(x)
と表す。このようなXを確率変数という。また確率変数とその確率の積の総和を平均値(期待値)といい,E(X)で表す。
E(X)=ΣXP(X=x)=Σxp(x)
(例)Xの確率分布が次のように与えれたときの平均値を求めるE(X)。
X 1 2 3 計 P 7/15 7/15 1/15 1
E(X)=1*7/15+2*7/15+3*1/15=24/15=1.6
生起確率(発生確率)がP(a)の事象aが起こったとき,これを知ることにより得られる情報量をI(a)とする。
情報量I(a)を次のように定義する。
I(a)=log21/P(a)=-log2P(a) (単位 ビット(bit))
この定義に従うと,次のことが言える。
(例1)出現確率が等しいコインの情報量
a:表が出るという事象 I(a)=-log2P(a)=-log21/2=log22=1(ビット)
(例2)出現確率が等しいさいころの目の情報量
a:1の目が出るという事象 I(a)=-log2P(a)=-log21/6=log26≒2.58(ビット)
(例3)試験の合格可能性が1/8である生徒の合格,不合格を伝える情報量
a:合格するという事象 I(a)=-log2P(a)=-log21/8=log28=3(ビット)
b:不合格という事象 I(b)=-log2P(b)=-log27/8≒0.193(ビット)
⇒ 合格を伝える情報量は不合格を伝える情報量より大きい
2_2 情報量の性質
生起確率(発生確率)がP(a)の事象aが起こったときの情報量をI(a)とすると,次の性質が成り立つ。
(例)さいころを1個振るとき,2つの事象a,bを次の様に定める。
a:偶数の目が出る b:3の倍数の目が出る
I(a)=-log2P(a)=I(a)=-log21/2=1(ビット) I(b)=-log2P(b)=-log21/3≒1.58(ビット)
I(ab)=-log2P(ab)=-log21/6=2.58(ビット)
∴ I(ab)=I(a)+I(b)
2_3 平均情報量(エントロピー)
n個の事象からなる完全事象系 A={a1,a2,a3,…,an} (Σai=1,ai∩aj=φ)を考える。情報量I(ai)の期待値をH(A)とすると
H(A)=ΣP(ai)I(ai)=-ΣP(ai) log2P(ai)
このHを平均情報量(エントロピー)という。これは情報の不確かさの平均値を表す。
(例1)1枚のコインを投げる。2つの事象を次のように定める。 a1:表が出る,a2:裏が出る
コインが公正なものでないときにはコインが公正な場合よりも エントロピーが減少する。
(例2)ある都市のある日の天気予報が,晴れ45%,曇り35%,雨12%,雪8%のときのエントロピーH
H=-0.45log20.45-0.35log20.35-0.12log20.12-0.08log20.08
=0.45*1.15+0.35*1.51+0.12*3.06+0.08*3.64
=0.52+0.53+0.37+0.29=1.17
2_4 最大エントロピー
2つの事象からなる完全事象系Aを考える。
| A= | ( | a1 | a2 | ) | = | ( | a1 | a2 | ) |
| P(a1) | P(a2) | p | 1-p |
このときのエントロピーH(A)は,次のようになる。
H(A)=-P(a1)log2P(a1)-P(a2)log2P(a2)=-plog2p-(1-p)log2(1-p)
このpについての関数をエントロピー関数といいH (p)で表す。(注:ここでは記述上区別して斜体で表す)
H (p)=-plog2p-(1-p)log2(1-p)
これをグラフ化したものが右図である。このグラフから次のことがわかる。
同様に3つの事象からなる完全事象系のエントロピーは,次の式で与えられる。
H=-p1log2p1-p2log2p2-(1-p1-p2)log2(1-p1-p2)
最大エントロピーはp1=p2=p3=1/3のときにH=log23(ビット)で与えられる。(右図)
一般にn個の事象からなる完全事象系の最大エントロピーは,
p1=p2=・・・=pn=1/nのときにH=log2n(ビット)
で与えられる。
(例1)A市におけるa1:晴れとa2:雨の確率をそれぞれ
P(a1)=0.99, P(a2)=0.01
とするときのエントロピーはエントロピー関数表でp=0.01の値を参照しH (0.01)=0.08(ビット)を得る。
(例2)サイコロを1回振るときの最大エントロピーは
H=-Σ1/6log21/6=log26=2.585(ビット)
3_1 結合エントロピー
2つの事象系A,Bを次のようにとる。
A= ( a1 a2 ) P(a1) P(a2)
B= ( b1 b2 ) P(b1) P(b2)
この2つの事象系の事象を組み合わせて新しい事象系を作成する。ただし,(ai,bj)=ai∩bj,P(ai,bj)=P(ai∩bj)とする。
AB= ( (a1,b1) (a1,b2) (a2,b1) (a2,b2) ) P(a1,b1) P(a1,b2) P(a2,b1) P(a2,b2)
これを簡単に次のような表で表すこととする。
b1 b2 a1 P(a1,b1) P(a1,b2) a2 P(a2,b1) P(a2,b2
このときの平均情報量を結合エントロピーといいH(AB)で表す。
H(AB)=-ΣiΣjP(ai,bj)log2P(ai,bj)
(例)A市における天気に関する事象系A(a1:晴れ,a2:雨)と温度に関する事象系B(b1:20度以上,b2:20度未満)に対して,次の表のような確率が成り立っているとする。このときのA,BのエントロピーおよびABの結合エントロピーを求める。
b1 b2 P(ai) a1 0.18 0.42 0.6 a2 0.12 0.28 0.4 P(bi) 0.3 0.7 1
*H(AB)=H(A)H(B)が成り立つとき,事象A,Bは独立していることを示す。
3_2 条件付きエントロピー
2つの事象系A,Bを次のようにとる。
A= ( a1 a2 ・・・ am ) P(a1) P(a2) ・・・ P(am)
B= ( b1 b2 ・・・ bn ) P(b1) P(b2) ・・・ P(bn)
条件付エントロピーを次のように定める。
H(B|A)=ΣiP(ai)H(B|ai)=-ΣiΣjP(ai)P(bj|ai)log2P(bj|ai)
条件付きエントロピーは次の性質を持っている。
(例)A市における天気に関する事象系A(a1:晴れ,a2:雨)と温度に関する事象系B(b1:20度以上,b2:20度未満)に対して,次の表のような確率が成り立っているとする。このときの条件付きエントロピーP(B|A)を求める。
b1 b2 P(ai) a1 0.18 0.42 0.6 a2 0.32 0.08 0.4 P(bi) 0.5 0.5 1
H(B)=-0.5log20.5-0.5log20.5=0.5*1+0.5*1=1(ビット) であるからH(B)≧H(B|A)であることがわかる。
3_3 相互情報量
事象系AとBになんらかの関係があれば,Aが何であるかを知ることによって,Bが何であるかについても若干の情報が得られるはずである。この情報量はAを知ることによって得られるBのエントロピーの減少分によって定義することができる。これを相互情報量といいH(A;B)で表す。
I(A;B)=H(B)-H(B|A)
ここでH(B)を事前エントロピー,H(B|A)を事後エントロピーという。
相互情報量は次のような性質を持っている。
(例)A市における天気に関する事象系A(a1:晴れ,a2:雨)と温度に関する事象系B(b1:20度以上,b2:20度未満)に対して,次の表のような確率が成り立っているとする。このときの相互情報量I(A;B)を求める。
b1 b2 P(ai) a1 0.24 0.36
0.6 a2 0.26
0.14
0.4 P(bi) 0.5 0.5 1
情報をA地からB地へ伝送(伝達)することを通信という。通信には2つの重要な条件「正確」「高速」が必要になる。シャノンが提案した通信系のモデルは次のようなものである。
| 情報源 | → | 符号化 | → | 通信路 | → | 復号化 | → | 受信者 |
| メッセージ | 送信信号 | 雑↑音 | 受信信号 | メッセージ | ||||
| 雑音源 |
4_2 情報源
情報として各種の記号(アルファベット)を出力する源を情報源,その記号を情報源記号という。情報源記号の集合を情報源アルファベットといい,次のように表す。
S={s1,s2,s3,・・・,sn}
情報源記号は数字0〜9でも良いし,英字のA〜Zや五十音でも良い。
情報源記号が2つしかない情報源を2元情報源という。
(例1)1枚の硬貨5回を投げたときの出方 S={表,裏,表,表,裏}
(例2)1つのサイコロを6回投げたときの目の出方 S={4,2,3,4,1,5}
4_3 情報源の分類
情報源には次の2つの種類がある。情報源をS={s1,s2,s3,・・・,sn}とする。
| ──→ | ○ | ○ | ・・・ | ○ | ● | ──→ |
| ├→ | m個 | ←┤ | si | |||
| このm個の記号に依存してsiが生起する | ||||||
(例:記憶のない情報源)1つのサイコロを6回投げたときの目の出方 S={4,2,3,4,1,5}
(例:記憶のある情報源)
4_4 状態遷移図
情報源記号が2つの2重マルコフ情報源(2元2重マルコフ情報源)S={0,1}を考える。
| ──→ | ○ | ○ | ● | ──→ |
| ├2 | 個┤ | si | ||
| この2個の記号に依存してsiが生起する | ||||
このとき2つ前の記号と1つ前の記号の組み合わせとして,次の4つが考えられる。
q1=(00), q2=(01), q3=(10), q4=(11)
ある状態から次の状態へと変化することを遷移という。2元2次マルコフ情報源S={0,1}の場合,次の8つの遷移が考えられる。
@00→00 A00→01 B01→10 C01→11
D10→00 E10→01 F11→10 G11→11
これを右のような図に表したものを状態遷移図という。
(例)2元単純マルコフ情報源の遷移図
S={0,1},q1=(0),q2=(1)
に対して,次の4つの遷移が考えられる。
@0→0 A0→1 B1→0 C1→1
4_5 定常確率
情報源記号si(i=1,2,・・・,m)を持つ情報源アルファベットをS={s1,s2,・・・,sm}とし,状態qjの下でのsiの生起確率をP(si|qj)とする。各状態qjの発生する確率を定常確率といい,P(qj)で表す。このとき,次の関係式が成り立つ。
(例)2元単純マルコフ情報源
S={0,1},q1=(0),q2=(1)で与えられる2元単純マルコフ情報源の状態遷移図が,右図の様に与えられたときの状態確率を求める。
P(q1)=P(q1)P(0|q1)+P(q2)P(0|q2)=P(q1)*0.7+P(q2)*0.1 ・・・@
P(q2)=P(q1)P(1|q1)+P(q2)P(1|q2)=P(q1)*0.3+P(q2)*0.9 ・・・A
P(q1)+ P(q2)=1 ・・・B
@ABより P(q1)=1/4,P(q2)=1/3
4_6 情報源のエントロピー
(例1)2元単純マルコフ情報源
S={0,1},q1=(0),q2=(1)で与えられる2元単純マルコフ情報源の状態遷移図が,右図の様に与えられたときの平均情報量H(S)を求める。
(例2)2元2重マルコフ情報源
S={0,1},q1=(00),q2=(01),q3=(10),q4=(11)で与えられる2元単純マルコフ情報源の状態遷移図が,右図の様に与えられたときの平均情報量H(S)を求める。
通信とは発信者から媒体を通して情報を伝えることである。通信システムのモデルでは次のような経路をたどる。
| ← | 符号化 | → | ← | 復号 | → | |||||||
| ADA・・・ | 001100・・・ | 000 000 111 111 ・・・ | 000 010 111 110・・・ | 001100・・・ | ADA・・・ | |||||||
| 情報源 | → | 情報源 符号化 |
→ | 通信路 符号化 |
→ | 通信路 | → | 通信路 復号 |
→ | 情報源 復号 |
→ | 受信者 |
| 情報源 アルファベット S={A,B,C,D} |
A:00 B:01 C:10 D:11 |
0::000 1:111 |
↑雑音 | 誤り 発生 |
000:0 100:0 010:0 001:0 |
111:1 011:1 101:1 110:1 |
00:A 01:B 10:C 11:D |
|||||
(例)情報源アルファベットS={A,B,C,D},符号アルファベット{0,1}を用いて,情報源記号を次のように符号化する。
5_2 符号
情報源から符号を用いて符号語を作成する場合を考える。
(例)情報源記号S={A,B,C,D}を符号語アルファベット{0,1}で,次のTからZの7通りの符号で符号化する。
| T | U | V | W | X | Y | Z | |
| A | 00 | 0 | 0 | 0 | 0 | 0 | 00 |
| B | 01 | 10 | 10 | 01 | 1 | 10 | 10 |
| C | 10 | 110 | 110 | 011 | 11 | 11 | 11 |
| D | 11 | 1110 | 111 | 111 | 01 | 0 | 00 |
| 等長符号 | ○ | × | × | × | × | × | ○ |
| 一意復号可能 | ○ | ○ | ○ | ○ | × | × | × |
| 瞬時符号 | ○ | ○ | ○ | × | *** | *** | *** |
情報源ABCDを通信路符号化したあと,復号することで一意復号可能,瞬時符号について検証する。
5_3 瞬時符号の判定
ある符号語が別の符号語の頭部に一致しなければ瞬時符号となる。これを語頭条件という。
この語頭条件の判定を容易にする表現の方法として符号の木(ツリー)がある。(右図)
符号の木においては,全ての符号語が葉に対応付けられていれば,他の符号の語頭にはならないので瞬時符号となる。
(例)情報源記号S={A,B,C,D}を符号語アルファベット{0,1}で,次のTからZの7通りの符号で符号化する。そのツリー表示。
T〜Vは全ての符号語が葉に対応しているが,それ以外は節点にも対応しているので瞬時符号とならない。
| T | U | V | W | X | Y | Z | |
| A | 00 | 0 | 0 | 0 | 0 | 0 | 00 |
| B | 01 | 10 | 10 | 01 | 1 | 10 | 10 |
| C | 10 | 110 | 110 | 011 | 11 | 11 | 11 |
| D | 11 | 1110 | 111 | 111 | 01 | 0 | 00 |
| 木 | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
*** |
| 一意 | ○ | ○ | ○ | ○ | × | × | × |
| 瞬時 | ○ | ○ | ○ | × | *** | *** | *** |
5_4 クラフトの不等式
長さliを持つm個のr元符号が瞬時符号であるための必要条件
Σ1/rli (クラフトの不等式)
(例)情報源記号S={A,B,C,D}を符号語アルファベット{0,1}で,次のTからZの7通りの符号で符号化する。その時のΣ1/2liの値を求める。
| T | U | V | W | X | Y | Z | |
| A | 00 | 0 | 0 | 0 | 0 | 0 | 00 |
| B | 01 | 10 | 10 | 01 | 1 | 10 | 10 |
| C | 10 | 110 | 110 | 011 | 11 | 11 | 11 |
| D | 11 | 1110 | 111 | 111 | 01 | 0 | 00 |
| Σ1/2li | 1 | 15/16 | 1 | 1 | 1.5 | 1.5 | 1 |
| 一意 | ○ | ○ | ○ | ○ | × | × | × |
| 瞬時符号 | ○ | ○ | ○ | × | *** | *** | *** |
符号U,X,Yのより符号語長{1,2,3,4},{1,1,2,2}をもつ符号は瞬時符号になり得ない。
符号T,Zより符号語長{2,2,2,2}を持つ符号は瞬時符号となる符号を作ることができる。しかしクラフトの不等式を満たすからと言って瞬時符号になるとは限らない。
5_5 平均符号長
r元符号において生成される情報源{A1,A2,・・・,Am}を考える。記号Aiの生起確率をP(Ai),符号語の長さをliとするとき,符号語の平均符号長Lは,次の式で与えられる。
L=ΣP(Ai)li
(例)情報源記号S={A,B,C,D}を符号語アルファベット{0,1}で,次のTからZの7通りの符号で符号化する。その時の平均符号長を求める。
| P(Ai) | T | U | V | W | X | Y | Z | |
| A | 0.4 | 00 | 0 | 0 | 0 | 0 | 0 | 00 |
| B | 0.3 | 01 | 10 | 10 | 01 | 1 | 10 | 10 |
| C | 0.2 | 10 | 110 | 110 | 011 | 11 | 11 | 11 |
| D | 0.1 | 11 | 1110 | 111 | 111 | 01 | 0 | 00 |
| 平均符号長 | 2 | 2 | 1.9 | 1.9 | 1.3 | 1.5 | 2 | |
5_6 符号化の効率
r元符号において生成される情報源{A1,A2,・・・,Am}を考える。記号Aiの生起確率をP(Ai)とするとき,情報源のエントロピーHは,次の式で与えられる。
H=-ΣP(Ai)log2P(Ai)
また,符号語の平均符号長をLとすると,1符号あたりの情報量eは,次の式で与えられる。
e=H/L
このeは符号化の効率を表し,1に近いほど効率の良い符号化が行われたことになる。
符号化の効率を高めるためには『生起確率の大きい記号に短い符号語を割り当てる』ことが,最も基本的なことと言える。
(例)情報源記号S={A,B,C,D}を符号語アルファベット{0,1}で,次のTからZの7通りの符号で符号化する。その時の符号化の効率を求める。
エントロピーHはみな同じで
H=-0.4*log20.4-0.3*log20.3-0.2*log20.2-0.1*log20.1=0.53+0.52+0.46+0.33=1.84
| P(Ai) | T | U | V | W | X | Y | Z | |
| A | 0.4 | 00 | 0 | 0 | 0 | 0 | 0 | 00 |
| B | 0.3 | 01 | 10 | 10 | 01 | 1 | 10 | 10 |
| C | 0.2 | 10 | 110 | 110 | 011 | 11 | 11 | 11 |
| D | 0.1 | 11 | 1110 | 111 | 111 | 01 | 0 | 00 |
| エントロピー | 1.84 | 1.84 | 1.84 | 1.84 | 1.84 | 1.84 | 1.84 | |
| 平均符号長 | 2 | 2 | 1.9 | 1.9 | 1.3 | 1.5 | 2 | |
| 効率 | 0.92 | 0.92 | 0.97 | 0.97 | 142 | 1.23 | 0.92 | |
5_7 シャノン・ファノの符号化法
r元符号において生成される情報源{A1,A2,・・・,Am}を考え,記号Aiの生起確率をP(Ai)とする。シャノン・ファノの符号化法は次の通りである。
(例)次の情報源にシャノン・ファノの符号化法を用いる。
A= ( A1 A2 A3 A4 A5 A6 ) 0.09 0.14 0.40 0.15 0.12 0.10
ここでエントロピーH,平均符号化長L,符号化効率eを求める。
5_8 ハフマンの符号化法
r元符号において生成される情報源{A1,A2,・・・,Am}を考え,記号Aiの生起確率をP(Ai)とする。ハフマンの符号化法は次の通りである。
(例)次の情報源にハフマンの符号化法を用いる。
A= ( A1 A2 A3 A4 A5 A6 ) 0.09 0.14 0.40 0.15 0.12 0.10
ここでエントロピーH,平均符号化長L,符号化効率eを求める。
≪参考資料≫