因此,用文字、符号、数据、语言、音符、图片、图像等能够被人们感觉器官所感知的形式,把客观物质运动和主观思维活动的状态表达出来就成为消息。构成消息的各种形式必须具备两个条件:一是能被人们感知和理解的,二是可以进行传递和获取的。可见,消息中包含信息,是信息的载体。得到消息,从而获得信息。同一则信息可用不同的消息形式来载荷。如前例中,球赛进展情况可用电视图像、广播语言、报纸文字等不同消息来表述。而一则消息也可载荷不同的信息,它可能包含非常丰富的信息,也可能只包含很少的信息。因此,信息与消息是既有区别又有联系的。既然信息不同于消息,当然也不同于信号。在各种实际通信系统中,往往为了克服时间或空间的限制而进行通信,必须对消息进行加工处理。把消息变换成适合信道传输的物理量,这种物理量称为信号(如电信号,光信号,声信号,生物信号等)。信号携带着消息,它是消息的运载工具。如前例中,“母病愈”这种关于母亲身体健康状况的信息,用汉文“母病愈”的消息来表述,然后通过电报系统传送到另一地的收信者。因为这个电报系统的传递信道是无线电电波信道,所以汉文消息不能直接在信道中传输。一般,需先将汉文(如"母病愈”)变换成四位码,然后变换成由点、划和空隔三种符号组成的莫尔斯码,再转换成脉冲电信号,然后经过调制变成高频调制电信号,才能在信道中传输。此时,脉冲电信号或高频调制电信号都载荷着汉文消息,表述了母亲身体健康的一种状态。在通信系统的接收端,通过解调,反变换,若无干扰的话就可恢复成原汉文消息一一“母病愈”。收信者收到报文后,就得知了母亲病愈,身体健康,从而获得了信息。可见,信号携带信息,但不是信息本身。同样,同一信息可用不同的信号来表示。同一信号也可表示不同的信息。例如,红、绿灯信号。若在十字路口,红、绿灯信号表示能否通行的信息。若在电子仪器面板上,红、绿灯信号却表示仪器是否正常工作或者表示高低电压等信息。所以,信息、消息和信号是既有区别又有联系的三个不同的概念。2.哈特莱、维纳、朗格等人对信息的定义关于信息的科学定义,到目前为止,国内外已有不下百余种流行的说法。它们都是从不同的侧面和不同的层次来揭示信息的本质的。最早对信息进行科学定义的是哈特莱(R.V.L.Hartley)。他在1928年发表的《信息传输》一文中,首先提出“信息”这一概念。他认为,发信者所发出的信息,就是他在通信符号表中选择符号的具体方式,并主张用所选择的自由度来度量信息。哈特莱的这种理解在一定程度上能够解释通信工程中的一些信息问题,但它存在着严重的局限性。首先,他所定义的信息不涉及信息的价值和具体内容,只考虑选择的方式。其次,即使考虑选择的方式,但没有考虑各种可能选择方式的统计特性。正是这些缺陷严重地限制了它的适用范围。1948年,控制论的创始人之一,美国科学家维纳(N.Wiener)出版了《控制论一动物和机器中通信与控制问题》一书。维纳在该书中是这样来论述信息的,他指出:“信息是信息,不是物质,也不是能量”。这就是说,信息就是信息自己,它不是其他什么东西的替代物,它是与“物质”“能量”同等重要的基本概念。正是维纳,首先将“信息”上升到最基本概念”的位置。后来,维纳在《人有人的用处》一书中,提出:“信息是人们适应外部世界并且使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称。”又说:“接收信息和使用信息的①N.Wiener,《控制论—动物和机器中的通信与控制问题》.科学出版社,1963年②N,Wiener,人有人的用处》,商务印书馆,1978年.3:
过程,就是我们适应外部世界环境的偶然性变化的过程,也是我们在这个环境中有效地生活的过程。”“要有效地生活,就必须有足够的信息。的确,信息对人类的生存是很重要的;但是,信息不仅仅与人类有关,不仅仅是人与外部世界交换的内容。在自然界中,一切生物体都在与外部世界进行着互相交换信息。一切生物体都有它们独自的接收信息和交换信息的方式。俗话说“禽有禽言,兽有兽语”,这是动物之间特别是群体动物之间传递信息的方式。人们发现动物之间可以利用气味、声音、不同的运动姿态,乃至超声波、电磁场等多种方式来传递信息。另外,信息的确是人们与外部世界互相交换的内容,但是,人们在与外部世界相互作用过程中,还进行着物质与能量的交换。这样,就又把信息与物质、能量混同起来。所以,维纳关于信息的定义是不确切的。关于信息的定义,有人提出用变异度、差异量来度量信息,认为“信息就是差异”。这种说法的典型代表是意大利学者朗格(G.Longe)。他在1975年出版的《信息论:新的趋势与未决问题》一书序言中,提出:“信息是反映事物的形式、关系和差别的东西。信息是包含于客体间的差别中,而不是在客体本身中。”“在通信中仅仅差别关系是重要的。”也就是说,他定义信息是客体之间的相互差异。的确,宇宙内到处存在着差异,差异的存在使人们存在着“疑问”和“不确定性”。从这个角度看,差异确是信息。但是,并不能说没有差异就没有信息。所以,这样定义的信息也是不全面的、不确切的。3.香农信息的定义香农在1948年发表了一篇著名的论文一《通信的数学理论》。他从研究通信系统传输的实质出发,对信息做了科学的定义,并进行了定性和定量的描述。如前所述,各类通信系统—一电报、电话、广播、电视、雷达、遥测·等传送的是各种各样的消息。消息的形式可以不同,但它们都是能被传递的,能被人们感觉器官(眼、耳、触觉等)所感知的而且消息表述的是客观物质和主观思维的运动状态或存在状态。香农将各种通信系统概括成如图1.2所示的框图。在消息信道上信源信宿各种通信系统中,其传输的形式是消息。但消息传递过程人(发送者)(收信者)的一个最基本、最普通却又不十分引人注意的特点是:收信干扰或噪声者在收到消息以前是不知道消息的具体内容的。在收到消图1.2通信系统框图息以前,收信者无法判断发送者将会发来描述何种事物运动状态的具体消息;他更无法判断是描述这种状态还是那种状态。再者,即使收到消息,由于干扰的存在,他也不能断定所得到的消息是否正确和可靠。总之,收信者存在着“不知”、“不确定”或”疑问”。通过消息的传递,收信者知道了消息的具体内容,原先的“不知”、“不确定”和“疑问”消除或部分消除了。因此,对收信者来说,消息的传递过程是一个从不知到知的过程,或是从知之甚少到知之甚多的过程,或是从不确定到部分确定或全部确定的过程。如果不具备这样一个特点,那就根本不需要通信系统了。试想,如果收信者在收到电报或接听到电话之前就已经知道报文或电话的内容,那还要电报、电话系统干什么呢?由于主、客观事物的运动状态或存在状态是千变万化的、不规则的、随机的,因此在通信以前,收信者存在“疑义”和“不知”。例如,在电报通信中,收报人在收到报文前,首先他不知何人会给他发电报,而且也不知将要告诉他什么事情。只有当他收到报文是“母病愈”后,才能确定是他家人告诉他母亲的身体情况。其次,报文“母病愈”是母亲身体健康状态的一种描述,而母亲身体健康情况会表现出不同的状态,到底出现的是什么状态是随机的、变化的。收信者在看到报文以前,他不能确定母亲身体健康状态如何,也存在“不确定性”。只要报文是清楚的,在传递过程中没有差错,那么,他收到报文以后,他原来所有的“不确定性都没有了,他就获得了所有的信息。如果在传递过程中存在着干扰,使报文完全模糊不清,收信者收到报文以后,原先所.4
具有的不确定性一点也没有减少,他就没有获得任何信息。如果干扰使报文发生部分差错,使收信者原先的不确定性减少了一些,但没有全部消除,他就获得了一部分信息。所以,通信过程是一种消除不确定性的过程。不确定性的消除,就获得了信息。原先的不确定性消除得越多,获得的信息就越多。如果原先的不确定性全部消除了,就获得了全部的信息;若消除了部分不确定性,就获得了部分信息:若原先不确定性没有任何消除,就没有获得任何信息。由此可见,信息是事物运动状态或存在方式的不确定性的描述。这就是香农信息的定义。从以上分析可知,在通信系统中形式上传输的是消息,但实质上传输的是信息。消息只是表达信息的工具,载荷信息的客体。显然,在通信中被利用的(亦即携带信息的)实际客体是不重要的,而重要的是信息。信息较抽象,而消息是较具体的,但还不一定是物理性的。通信的结果是消除或部分消除不确定性从而获得信息。4.香农信息的度量根据香农的有关信息的定义,信息如何测度呢?当人们收到一封电报,或听了广播,或看了电视,到底得到多少信息量呢?显然,信息量与不确定性消除的程度有关。消除多少不确定性,就获得多少信息量。那么,不确定性的大小能度量吗?用数学的语言来讲,不确定性就是随机性,具有不确定性的事件就是随机事件。因此,可运用研究随机事件的数学工具一一概率论和随机过程来测度不确定性的大小。若从直观概念来讲,不确定性的大小可以直观地看成是事先猜测某随机事件是否发生的难易程度。例如,假设有甲、乙两个布袋,各袋内装有大小均匀,手感完全一样的球100个。甲袋内红、白球各50个,乙袋内有红、白、蓝、黑四种球,各25个。现随意从甲袋或乙袋中取出一球,并猜测取出的是什么颜色的球,这事件当然具有不确定性。显然,从甲袋中摸出是红球要比从乙袋中摸出是红球容易得多。这是因为,在甲袋中只在“红”与“白”两种颜色中选择一种,而且“红”与“白”机会均等,即摸取的概率各为。但在乙袋中,红球只占六,摸出是红球的可能性就小。自然,“从甲袋中2°摸出的是红球”比“从乙袋中摸出的是红球”的不确定性来得小。从这个例子可以得出,不确定性的大小与可能发生的消息数目及各消息发生的概率有关。再如气象预报,我们知道可能出现的气象状态有许多种。以十月份北京地区天气为例,经常出现的天气是“晴间多云”、“晴”或“多云”,其次是“多云转阴”“阴”“阴有小雨”等,而“小雪”这种天气状态出现的概率是极小的,“大雪”的可能性则更小更小。因此,在听气象预报前,我们大体上能猜测出天气的状况。由于出现“晴间多云”“晴”或“多云”的可能性大,我们就比较能确定这些天气状况的出现。因此,当预报明天白天“晴间多云”或晴”,我们并不觉得稀奇,因为和我们猜测的是基本一致,所消除的不确定性要小,获得的信息量就不大。而出现“小雪”的概率很小,我们很难猜测它是否会出现,所以这事件的不确定性很大。如果预报是“阴有小雪”,我们就要大吃一惊,感到气候反常,这时就获得了很大的信息量。出现“大害”的概率更小,几乎是不可能出现的现象,它的不确定性更大。如果一旦出现“大雪”的气象预报,我们将万分惊呀,这时将获得更大的信息量。由此可知,某一事物状态出现的概率越小,其不确定性越大;反之,某一事物状态出现的概率接近于1,即预料中肯定会出现的事件,那它的不确定性就接近于零。这两个例子告诉我们:某一事物状态的不确定性的大小,与该事物可能出现的不同状态数及各状态出现的概率大小有关。既然不确定性的大小能够度量,可见,信息是可以测度的。(1)样本空间我们把某事物各种可能出现的不同状态,即所有可能选择的消息的集合,称为样本空间。每个可能选择的消息是这个样本空间的一个元素。5
(2)概率测度对于离散消息的集合,概率测度就是对每一个可能选择的消息指定一个概率(非负的,且总和为1)。(3)概率空间一个样本空间和它的概率测度称为一个概率空间。一般概率空间用X,P来表示。在离散情况下,X的样本空间可写成《aia2.a,。样本空间中选择任一元素a,的概率表示为Px(a),其脚标X表示所考虑的概率空间是X。如果不会引起混淆,脚标可以略去,写成P(a,)。所以在离散情况下,概率空间为Xa1a24gP(r)LP(a).P(a2)....P(a,)其中,P(a)就是选择符号a;作为消息的概率,称为先验概率。(4)自信息在接收端,对是否选择这个消息(符号)a;的不确定性是与α,的先验概率成反比的,即对α,的不确定性可表示为先验概率P(α,)的倒数的某一函数。我们取该函数为对数函数,并把这样定义的不确定性称为该消息(符号)a;的自信息,即1I(a,) = log P(a,)(1. 1)(5)互信息由于信道中存在干扰,假设接收端收到的消息(符号)为b,,这个b,可能与a,相同.也可能与α有差异。我们把条件概率P(a1b)称为后验概率,它是接收端收到消息(符号)b,后而发送端发的是a,的概率。那么,接收端收到b,后,发送端发送的符号是否是a,尚存在的不确定性,应是后验概率的函数,即是1og P(a,16,)。于是,收信者在收到消息(符号)b,后,已经消除的不确定性为:先验的不确定性减去尚存在的不确定性。这就是收信者获得的信息量,定义为互信息,即1(1. 2)I(arib,) = log P(a,) - log P(a, I b,)如果信道没有于扰,信道的统计特性使α,以概率1传送到接收端。这时,收信者接到消息后,尚存在的不确定性就等于零,即P(a;lb,)=1,logP(a,|6b,)=0,不确定性全部消除。由此得互信息I(ai;b,)=I(a,)(1.3)以上就是香农关于信息的定义和度量。通常也称为概率信息。(6)香农信息定义的优点香农定义的信息概念在现有的各种理解中,比较深刻.它有许多优点。首先,它是一个科学的定义,有明确的数学模型和定量计算。其次,它与日常用语中的信息的含意是一致的。例如,设某一事件,发生的概率等于1.即α,是预料中一定会发生的必然事件,如果事件α,果然发生了,收信者将不会得到任何信息(日常含义),因为他早知道α;必定发生,不存在任何不确定性。根据式(1.1),因为P(a:)=1.所以得1I(a,)=log P(a,)=0即自信息等于零。反之,如果a,发生的概率很小,即猜测它是否发生的不确定性很大,一旦αi果然发生了,收信者就会觉得很意外和惊诉,获得的信息量很大。根据式(1.1)因为P(a.)<1.故得.6
1》I(a;)=log P(a,)再者,它排除了对信息一词某些主观上的含义。根据上述定义,同样一个消息对任何一个收信者来说,所得到的信息量(互信息)都是一样的。因此,信息的概念是纯粹的形式化的概念。(7)香农信息定义的缺陷+香农定义的信息有其局限性,存在一些缺陷。首先,我们已经看到,这个定义的出发点是假定事物状态可以用一个以经典集合论为基础的概率模型来描述。然而对实际某些事物运动状态或存在状态要寻找一个合适的概率模型往往是非常困难的。对某些情况来讲,是否存在这样一种模型还值得探讨。而且这个定义只考虑概率引发的不确定性,不考虑由于其他因素如模糊性等而造成的不确定性。其次,这个定义和度量没有考虑收信者的主观特性和主观意义,也撒开了信息的具体含意、具体用途、重要程度和引起后果等因素。这就与实际情况不完全一致。例如,当得到同一消息后,对不同的收信者来说常会引起不同的感情不同的关心程度,不同的价值,这些都应认为是获得了不同的信息。又例如,甲乙两人同去听一段音乐,若甲者缺乏欣赏音乐的起码知识和必要训练的话,这种信息就不能发生什么作用;若乙者是一位训练有素的音乐家,那么他将从这段音乐中获得大量信息。因此,信息有很强的主观性和实用性。由此可见,香农信息的定义和度量是科学的,是能反映信息的某些本质的:但却是有缺陷的、有局限的。这样,它的适用范围会受到严重的限制。5.信息的广义概念(1)信息是物质世界的三大支柱之一目前,哲学家和科学家普遍认为,物质、能量和信息是物质世界的三大支柱,是科学历史上三个最重要的基本概念。世界是物质的。没有物质就没有世界,就没有一切,也就没有信息。可以说信息与物质同存,信息是物质的一种普遍属性。在物质世界中任何事物都处于永恒的运动和普遍的相互作用之中。只要有运动和相互作用的事物,就需要有能量,也就会产生各种各样事物运动的状态和方式,就产生信息。信息是作为物质存在方式和状态的自身显示,同样也是相互作用的自身显示。可见,信息源于物质世界本身,源于物质世界的运动和相互作用之中,所以信息是普遍存在的。信息是物质的属性,但不是物质自身,信息具有相对独立性。事物运动的状态和方式一旦体现出来,就可以脱离原来的事物而相对独立地载附于别的事物上,而被提取、变换、传递、存储、加工或处理。因此,信息不等于它的源事物,也不等于它的载体。信息虽不等于物质本身,但它也不可能脱离物质而独立存在,必须以物质为载体,以能量为动力。这三者是相辅相成,缺一不可的。这也正是信息的绝对性、普遍性和独立性。正是信息的这种相对独立性,使得它可以被传递、复制、存储和扩散。这就是信息的可贵特性一共享性。信息的共享是无限的。只要是无干扰和全息传递,共享的信息就是完全等同的,并不因为信息被共享后而使原占有者丢失信息。所以,信息传播、扩散越快、越广,就越加速推动人类社会的发展和进步。可以说,信息的共享性对人类社会的发展有着特别重要的意义。信息作为事物运动和相互作用的自身显示,与事物及它们的运动和相互作用一样是永恒的、无限的、动态的。事物每时每刻都在与其他事物的相互作用及自身的运动中改变着自身的信息,所以信息永远在产生、演变、更新。而且人类对信源信息的认识也是有时间性的。虽然认识的信息一旦形成,被存储起来,在一般情况下绝不会自行发生变化。但是,信源的信息却在不断地变化着,因此.7