(2019春季1 课程编号:011184) 曾凡平 209信安导论 信息安全导论 第13章内容安全枝术 中国科学技术大学曾凡平 billzeng@ustc.edu.cn
信息安全导论 第13章 内容安全技术 中国科学技术大学 曾凡平 billzeng@ustc.edu.cn (2019春季 课程编号:011184)
第13章内容安全技术 13.1内容安全的概念 13.2文本过滤 ·13.2.1不良文本过滤主要方法 。13.2.2中文分词 13.3话题发现和跟踪 13.4内容安全分级监管 13.5多媒体内容安全技术简介 信息安全导论13
第13章 内容安全技术 13.1 内容安全的概念 • 13.2.1 不良文本过滤主要方法 • 13.2.2 中文分词 13.2 文本过滤 13.3话题发现和跟踪 13.4 内容安全分级监管 13.5 多媒体内容安全技术简介 信息安全导论13 3
13.1内容安全的概念 在信息科技中,“信息”和“内容(content)”的概念是等价 的,它们均指与具体表达形式、编码无关的知识、事物、 数据等含义,相同的信息或内容分别可以有多表达形式 或编码。 。 信息和内容的概念也在一些特别的场合略有区别。一般 认为,内容更具轮廓性”和“主观性”,即在细节上有些 不同的信息可以被认为是相同的内容,人们在主观上没 有感觉到这些细节的不同对理解或识别内容有多大的影 响。而信息具有自信息、熵、互信息等概念,可以用比 特(bit)、奈特(nat)或哈特(hart)等单位衡量它们数量的多 少,因此一般认为信息更具“细节性”和“客观性”。在细 节并不重要的场合下,内容往往更能反映信息的含义, 也可以认为内容是人们可感知的信息或较高层次的信息, 因此多个信息可以对应一个内容。 信息安全导论13
13.1 内容安全的概念 • 在信息科技中, “信息”和“内容(content)”的概念是等价 的,它们均指与具体表达形式、编码无关的知识、事物、 数据等含义,相同的信息或内容分别可以有多表达形式 或编码。 • 信息和内容的概念也在一些特别的场合略有区别。一般 认为,内容更具“轮廓性”和“主观性” ,即在细节上有些 不同的信息可以被认为是相同的内容,人们在主观上没 有感觉到这些细节的不同对理解或识别内容有多大的影 响。而信息具有自信息、熵、互信息等概念,可以用比 特(bit)、奈特(nat)或哈特(hart)等单位衡量它们数量的多 少,因此一般认为信息更具“细节性”和“客观性” 。在细 节并不重要的场合下,内容往往更能反映信息的含义, 也可以认为内容是人们可感知的信息或较高层次的信息, 因此多个信息可以对应一个内容。 信息安全导论13 4
原始图像和压缩图像:内容相同 例如图像压缩编码中的信息与内容,可以通过压 缩编码减小一个数字图像的存储尺寸。当前常用 的图像压缩编码方式是PEG压缩,产生的图像 文件为PG文件。大量的图像压缩工具可以将其 他格式的图像压缩为JPG文件,JPG格式的图像 也可以进一步压缩。设原图像编码文件为A.TIF, 它被压缩为B.JPG,由于JPEG压缩是有损压缩 为了节省存储空间,压缩后的编码省去了一些高 频信息,因此A.TIF和B.JPG表达的信息是不同 的。但如果压缩程度不是太高,可以认为它们 表达的内容是相同的。在现实中,人们会认为 照片上的内容相同,只不过一个尺寸大些、一个 尺寸小些。 信息安全导论13 5
原始图像和压缩图像:内容相同 • 例如图像压缩编码中的信息与内容,可以通过压 缩编码减小一个数字图像的存储尺寸。当前常用 的图像压缩编码方式是JPEG压缩,产生的图像 文件为JPG文件。大量的图像压缩工具可以将其 他格式的图像压缩为JPG文件,JPG格式的图像 也可以进一步压缩。设原图像编码文件为A.TIF, 它被压缩为B.JPG,由于JPEG压缩是有损压缩, 为了节省存储空间,压缩后的编码省去了一些高 频信息,因此A.TIF和B.JPG表达的信息是不同 的。但如果压缩程度不是太高,可以认为它们 表达的内容是相同的。在现实中,人们会认为 照片上的内容相同,只不过一个尺寸大些、一个 尺寸小些。 信息安全导论13 5
内容安全 内容的复制和流动变得更加容易,这在一些情况下是人 们需要的,但在另一些情况下内容的肆意复制、传播和 流动危害了一些组织和个人的利益,因此人们希望实施 一定的控制和监管,获得可控性。显然,实施这类控制 的依据是何种内容或信息在被复制、传播或流动,因此, 内容或信息本身的含义直接与安全策略关联在一起,这 也要求信息安全策略的执行需要预先识别内容或信息 内容安全就是指内容的复制、传播和流动得到人们预期 的控制和监测。这里“内容”的定义主要基于以下3个方面。 ·()前述内容与信息的细微差别。 (2)当前国际上将数字视频、音频和电子出版物等称为数 字内容。 ·(3)一些文献中的“内容”专指应用层或应用中的数据和消 息。 信息安全导论13 6
内容安全 • 内容的复制和流动变得更加容易,这在一些情况下是人 们需要的,但在另一些情况下内容的肆意复制、传播和 流动危害了一些组织和个人的利益,因此人们希望实施 一定的控制和监管,获得可控性。显然,实施这类控制 的依据是何种内容或信息在被复制、传播或流动,因此, 内容或信息本身的含义直接与安全策略关联在一起,这 也要求信息安全策略的执行需要预先识别内容或信息。 内容安全就是指内容的复制、传播和流动得到人们预期 的控制和监测。这里“内容”的定义主要基于以下3个方面。 • (1)前述内容与信息的细微差别。 • (2)当前国际上将数字视频、音频和电子出版物等称为数 字内容。 • (3)一些文献中的“内容”专指应用层或应用中的数据和消 息。 信息安全导论13 6