数学的实践与认识 队员指导教师 疆师范大学 宋军锋 杨锦华 蒋利平 183解放军信息工程大学信息安全学院祝捷 王洪建 导师组 84解放军信息工程大学信息技术学院刘金福刘大鹏 张万军 导师组 解放军信息工程大学信息技术学院郑贺焦国栋刘延波 导师组 16解放军信息工程大学信息技术学院[程莘〖张校辉 导师组 解放军信息工程大学测绘学院 杨雄军曹四化彭凡 指导组 解放军炮兵学院 汤智 蒋全安 数模组 解放军理工大学气象学院 王吉奎 胡磊教模教练组 解放军理工大学气象学院 刘斌教模教练组 大专组一等奖23名(排名以学校笔划为序) 学校 员 指导教师 北方交通大学 周燕如 胡秋 吕伟忠 指导组 刘一贞林海波李明数模组 吕梁高等专科学校 杜焱伟 郑月平 李慧荣 教练组 成都大学都江分部 兴 张红霞 苏登良 成都信息工程学院 王会涛 李彦杰 王丽娜 达县师范高等专科学校 王金 ≥华 刘浏 连云港化工高等专科学校 仲银花 李利军 教练组 丁亚芬 建光 曾德刚 罗文华 昆明师范高等专科学校 刘春燕刘有荣李天虹教练组 武汉大学 罗烈 柯贤柄 王准 罗毅平 河北农业大学 赵淑丽 张凤元 河北师大职业技术学院 贾金生 张艳华指导教师组 河海大学 李长昌鲍竹翁方进 教练组 空军雷达学院 郭金龙 斌陆操数模组 师范大学 南昌大学 张辉章秋义 陈钰菊 重庆工业高等专科学校 肖建华 王胜勇 蔡勇辉 浙江万里学院 何永强 陆新根 沈重欢 数模组 海军后勤学院 余家康邹庆祥 夏江山 第二炮兵工程学院 樊英博杨超黄传高崔学伟 黄冈师范学院 钟绍军 骆凤银 王国刚 数模组 黄冈师范学院 饶从军 钱青 数模组 2 C1995-2004 Tsinghua Tongfang Optical Disc Co, Lid. All rights reserved
序 号 学 校 队 员 指导教师 182 新疆师范大学 叶 青 宋军锋 杨锦华 蒋利平 183 解放军信息工程大学信息安全学院 祝 捷 王洪建 李 娜 导师组 184 解放军信息工程大学信息技术学院 刘金福 刘大鹏 张万军 导师组 185 解放军信息工程大学信息技术学院 郑 贺 焦国栋 刘延波 导师组 186 解放军信息工程大学信息技术学院 程 莘 张校辉 王 丹 导师组 187 解放军信息工程大学测绘学院 杨雄军 曹四化 彭 凡 指导组 188 解放军炮兵学院 汤 智 蒋全安 吴 燕 数模组 189 解放军理工大学气象学院 武 渭 王吉奎 胡 磊 教模教练组 190 解放军理工大学气象学院 袁大为 曾黎明 刘 斌 教模教练组 大专组一等奖 23 名(排名以学校笔划为序) 序 号 学 校 队 员 指导教师 1 北方交通大学 周燕如 胡秋云 吕伟忠 指导组 2 华南农业大学 刘一贞 林海波 李 明 数模组 3 吕梁高等专科学校 杜焱伟 郑月平 李慧荣 教练组 4 成都大学都江分部 黄 兴 张红霞 苏登良 赵 凌 5 成都信息工程学院 王会涛 李彦杰 王丽娜 徐 琼 6 达县师范高等专科学校 王金华 范 洁 王 逊 刘 浏 7 连云港化工高等专科学校 仲银花 李利军 张 琴 教练组 8 邵阳师范高等专科学校 周云河 田 涧 丁亚芬 曾德广 9 岳阳师范学院 邹建光 刘丹娟 曾德刚 罗文华 10 昆明师范高等专科学校 刘春燕 刘有荣 李天虹 教练组 11 武汉大学 罗 烈 柯贤柄 王 准 罗毅平 12 河北农业大学 蒋宏晖 彭 晶 赵淑丽 张凤元 13 河北师大职业技术学院 贾金生 王 玉 张艳华 指导教师组 14 河海大学 李长昌 鲍 竹 翁方进 教练组 15 空军雷达学院 郭金龙 张 斌 陆 操 数模组 16 南京师范大学 练祥华 杨胜铭 秦 教练组 17 南昌大学 张 辉 章秋义 鲁 冰 陈钰菊 18 重庆工业高等专科学校 肖建华 王胜勇 蔡勇辉 彭 军 19 浙江万里学院 何永强 陆新根 沈重欢 数模组 20 海军后勤学院 余家康 邹庆祥 尹 强 夏江山 21 第二炮兵工程学院 樊英博 杨 超 黄传高 崔学伟 22 黄冈师范学院 钟绍军 骆凤银 王国刚 数模组 23 黄冈师范学院 饶从军 钱 青 卞 翼 数模组 61 数 学 的 实 践 与 认 识 31 卷 © 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved
期 姜启源200网易杯全国大学生数学建模竞赛 17 大专组二等奖55名(排名以学校笔划为序) 学校 员 指导教师 海化工高等专科学校 殳佳文 数模组 大连大学 于海燕 徐海艳 范德海 谭欣欣 山东电力高等专科学校 王沛书 宋晶华 朱磊 数模组 井冈山师范学院 业龙 邓永根 习军明 45678 公安海警高等专科学校 伟 孙增建 数模组 内江师范学院 谭文胜 王会彬 代雪松 何永葱 天水师范学院 强卫林 陈云忠 王虹霞梁达平等 长沙大学 韭琴 李雅 兰州石化职业技术学院 郭亚州 代学俊 教练组 兰州师范高等专科学校 获 王鹏行 王萍 崔剑波等 北京工商大学 吕燕孙 赵霞 指导小组 台州师范专科学校 李敏 数模组 台州师范专科学校 裘建 叶元晓 数模组 右江民族师范高等专科学校 飞地佳雷 黄茹松 姚胜波 罗朝晖 右江民族师范高等专科学校 张桂蓉 农彩对 姚源果 石河子大学 甘尚权 黄国华 陈冬妍 陈华等 华中农业大学 黄祥富 吴成郑玉学 谢冰锋 华北工学院分院 王友良 秦潇君 胡燕梅 樊孝仁 吕梁高等专科学校 兽洲 白鹏氵 王建东 教练组 成都大学都江分部 郑小勇 西强 徐茂良 成都航空职业技术学院刘军张泽元李永张强 曾治彬 曾盐梅廖雷 吴根秀 自贡师范高等专科学校 曾君 扌勇 杨曹荣 陈红梅 彭其华 西安联合大学 肖滢 胡怀博 赵美霞 西江大学 练树辉练树新潘志军 钟一兵 西南林学院 吴跃红 李任波 李仁海 达县师范高等专科学校 龚金国 邢台师范高等专科学校 赵景 录辉 秦艳红 赵永利 李怀群 沈阳电力高等专科学校 巩娜赵玉男 教师组 林 昆明师范高等专科学校 者红金 教练组 河南农业大学 胡建喜张全军潘婷婷党耀国等 空军后勤学院 张斌 吴冬青 谢业乐 教练组 空军雷达学院 代新 数模组 2 C1995-2004 Tsinghua Tongfang Optical Disc Co, Lid. All rights reserved
大专组二等奖 55 名(排名以学校笔划为序) 序 号 学 校 队 员 指导教师 1 上海化工高等专科学校 王 徽 张冬华 殳佳文 数模组 2 大连大学 于海燕 徐海艳 范德海 谭欣欣 3 山东电力高等专科学校 王沛书 宋晶华 朱 磊 数模组 4 井冈山师范学院 彭业龙 樊丽梅 邓永根 习军明 5 公安海警高等专科学校 张少伟 孙增建 潘 刚 数模组 6 内江师范学院 谭文胜 王会彬 代雪松 何永葱 7 天水师范学院 强卫林 陈云忠 王虹霞 梁达平等 8 长沙大学 李雅琴 刘 左 谭 宁 李 彬 9 兰州石化职业技术学院 李 军 郭亚州 代学俊 教练组 10 兰州师范高等专科学校 柴 获 王鹏行 王 萍 崔剑波等 11 北京工商大学 吕 燕 孙 凡 赵 霞 指导小组 12 台州师范专科学校 叶伟飞 周卫花 李 敏 数模组 13 台州师范专科学校 裘建忠 叶元晓 郑 群 数模组 14 右江民族师范高等专科学校 韦 佳 黄茹松 姚胜波 罗朝晖 15 右江民族师范高等专科学校 陈 雷 张桂蓉 农彩对 姚源果 16 石河子大学 甘尚权 黄国华 陈冬妍 陈 华等 17 华中农业大学 黄祥富 吴 成 郑玉学 谢冰锋 18 华北工学院分院 王友良 秦潇君 胡燕梅 樊孝仁 19 吕梁高等专科学校 白鹏洲 王建东 高 杨 教练组 20 成都大学都江分部 郑小勇 何 彦 蒋西强 徐茂良 21 成都航空职业技术学院 刘 军 张泽元 李 永 张 强 22 江西师范大学 曾治彬 曾盐梅 廖雷鸣 吴根秀 23 自贡师范高等专科学校 曾君勇 杨曹荣 陈红梅 彭其华 24 西安联合大学 肖 滢 胡怀博 任 远 赵美霞 25 西江大学 练树辉 练树新 潘志军 钟一兵 26 西南林学院 周 宁 吴跃红 谭卫华 李任波 27 达县师范高等专科学校 李 衡 秦学全 李仁海 刘 浏 28 达县师范高等专科学校 唐小彪 张建忠 唐 卉 龚金国 29 邢台师范高等专科学校 赵景辉 秦艳红 赵永利 李怀群 30 沈阳电力高等专科学校 许 琪 巩 娜 赵玉男 教师组 31 岳阳师范学院 赵 林 舒 畅 周利玲 李 文 32 昆明师范高等专科学校 诸红金 王俊杰 余 艳 教练组 33 河南农业大学 胡建喜 张全军 潘婷婷 党耀国等 34 空军后勤学院 张 斌 吴冬青 谢业乐 教练组 35 空军雷达学院 代新征 刘 勇 申 云 数模组 1 期 姜启源: 2000 网易杯全国大学生数学建模竞赛 71 © 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved
数学的实践与认识 指导教师 南京林业大学 程丽群 刘进华李勇智等 南昌水科水电高专 王治平 韦斌祖严恒俊 指导小组 哈尔滨工程高等专科学校 许涛 潘永刚 马华魁 教师组 贵阳师范高等专科学校 唐明斌 曹兴亮 教练组 重庆工业高等专科学校 强赵 重庆石油高等专业学院 张新伟 徐彩霞 重庆石油高等专业学院 李中港 雷春荣 徐彩霞 重庆石油高等专科学校 刘国柱 周慧荣 谭学斌 钦州师范高等专科学校 陈慧 林玉霞 龙启平 唐山师范专科学校 毕晓华郑向红 指导教师组 46 晋东南师范专科学校 何春 子艳 宋冠洲 李海增 47 浙江万里学院 吕炳群 王丽丽 徐利晋 数模组 淮南师范专科学校 束龙雨 孔维军 左宏坤 绵阳师范高等专科学校 萍乡高等专科学校 欧阳金华金义祥 林元重 51 湖南工程学院 田宇峰 黄子滔 曾小丹指导教师组 湖南工程学院 艾小锋丁如时何锦霞指导教师组 福建农业大学 林少伟 庄艺敏江小华 数模组 应建淼周福良 数模组 襄樊学院 廖华伟路丹易爱红数模组 2 o1995-2004 Tsinghua Tong/ang Optical Disc Co, LId. All rights reserved
序 号 学 校 队 员 指导教师 36 南京林业大学 陈德环 程丽群 刘进华 李勇智等 37 南昌水科水电高专 王治平 韦斌祖 严恒俊 指导小组 38 哈尔滨工程高等专科学校 许 涛 潘永刚 马华魁 教师组 39 贵阳师范高等专科学校 张 静 唐明斌 曹兴亮 教练组 40 重庆工业高等专科学校 胡中强 赵 鹏 严循详 彭 军 41 重庆石油高等专业学院 张新伟 田 甜 王 刚 徐彩霞 42 重庆石油高等专业学院 李中港 雷春荣 高 颖 徐彩霞 43 重庆石油高等专科学校 刘国柱 周慧荣 谭学斌 黎 彬 44 钦州师范高等专科学校 陈慧华 黄 澈 林玉霞 龙启平 45 唐山师范专科学校 毕晓华 郑向红 南海涛 指导教师组 46 晋东南师范专科学校 何春艳 宋冠洲 李 洁 李海增 47 浙江万里学院 吕炳群 王丽丽 徐利晋 数模组 48 淮南师范专科学校 束龙雨 袁 涛 孔维军 左宏坤 49 绵阳师范高等专科学校 王 秀 陈均铭 罗 荣 何继标 50 萍乡高等专科学校 欧阳金华 金义祥 王 亮 林元重 51 湖南工程学院 田宇峰 黄子滔 曾小丹 指导教师组 52 湖南工程学院 艾小锋 丁如时 何锦霞 指导教师组 53 福建农业大学 林少伟 庄艺敏 江小华 数模组 54 嘉兴学院 李朝峰 应建淼 周福良 数模组 55 襄樊学院 廖华伟 路 丹 易爱红 数模组 81 数 学 的 实 践 与 认 识 31 卷 © 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved
第31卷第1期 数学的实践与认识 Vol31 No. 1 20011 MATHEMATICS N PRACT CE AND THEORY Jan 2001 DNA序列的分类模型 汤诗杰,周亮,王晓玲 指导老师孙广中 (中国科技大学,合肥230026) 编者按本文提出了DNA序列分类的三种模型,其一,基于A、GT、C四种碱基出现的频率;其二利用了 碱基在序列中的间隔,这一信息是单纯考虑频率所不能包含的,在第三种模型中,作者把DNA序列 为一个信息流,考虑每增加一个字符所带来的信息增量尽管文中信息量的定义方式仍可讨论,但本文思想 新颖活跃,有其独特之处本文最后的分类方法,是以上三种的综合使用 摘要:本文针对DNA序列分类这个实际问题,提出了相应的数学模型为了很好的体现DNA序列的局 部性和全局性的特征,我们给出了衡量分类方法优劣的标准,即在满足一定限制条件的情况下,是否能充分 反映序列的各方面特性 依据我们提出的判别标准,单一标准的分类是无法满足要求的我们的方法是侧重点不同的三种方法 的综合集成这三种方法分别体现了序列中元素出现的概率,序列中元素出现的周期性,序列所带有的信息 含量利用这个方法,完成了对未知类型的人工序列及自然序列的分类工作最后,对分类模型的优缺点进 行了分析,并就模型的推广作了讨论 1问题的提出(略) 2问题的分析 这是一个比较典型的分类问题,为了表述的严格和方便,我们用数学的方法来重述这个 题已知字母序列S1,S2S3…S,S=xx2x3…xmn,其中x∈{a,t,c,g};有字符序列 集合A,B,满足A∩B=中并当1≤还≤10时,S,∈A;当11≤≤20时,S,∈B.现要求考虑 当21≤i≤40时,S,与集合A及集合B的关系 在这里,问题的关键就是要从已知的分好类的20个字母序列中提取用于分类的特征 知道了这些特征,我们就可以比较容易的对那些未标明类型的序列进行分类下面我们将 首先对用于分类的标准问题进行必要的讨论 分类的标准及评价 首先,我们提取的特征应该满足以下两个条件 (1)所取特征必须可以标志A组和B组也就是说,我们利用这些特征应该可以很好 的区分已经标示分类的20个序列这是比较显然的一个理由 (2)所取特征必须是有一定的实际意义的这一点是决不能被忽视的比如,如果不考 虑模型的实际意义,我们就可以以序列的开头字母为分类标准已知在B类中的十个序列 都是以gt开始的,而已知在A类中10个序列没有以gt开始的,甚至以g开始的都没有 显然这是满足上面的第一个条件的如果仅因此就认为这种特征是主要的,并简单的利用 这个特征将所有待分类的序列分成两类,显然是不甚合理的 c1995-2004 Tsinghua Tongfang Optical Disc Co, Lid. Al rights reserved
第 31 卷第 1 期 2001 年 1 月 数学的实践与认识 M A TH EM A T ICS IN PRA CT ICE AND TH EO R Y V o l131 N o11 Jan. 2001 D NA 序 列 的 分 类 模 型 汤诗杰, 周 亮, 王晓玲 指导老师: 孙广中 (中国科技大学, 合肥 230026) 编者按: 本文提出了DNA 序列分类的三种模型, 其一, 基于A、G、T、C 四种碱基出现的频率; 其二利用了 同一碱基在序列中的间隔, 这一信息是单纯考虑频率所不能包含的; 在第三种模型中, 作者把DNA 序列视 为一个信息流, 考虑每增加一个字符所带来的信息增量. 尽管文中信息量的定义方式仍可讨论, 但本文思想 新颖活跃, 有其独特之处. 本文最后的分类方法, 是以上三种的综合使用. 摘要: 本文针对DNA 序列分类这个实际问题, 提出了相应的数学模型. 为了很好的体现DNA 序列的局 部性和全局性的特征, 我们给出了衡量分类方法优劣的标准, 即在满足一定限制条件的情况下, 是否能充分 反映序列的各方面特性. 依据我们提出的判别标准, 单一标准的分类是无法满足要求的. 我们的方法是侧重点不同的三种方法 的综合集成. 这三种方法分别体现了序列中元素出现的概率, 序列中元素出现的周期性, 序列所带有的信息 含量. 利用这个方法, 完成了对未知类型的人工序列及自然序列的分类工作. 最后, 对分类模型的优缺点进 行了分析, 并就模型的推广作了讨论. 1 问题的提出(略) 2 问题的分析 这是一个比较典型的分类问题, 为了表述的严格和方便, 我们用数学的方法来重述这个 问题. 已知字母序列 S 1, S 2, S 3……S 40, S i= x 1x 2x 3…x ni, 其中 x j∈{a, t, c, g }; 有字符序列 集合A , B , 满足A ∩B = <, 并当 1Φ iΦ 10 时, S i∈A ; 当 11Φ iΦ 20 时, S i∈B. 现要求考虑 当 21Φ iΦ 40 时, S i 与集合A 及集合B 的关系. 在这里, 问题的关键就是要从已知的分好类的 20 个字母序列中提取用于分类的特征. 知道了这些特征, 我们就可以比较容易的对那些未标明类型的序列进行分类. 下面我们将 首先对用于分类的标准问题进行必要的讨论. 3 分类的标准及评价 首先, 我们提取的特征应该满足以下两个条件: (1) 所取特征必须可以标志A 组和B 组. 也就是说, 我们利用这些特征应该可以很好 的区分已经标示分类的 20 个序列. 这是比较显然的一个理由. (2) 所取特征必须是有一定的实际意义的. 这一点是决不能被忽视的. 比如, 如果不考 虑模型的实际意义, 我们就可以以序列的开头字母为分类标准: 已知在B 类中的十个序列 都是以 g t 开始的, 而已知在A 类中 10 个序列没有以 g t 开始的, 甚至以 g 开始的都没有. 显然这是满足上面的第一个条件的. 如果仅因此就认为这种特征是主要的, 并简单的利用 这个特征将所有待分类的序列分成两类, 显然是不甚合理的. © 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved
数学的实践与认识 对于这样的一个复杂的分类问题,需要考虑的因素很多,也是就说,可供我们使用的分 类特征有许多如何从众多的因素中提取分类的主要因素,是我们处理这个问题的困难之 处上面的第一个条件是我们的分类方法所必须满足的,可以看作是个限制条件,而第二个 条件是我们在设计分类方法时必须考虑到的,可以看作是对分类方法优劣的一种衡量,是 某种意义下的目标函数 4模型的建立及分析 由上面的分析可知,由于DNA序列本身的复杂性,我们很难在不知道确切的分类标准 的情况下,使用单一的方法来处理这个分类问题由于,DNA序列同时具有局部性和全局 性的特征,我们尝试综合使用几种设计思想不同的方法来处理这个问题,以使该分类方法具 有好的分类性能和相当的健壮性 下面我们先从不同的角度出发,提出三种侧重点不同的分类方法,第一种从频率角度出 发,第二种从字母出现的周期性的角度出发,第三种从序列所带的某方面的信息量出发,并 给出它们单独使用时的分类结果我们认为,这三方面综合考虑,可以较好的体现出序列各 个方面的特征,最后,从这三种方法出发,得到一个综合系统的分类方法,并利用它得到了最 终的182个序列的分类结果 方法1基于字母出现频率 不同段的DNA中,每个碱基出现的概率并不相同,从生物理论中,我们知道,编码蛋白 质的DNA中G、C含量偏高,而非编码蛋白质的DNA中A、T含量偏高因此A、G、T、C 的频率中会含有很多的信息,下面给出A、B组的频率统计见表1,表2(略) 由统计的数字可以看出,A组的碱基构成与B组的碱基构成有较大的不同A组的G 含量较高,B组的T含量较高为做定量化的分析,引入数学中的内积概念,即将A、T、G、C 的频率分别作为四维向量的四个分量(P4,Pa,Pr,Pc),现在我们得到两组向量A、B(=1 2,3…10),然后将未知的序列2140作为一个新的向量C,要将它归入A组或B组,我 们可以尝试在 Hilbert空间中将向量归一化后求C与A组和B组的平均距离记C、AiB 为归一化后的向量为此我们计算内积和∑C·A,与∑C·B,其中内积定义为欧氏度 量引导出的内积(c,c2,c,c).(a,a2,a,a)=ca+ca2+ca3+ca4即 内积 PPG. PL PolL·(PPAP、Pc)夫 4|·|未知 内积小的两个序列,我们可以认为它们的相关性小,而内积大的序列,我们就认为其相 关性大因此如果FC4>CB,则认为C应归入A类否则认为它应归入B类 计算结果如表3所示 由此,我们找到了区分C组的一种方法,这种比较∑C·A,和∑C·B,的方法,我们可 以归纳为一个目标函数F1(D),即 F1(D)=10 2 01995-2004 Tsinghua Tongfang Optical Disc Co, Lid. All rights reserved
对于这样的一个复杂的分类问题, 需要考虑的因素很多, 也是就说, 可供我们使用的分 类特征有许多. 如何从众多的因素中提取分类的主要因素, 是我们处理这个问题的困难之 处. 上面的第一个条件是我们的分类方法所必须满足的, 可以看作是个限制条件; 而第二个 条件是我们在设计分类方法时必须考虑到的, 可以看作是对分类方法优劣的一种衡量, 是 某种意义下的目标函数. 4 模型的建立及分析 由上面的分析可知, 由于DNA 序列本身的复杂性, 我们很难在不知道确切的分类标准 的情况下, 使用单一的方法来处理这个分类问题. 由于,DNA 序列同时具有局部性和全局 性的特征, 我们尝试综合使用几种设计思想不同的方法来处理这个问题, 以使该分类方法具 有好的分类性能和相当的健壮性. 下面我们先从不同的角度出发, 提出三种侧重点不同的分类方法, 第一种从频率角度出 发, 第二种从字母出现的周期性的角度出发, 第三种从序列所带的某方面的信息量出发, 并 给出它们单独使用时的分类结果. 我们认为, 这三方面综合考虑, 可以较好的体现出序列各 个方面的特征, 最后, 从这三种方法出发, 得到一个综合系统的分类方法, 并利用它得到了最 终的 182 个序列的分类结果. 方法 1 基于字母出现频率 不同段的DNA 中, 每个碱基出现的概率并不相同, 从生物理论中, 我们知道, 编码蛋白 质的DNA 中 G、C 含量偏高, 而非编码蛋白质的DNA 中A、T 含量偏高. 因此,A、G、T、C 的频率中会含有很多的信息, 下面给出A、B 组的频率统计. 见表 1, 表 2 (略). 由统计的数字可以看出,A 组的碱基构成与B 组的碱基构成有较大的不同. A 组的 G 含量较高,B 组的 T 含量较高. 为做定量化的分析, 引入数学中的内积概念, 即将A、T、G、C 的频率分别作为四维向量的四个分量(PA , P G , P T , P C ) , 现在我们得到两组向量A i、B i (i= 1, 2, 3……10) , 然后将未知的序列 21~ 40 作为一个新的向量 C, 要将它归入A 组或B 组, 我 们可以尝试在H ilbert 空间中将向量归一化后求 C 与A 组和B 组的平均距离. 记 C、A i、B i 为归一化后的向量. 为此, 我们计算内积和 ∑ 10 i= 1 C õA i 与∑ 10 i= 1 C õB i , 其中内积定义为欧氏度 量引导出的内积(c1, c2, c3, c4). (a1, a2, a3, a4) = c1a1+ c2a2+ c3a3+ c4a4. 即 内积 = (PA , P G , P T , P C ) A õ (PA , P G , P T , P C ) 未知 ûA ûõ û 未知 û 内积小的两个序列, 我们可以认为它们的相关性小, 而内积大的序列, 我们就认为其相 关性大. 因此, 如果 ∑ 10 i= 1 C. A i > ∑ 10 i= 1 C. B i , 则认为C 应归入A 类, 否则认为它应归入B 类. 计算结果如表 3 所示 由此, 我们找到了区分C 组的一种方法, 这种比较 ∑ 10 i= 1 CõA i 和∑ 10 i= 1 CõB i 的方法, 我们可 以归纳为一个目标函数 F 1 (l) , 即 F 1 (l) = ∑ 10 i= 1 C õA i ∑ 10 i= 1 C õB i 02 数 学 的 实 践 与 认 识 31 卷 © 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved