科技支撑决策 S&T ort decision 知识产生方式和科技决策支撑 的重大变革 —面向大数据和开源信息的科技 态势解析与决策服务 文/王飞跃 中国科学院自动化研究所复杂系统管理与控制国家重点实验室北京100190 【摘要】文章简述了面向大数据和开源信息的科技态势解析与决策服务的理 念、概念及基本的系统框架和技术体系。主要强调科技态势及决策支持的相关 工作应借鉴情报安全信息学的最新进展,加快变革科技信息的获取、分析、转播 及影响方式,实现从科技信息向科技情报,并迅速向科技解析的转化,进而及时 和变革性地提升科学知识的产生与教育方式,以及科技决策的制定与实施手 段。本文讨论的方法亦适用于支撑经济社会其他领域的重大决策 【关键词】大数据,开源情报,科技情报,研究解析学,ACP方法 DOl:10.3969/n.1000-30452012.05001 随着 Cyberspace的兴起,网络化及其相|现,因为两者的结合,己带来人类的“智力爆 关技术的普及与深入,我们迎来了一个大数炸”并将变革性地重新界定人类智力的空 据的时代。人类社会的主流,已从利用地表间、内涵及其作用。我们必须从这一个角度 资源的农业社会历史、挖掘地下资源的工业和高度重新审视未来科技的发展因为一个 社会现实、正迈向开发数据与智力的智能社社会的科技水平是这个社会智力程度的直 会未来。 接体现,当智力发生重大变革时,科技首当 显然, Cyberspace和大数据对于人类社其冲,必将随之而变。因此,我们必须努力 会的重要性,将远大于任何一项技术的出抓住这一历史性的变革时机,用更广、更深 更新的思路来考虑面向 Cyberspace和大数 本研究得到国家自然科学基金要平行管理重点项据之科技发展方针的制定与实施,创新科技 日(71232000和中科院决策科技支持系统创新团队态势的分析与科技决策的支持方法,更好地 建设项目资助 服务国家科技体系的建设与发展,尽可能地 修改稿收到日期:2012年9月13日 中阉子院院刊■527 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
院刊 * 本研究得到国家自然科学基金委“平行管理”重点项 目(71232006)和中科院决策科技支持系统创新团队 建设项目资助 修改稿收到日期:2012年9月13日 527 【摘 要】 文章简述了面向大数据和开源信息的科技态势解析与决策服务的理 念、概念及基本的系统框架和技术体系。主要强调科技态势及决策支持的相关 工作应借鉴情报安全信息学的最新进展,加快变革科技信息的获取、分析、转播 及影响方式,实现从科技信息向科技情报,并迅速向科技解析的转化,进而及时 和变革性地提升科学知识的产生与教育方式,以及科技决策的制定与实施手 段。本文讨论的方法亦适用于支撑经济社会其他领域的重大决策。 【关键词】 大数据,开源情报,科技情报,研究解析学,ACP方法 DOI:10.3969/j.issn.1000-3045.2012.05.001 文 / 王飞跃 中国科学院自动化研究所复杂系统管理与控制国家重点实验室 北京 100190 知识产生方式和科技决策支撑 的重大变革 ——面向大数据和开源信息的科技 态势解析与决策服务* 随着Cyberspace的兴起,网络化及其相 关技术的普及与深入,我们迎来了一个大数 据的时代。人类社会的主流,已从利用地表 资源的农业社会历史、挖掘地下资源的工业 社会现实、正迈向开发数据与智力的智能社 会未来。 显然,Cyberspace和大数据对于人类社 会的重要性,将远大于任何一项技术的出 现,因为两者的结合,已带来人类的“智力爆 炸”,并将变革性地重新界定人类智力的空 间、内涵及其作用。我们必须从这一个角度 和高度重新审视未来科技的发展,因为一个 社会的科技水平是这个社会智力程度的直 接体现,当智力发生重大变革时,科技首当 其冲,必将随之而变。因此,我们必须努力, 抓住这一历史性的变革时机,用更广、更深、 更新的思路来考虑面向 Cyberspace 和大数 据之科技发展方针的制定与实施,创新科技 态势的分析与科技决策的支持方法,更好地 服务国家科技体系的建设与发展,尽可能地 科技支撑决策 S&T Support Decision
发挥人类智力的积极作用,促进人类社会迈向一|多人认为科学无用,更无助于科举:在刻《几何原 个崭新美好的辉煌时期 本》序中,徐光启的回答是:“盖不用为用,众用所 从表象而言, Cyberspace下的大数据一般可用基”。以网络信息为主形式的开源信息,虽然被认 4V概之叫:(1)从体量( Volume)上,极大极小的数为是印刷出版发明后知识之产生与传播的又一场 据都要考虑,而且,正因为极小数据的海量汇集,革命,但其价值仍未被充分地认识,在过去相当长 成就了大数据,故大数据之大,本质在小:(2)从类的时间里,对于正式渠道的科技态势评估和决策 型( Variety)上,数据品类将极其混杂,关联度一般支持而言,基本还处于“无用状态 极低,而且在相当长的时期内非结构化数据会占然而,综观国内外相关研究近况,指导思想就 据大数据的主体:(3)从时速( Velocity)上,数据的是:无用之用,众用之基:即以开源信息为主,汇集 快速和实时化是其主要特征,但更重要的是数据海量数据,然后通过定量的方式来描述、分析、评 的全时全速覆盖,历史的、现实的、未来的、极慢判科技发展的态势,服务于科技决策。而且,评估 的、极快的数据等等:(4)从价值( Value)上,通识是科技态势的手段及工具近年来呈跳跃性发展,目 大数据意味着极高的价值,但同其体量一样,正是标要求也越来越高,正从科技信息向科技情报,进 因为极小价值的海量汇合,才铸成了大数据的高而迅速向科技解析( Academic Analytics或Re 价值,故大数据之大价值,实质在小,是典型的长 search Analytics)转化(图1) 尾效应,更是长尾效应的常态化。总之,大数据之 Descriptive:记录和描述实际系纟 Predictive:预测未来可能出现的状态 Prescriptive:设计所期望的未来状态 从本质而言,我们认为, Cyberspace背景之下 的大数据时代的实质可借用现代管理科学两位奠 ▲Ana 基人的名言概之:首先是戴明(W. Edwards den (解析) ng)所言:“除了上帝,其他任何人都必须用数据说 话”,其次是德鲁克( Peter F. Drucker)之言:“预测 Intelligence 未来最好的方法,就是去创造未来”。 Cyberspace (情报) 和大数据的出现,引发限制智力的认知、信息及资 源等要素发生重大变革,并使这两句管理的格言 Information 成为可行的技术目标。 (信息) 以此为指导,本文在已有实践的基础上,针对 面向开源信息和大数据的科技态势评估与决策支图1科技态势分析的发展趋势一一科技信息情报、解析 持,抛砖引玉,围绕下列问题展开讨论 首先是国际上科技态势与科技决策的结构性 如何变革科技信息的获取方式? 变化,即群体科学( Team Science)及相应的群体研 如何变革科技信息的分析方式? 发科学( Science of Team science, ScITs)的兴起。 如何变革科技信息的影响方式? Scits是一个跨学科交叉研究领域,专注于科学研 如何变革科技知识的产生方式? 发群体如何发起、组织、交流、从事科研活动等的 如何变革科技决策的制定、评估、实施方式?过程,其核心任务是理解认清促进或阻碍各种各 2国内外发展现状 样科技合作的情况和阶段,并加以有效管理和利 用:从确定大规模科技合作研究、培训、转化的有 400多年前,中西文化交流的先驱徐光启试图 效性,直到掌握研发群体是如何协力攻关取得靠 将西方科学引入中国,遭遇封建士大夫的阻力,许 5282012年·第27卷·第5期 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
2012年 . 第27卷 . 第5期 科技支撑决策 S&T Support Decision 528 发挥人类智力的积极作用,促进人类社会迈向一 个崭新美好的辉煌时期。 从表象而言,Cyberspace下的大数据一般可用 4V 概之[1] :(1)从体量(Volume)上,极大极小的数 据都要考虑,而且,正因为极小数据的海量汇集, 成就了大数据,故大数据之大,本质在小;(2)从类 型(Variety)上,数据品类将极其混杂,关联度一般 极低,而且在相当长的时期内非结构化数据会占 据大数据的主体;(3)从时速(Velocity)上,数据的 快速和实时化是其主要特征,但更重要的是数据 的全时全速覆盖,历史的、现实的、未来的、极慢 的、极快的数据等等;(4)从价值(Value)上,通识是 大数据意味着极高的价值,但同其体量一样,正是 因为极小价值的海量汇合,才铸成了大数据的高 价值,故大数据之大价值,实质在小,是典型的长 尾效应,更是长尾效应的常态化。总之,大数据之 大,本源于小。 从本质而言,我们认为,Cyberspace背景之下 的大数据时代的实质可借用现代管理科学两位奠 基人的名言概之:首先是戴明(W. Edwards Deming)所言:“除了上帝,其他任何人都必须用数据说 话”,其次是德鲁克(Peter F. Drucker)之言:“预测 未来最好的方法,就是去创造未来”。Cyberspace 和大数据的出现,引发限制智力的认知、信息及资 源等要素发生重大变革,并使这两句管理的格言 成为可行的技术目标。 以此为指导,本文在已有实践的基础上,针对 面向开源信息和大数据的科技态势评估与决策支 持,抛砖引玉,围绕下列问题展开讨论: 如何变革科技信息的获取方式? 如何变革科技信息的分析方式? 如何变革科技信息的影响方式? 如何变革科技知识的产生方式? 如何变革科技决策的制定、评估、实施方式? 2 国内外发展现状 400多年前,中西文化交流的先驱徐光启试图 将西方科学引入中国,遭遇封建士大夫的阻力,许 多人认为科学无用,更无助于科举;在刻《几何原 本》序中,徐光启的回答是:“盖不用为用,众用所 基”。以网络信息为主形式的开源信息,虽然被认 为是印刷出版发明后知识之产生与传播的又一场 革命,但其价值仍未被充分地认识,在过去相当长 的时间里,对于正式渠道的科技态势评估和决策 支持而言,基本还处于“无用”状态。 然而,综观国内外相关研究近况,指导思想就 是:无用之用,众用之基;即以开源信息为主,汇集 海量数据,然后通过定量的方式来描述、分析、评 判科技发展的态势,服务于科技决策。而且,评估 科技态势的手段及工具近年来呈跳跃性发展,目 标要求也越来越高,正从科技信息向科技情报,进 而 迅 速 向 科 技 解 析(Academic Analytics 或 Research Analytics)转化(图1)。 首先是国际上科技态势与科技决策的结构性 变化,即群体科学(Team Science)及相应的群体研 发科学(Science of Team Science,SciTS)的兴起[2] 。 SciTS是一个跨学科交叉研究领域,专注于科学研 发群体如何发起、组织、交流、从事科研活动等的 过程,其核心任务是理解认清促进或阻碍各种各 样科技合作的情况和阶段,并加以有效管理和利 用:从确定大规模科技合作研究、培训、转化的有 效性,直到掌握研发群体是如何协力攻关取得靠 图1 科技态势分析的发展趋势——科技信息、情报、解析
面向大数据和开源信息的科技态势解析与决策服务 个人或递增式研究难以实现的突破和跨|和方法:()可以在以群体的集合为对象的 目前,推动该领域的主要团队是美国一宏观层次,以群体本身为对象的中观层次, 批跨学科交叉研究的学者,他们认为:SciS以及以群体的成员为对象的微观层次展开 是促进21世纪科学合作的一盏指路明灯研究,在不同层次上发现问题、寻找相应的 (“ A Beacon for21" Century Scientific Col-解决方案、常见模式、普遍规律和进一步的 挑战等等:(3)在各个层次和不同问题上可 国际上,学者们确认迄今为止已有180采用多种方法,如海量数据挖掘、统计学习 多篇与SiIS相关的核心文献。其中除了复杂网络、模式分类、问卷调查、背景分析、 17篇发表于194-2000年之间外,其余皆可视化等等,对群体的形成活动、过程、结 为2001年之后发表的。这一发现充分表构及功能从时间(When、地点 Where)、任 明:Ss作为一个新的领域正在兴起,关于务(What、人员(Whom)、如何(ow)和为 SeIs的研究热潮即将或已爆发。100年何wh)等方面进行研究考察。在设计、研 前,人类经历了一场由几位天才个体物理学发新型的科技态势评估和科技决策服务的 家诱发的科学风暴:百年后,我们或许正处方法和系统时,我们必须充分考虑这些因素 在另一场由群体唱主角的科技风暴之前夜,和相关模型 而 SciTS正是指引这一风暴路径的灯塔 此外,美国近年来已展开对SciS相关 美国学者对从1945-200年全世界发科技项目的大力支持。比如NSF启动了网 表的2100万篇论文进行研究,结果发现几络化支撑的发现和创新 Cyber-enabled Dis 乎所有科学分支都呈现出一个根本性和普 covery and Innovation)项目CDl,围绕:(1) 遍性的变化:在产生高影响、高引用科学成从数据到知识:(2)认识自然、人工、社会系 中 果时,群体比个体科学家越来越居优势;群|统的复杂性:3)虚拟组织等主题长期地对 体变得越来越大:群体越来越跨界超域。他|优秀的跨学科交叉研究群体进行支持,目的 们还对世界范围内发表的专利进行研究,结是在计算思维的引导下,通过大胆的跨学科 论也十分相似。学者们认为:造成这一变化交叉,诱发能够根本性改变科技水平的研究 转移的原因是我们研究的问题越来越复成果。NH对此的支持力度更大,其临床和 杂,涉及交叉学科知识,超越传统学科边转化科学基金 The Clinical and Translation- 界。因此,解决这些复杂问题必须从许多不 al Science awards, CTSAS)的主要目标就是 同的学科视角去考量,而关键与核心就是跨培育众多能将“实验室的科学发现转化成临 学科交叉的研究群体,其采用的方法多半是床治疗手段”的跨领域研究者群体。正是 多学科 Multidisciplinary))、交叉学科 Cnter-CTSAs对以美国西北大学为主的有关群体 disciplinary)、跨学科 Transdisciplinary的,之资助,才使ScS具体化成为一个正在兴 有时还是它们的综合。评估科技态势或进起且实实在在的跨学科交又研究领域 行科技决策时,必须考虑这一时代特征 2010年4月, CTSAS还资助了首届SciS国 其次,Ss的研究必定要沿着多学科、际大会。此次大会是在2006年NH癌症研 多层次、多方法的思路和框架进行,而且与究所的ScTS会议的基础上召开的,与会者 传统的方式有所不同:(1)其研究必然涉及来自许多不同的领域,极大地促进了Scs 人文社会、科学、技术和工程等领域的知识向一个独立研究领域方向的发展 中阉緝院刊【529 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
院刊 面向大数据和开源信息的科技态势解析与决策服务 529 个人或递增式研究难以实现的突破和跨 越。目前,推动该领域的主要团队是美国一 批跨学科交叉研究的学者,他们认为:SciTS 是促进 21 世纪科学合作的一盏指路明灯 (“A Beacon for 21st Century Scientific Collaboration”)。 国际上,学者们确认迄今为止已有180 多篇与 SciTS 相关的核心文献。其中除了 17 篇发表于 1944—2000 年之间外,其余皆 为 2001 年之后发表的。这一发现充分表 明:SciTS作为一个新的领域正在兴起,关于 SciTS 的研究热潮即将或已爆发。100 年 前,人类经历了一场由几位天才个体物理学 家诱发的科学风暴;百年后,我们或许正处 在另一场由群体唱主角的科技风暴之前夜, 而SciTS正是指引这一风暴路径的灯塔。 美国学者对从1945—2008年全世界发 表的2 100万篇论文进行研究,结果发现几 乎所有科学分支都呈现出一个根本性和普 遍性的变化:在产生高影响、高引用科学成 果时,群体比个体科学家越来越居优势;群 体变得越来越大;群体越来越跨界超域。他 们还对世界范围内发表的专利进行研究,结 论也十分相似。学者们认为:造成这一变化 或转移的原因是我们研究的问题越来越复 杂,涉及交叉学科知识,超越传统学科边 界。因此,解决这些复杂问题必须从许多不 同的学科视角去考量,而关键与核心就是跨 学科交叉的研究群体,其采用的方法多半是 多学科(Multidisciplinary)、交叉学科(Interdisciplinary)、跨学科(Transdisciplinary)的, 有时还是它们的综合。评估科技态势或进 行科技决策时,必须考虑这一时代特征。 其次,SciTS的研究必定要沿着多学科、 多层次、多方法的思路和框架进行,而且与 传统的方式有所不同:(1)其研究必然涉及 人文、社会、科学、技术和工程等领域的知识 和方法;(2)可以在以群体的集合为对象的 宏观层次,以群体本身为对象的中观层次, 以及以群体的成员为对象的微观层次展开 研究,在不同层次上发现问题、寻找相应的 解决方案、常见模式、普遍规律和进一步的 挑战等等;(3)在各个层次和不同问题上可 采用多种方法,如海量数据挖掘、统计学习、 复杂网络、模式分类、问卷调查、背景分析、 可视化等等,对群体的形成、活动、过程、结 构及功能从时间(When)、地点(Where)、任 务(What)、人员(Whom)、如何(How)和为 何(Why)等方面进行研究考察。在设计、研 发新型的科技态势评估和科技决策服务的 方法和系统时,我们必须充分考虑这些因素 和相关模型。 此外,美国近年来已展开对SciTS相关 科技项目的大力支持。比如,NSF启动了网 络化支撑的发现和创新(Cyber-enabled Discovery and Innovation)项目 CDI,围绕:(1) 从数据到知识;(2)认识自然、人工、社会系 统的复杂性;(3)虚拟组织等主题长期地对 优秀的跨学科交叉研究群体进行支持,目的 是在计算思维的引导下,通过大胆的跨学科 交叉,诱发能够根本性改变科技水平的研究 成果。NIH对此的支持力度更大,其临床和 转化科学基金(The Clinical and Translational Science Awards, CTSAs)的主要目标就是 培育众多能将“实验室的科学发现转化成临 床治疗手段”的跨领域研究者群体。正是 CTSAs对以美国西北大学为主的有关群体 之资助,才使SciTS具体化成为一个正在兴 起且实实在在的跨学科交叉研究领域。 2010年4月,CTSAs还资助了首届SciTS国 际大会。此次大会是在2006年NIH癌症研 究所的SciTS会议的基础上召开的,与会者 来自许多不同的领域,极大地促进了SciTS 向一个独立研究领域方向的发展
在欧美,与 Scits直接相关的几个正在开展且|3面向大数据和开源信息的科技态势解析 较有影响的大规模群体研究项目包括:(1)构建国与决策服务 家甚至国际层面科学家网络的vVO项目,由NH 互联网和信息技术的迅猛发展,使得科研工 资助,以康奈尔大学为主的7家单位,4个群体、作者的互动和交流愈发便捷,同时开源科技情报 120位研究人员参加:(2)构建植物科学网络化基亦呈现出动态性海量性和多源异构性等特征,对 础合作设施的 pLant项目,由NSF资助,以亚利桑 开源科技情报的有效监测与分析,将有助于掌握 那大学为主的6家单位、6个群体构成核心,强调科研现状,挖掘出科研项目在开展过程中的关键 项目和环境的开放性:(3)通过网络化,虚拟化,社影响因素,构建出现代科技创新的倍增器”和科 会媒体化,构建能够使知识的产生,传播、评价维学决策的智囊团”,进而从根本上改变传统科技 护过程发生“范例转移”般革命的 LiquidPub,,由欧|的采集、传播、影响和知识的产生模式 盟第七框架下的未来与新兴技术(FET)计划支持, 因此,我们融合社会科学、情报科学、信息科 以意大利 Trento大学为主的8个机构参与,涉及出 学等学科理论提出基于ACP方法的开源情报解析 版企业、多个国家和国际学术团体。类似于 理论框架(图2),并以天网(科情信息监测)、天眼 pLant,法国也开启了Pl@ neNet I的研究。这些项目(科情信息分析与挖掘)、天鹰(科情信息管理与决 利用自然语言处理、本体建模方法、语义网技术 策支持)为指导流程(图3),构建面向大数据和开 等,针对科技知识产生过程中的人、物及出版过 源信息的科情监测与协作创新平台,即科网。在 程,以跨学科交叉群体的方式,从 SciTs的视角,正 异构、多模态的科技情报资源之上,生成科情获取 在开展扎实且有成效的工作。我们认为,这些工传感网络、科情语义网络、科研协作社会网络3个 作将在科学知识的获取、分析、影响及产生方式等 核心网络,实现智能采集、处理、分析与挖掘科技 方面诱发重大变革。 情报等功能,有效地组织并发挥研究群体的效率 中国是世界上最早开展 SciTs实际工作的国 实现科技的跨越性发展 家之一。而且,我国的管理体制更有利于群体的 科网提供以下4方面服务(图4) 组织与发展,国家自然科学基金委员会的“创新研 (1)对科技领域科情动态、研究报告、专利摘 究群体”就是一个典型案例。与IVO、 iPlan 要等资料信息一搜到底,并通过科情传感网络以 Pl@ neNet、 LiquidPub相似,我们也开始了CAN、 pLant、 Plant world和AI3.0等项 目:3。然而,我们的工作源于情 亟待解决的问题 ACP理论 人类学杜会心 报安全信息学 (ntelligence and 「社会网络, ity Informatics,ISD",起步 获取方式 社会 于社会态势的评估,并发展成为 改变情报的 计算方法 关于社会计算和平行系统的研 传播方式 究。2009年,在中科院战略规划 改变情报 心叫 局的支持下,我们开始研发“科 影响方式 网”系统,力图在科技情报的获 改 变情报的 取、科技信息的传播、科技成果的 知识产生方式 「体决人强行计认 知楼型 影响、科技知识的产生方式上实 现根本性的变化 图2基于ACP方法的开源情报解析框架 _5302012年·第27卷·第5期 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
2012年 . 第27卷 . 第5期 科技支撑决策 S&T Support Decision 229 在欧美,与SciTS直接相关的几个正在开展且 较有影响的大规模群体研究项目包括:(1)构建国 家甚至国际层面科学家网络的VIVO项目,由NIH 资助,以康奈尔大学为主的 7 家单位、4 个群体、 120位研究人员参加;(2)构建植物科学网络化基 础合作设施的iPlant项目,由NSF资助,以亚利桑 那大学为主的 6 家单位、6 个群体构成核心,强调 项目和环境的开放性;(3)通过网络化、虚拟化、社 会媒体化,构建能够使知识的产生、传播、评价、维 护过程发生“范例转移”般革命的LiquidPub,由欧 盟第七框架下的未来与新兴技术(FET)计划支持, 以意大利Trento大学为主的8个机构参与,涉及出 版企业、多个国家和国际学术团体。类似于 iPlant,法国也开启了Pl@ntNet的研究。这些项目 利用自然语言处理、本体建模方法、语义网技术 等,针对科技知识产生过程中的人、物及出版过 程,以跨学科交叉群体的方式,从SciTS的视角,正 在开展扎实且有成效的工作。我们认为,这些工 作将在科学知识的获取、分析、影响及产生方式等 方面诱发重大变革。 中国是世界上最早开展SciTS实际工作的国 家之一。而且,我国的管理体制更有利于群体的 组织与发展,国家自然科学基金委员会的“创新研 究群体”就是一个典型案例。与 VIVO、iPlant、 Pl@ntNet、LiquidPub 相似,我们也开始了 iCAN、 cPlant、Pl@ntWorld和AI 3.0等项 目[1,2] 。然而,我们的工作源于情 报 安 全 信 息 学(Intelligence and Security Informatics, ISI)[3] ,起步 于社会态势的评估,并发展成为 关于社会计算和平行系统的研 究。2009 年,在中科院战略规划 局的支持下,我们开始研发“科 网”系统,力图在科技情报的获 取、科技信息的传播、科技成果的 影响、科技知识的产生方式上实 现根本性的变化。 3 面向大数据和开源信息的科技态势解析 与决策服务 互联网和信息技术的迅猛发展,使得科研工 作者的互动和交流愈发便捷,同时开源科技情报 亦呈现出动态性、海量性和多源异构性等特征,对 开源科技情报的有效监测与分析,将有助于掌握 科研现状,挖掘出科研项目在开展过程中的关键 影响因素,构建出现代科技创新的“倍增器”和科 学决策的“智囊团”,进而从根本上改变传统科技 的采集、传播、影响和知识的产生模式。 因此,我们融合社会科学、情报科学、信息科 学等学科理论提出基于ACP方法的开源情报解析 理论框架(图2),并以天网(科情信息监测)、天眼 (科情信息分析与挖掘)、天鹰(科情信息管理与决 策支持)为指导流程(图3),构建面向大数据和开 源信息的科情监测与协作创新平台,即科网。在 异构、多模态的科技情报资源之上,生成科情获取 传感网络、科情语义网络、科研协作社会网络3个 核心网络,实现智能采集、处理、分析与挖掘科技 情报等功能,有效地组织并发挥研究群体的效率, 实现科技的跨越性发展。 科网提供以下4方面服务(图4): (1)对科技领域科情动态、研究报告、专利摘 要等资料信息一搜到底,并通过科情传感网络以 图2 基于ACP方法的开源情报解析框架 530
面向大数据和开源信息的科技态势解析与决策服务 供每日科技要闻日 开源科技信息相关的互联网与社会媒体 报、科技要闻专报等 个性化服务,实现可 天网工程 天眼工程 天鹰工程定义、可配置、可交 互、可快速上报的自 动采、编、分析、发布 科技领域群体 体化简报平台,也 可提供国内外每日科 技要闻简报的定制服 科技领域情报与计算实验平台 (4)整合各领域 图3面向开源信息和大数据的科技态势解析与服务流程学科科研人员关注 的信息资源,为科技 工作者和学术机构提 精准、个性化影 协产生 供个性化推荐,支持 科技情报 科技情报 科研人员学术互动, 使科研人员能够在线 「领袖及 网络群 发表学术观点,交流 体共性 科技情报 创新思想,对科研各 网络关 节点的 联信息 个阶段性产物进行信 中 社会网络 息共享、发布、版本控 息传播 制,实现快捷高效的 核心网络 点发现 协同创新 「闭源文献元数据信息开源科技情报数据 4科情监测与协调 创新平台的原型 图4科技态势解析与服务系统结构 建设及讨论 X AsKE (Application Specific Knowledge Engine)机制,自动构建领域专家资料库,有41变革科技信息的获取方式 效获取各类科技情报信息 根据中科院决策科技支持系统创新团 (2)对科技情报进行深度分析及挖掘,队正在建设中的科情监测与协调创新平台 构建科技情报领域人物、组织、机构的复杂原型系统我们按下面5个方面就其关键技 网络,分析挖掘其核心群体、关键人物,依照术和主要功能简要地描述并讨论如下 时空多维度分析科技传播态势,构建全方位 ASKE (Application Specific Knowledge 的情报分析指标体系,对科技事件、科技要 Engine,,图5)是将领域专家和丰富的互联网 闻以及科技态势进行全方位分析,以辅助科络领域资源相融合的知识库构建的有效机 研群体进行决策 制。通过该机制,与用户交互生成网络领域 3)对科技态势信息与分析结果,可提知识配置文件(KCF, Knowledge Configure 中阉緝子院院刊〖531 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
230 院刊 及 ASKE(Application Specific Knowledge Engine)机制,自动构建领域专家资料库,有 效获取各类科技情报信息; (2)对科技情报进行深度分析及挖掘, 构建科技情报领域人物、组织、机构的复杂 网络,分析挖掘其核心群体、关键人物,依照 时空多维度分析科技传播态势,构建全方位 的情报分析指标体系,对科技事件、科技要 闻以及科技态势进行全方位分析,以辅助科 研群体进行决策; (3)对科技态势信息与分析结果,可提 供 每 日 科 技 要 闻 日 报、科技要闻专报等 个性化服务,实现可 定义、可配置、可交 互、可快速上报的自 动采、编、分析、发布 一体化简报平台,也 可提供国内外每日科 技要闻简报的定制服 务; (4)整合各领域、 各学科科研人员关注 的信息资源,为科技 工作者和学术机构提 供个性化推荐,支持 科研人员学术互动, 使科研人员能够在线 发表学术观点,交流 创新思想,对科研各 个阶段性产物进行信 息共享、发布、版本控 制,实现快捷高效的 协同创新。 4 科情监测与协调 创新平台的原型 建设及讨论 4.1 变革科技信息的获取方式 根据中科院决策科技支持系统创新团 队正在建设中的科情监测与协调创新平台 原型系统,我们按下面5个方面就其关键技 术和主要功能简要地描述并讨论如下。 ASKE(Application Specific Knowledge Engine,图5)是将领域专家和丰富的互联网 络领域资源相融合的知识库构建的有效机 制。通过该机制,与用户交互生成网络领域 知识配置文件(KCF,Knowledge Configure 图3 面向开源信息和大数据的科技态势解析与服务流程 图4 科技态势解析与服务系统结构 面向大数据和开源信息的科技态势解析与决策服务 531