2019 科研成果年报 结 题 验 收 成结题验收成果简介 果 介大数据结构与关系的度量与简约计算 “大数据结构与关系的度量与简约计算”(批 3.提出了结构一致性的度量指标对网络的 准号:61433014)是国家自然科学基金重点项目,“可被预测的程度”进行刻画,通过分析推荐网 起止时间为2015年1月至2019年12月。 络的演化结构特征,基于该链接关系构建个性化 本项目从时间简约、空间简约和关联简约三推荐模型,解决了因系统演化引起的偏好漂移的 个角度对网络大数据,特别是社交网络这一应用影响 场景进行研究,具体内容包括:时间维度简约, 4.提出了社团结构挖掘的引力模型,设计 空间维度简约,关联维度简约,链路的预测与个了基于局部结构特征和传播动力学特征的大规模 性化推荐,影响力传播与趋势预测等。本项目在网络节点影响力排序算法、重要链路挖掘算法以 模型、算法等基础理论方面取得了一系列有特色及意见领袖挖掘算法,为从微观、介观和宏观层 的研究成果。具体成果包括 面研究网络结构提供了理论方法,部分成果已落 设计了针对未知参数市场模型运行时间地应用; 是多项式量级的在线均衡学习算法,给出了组合 5.大幅拓展了社会网络中影响力传播最大 多臂老虎机在线学习算法后悔度上界的理论分析,化的研究范围,提出并研究了非次模影响力最大 提出了有理论保证的贪心在线学习、在线聚类算化、在线影响力最大化、影响力最大化的鲁棒性 法,证明了小世界模型复杂传播的随机路由下界; 等模型,给出了模型的数学分析,证明了求解的 2.提出了具有良好局部性和低计算代价的计算复杂性,并为多个模型设计了多项式时间近 图小波神经网络,大幅降低了传统图卷积算子的似算法。 参数个数和计算复杂度,在图半监督学习任务上 项目组共发表SC索引论文108篇,CCFA 显著超过了图灵奖得主 Yann LeCun等人提出的类期刊会议论文40篇,培养博士后4人,博士 谱图卷积神经网络,被研究同行评价为“期待已生24人,硕士生40人。本项目已按计划完成全 久的工作 部研究工作,达到预定目标,成果突出
22 2019 科研成果年报 结 题 验 收 成 果 简 介 大数据结构与关系的度量与简约计算 结题验收成果简介 “大数据结构与关系的度量与简约计算”(批 准号:61433014)是国家自然科学基金重点项目, 起止时间为 2015 年 1 月至 2019 年 12 月。 本项目从时间简约、空间简约和关联简约三 个角度对网络大数据,特别是社交网络这一应用 场景进行研究,具体内容包括:时间维度简约, 空间维度简约,关联维度简约,链路的预测与个 性化推荐,影响力传播与趋势预测等。本项目在 模型、算法等基础理论方面取得了一系列有特色 的研究成果。具体成果包括: 1. 设计了针对未知参数市场模型运行时间 是多项式量级的在线均衡学习算法,给出了组合 多臂老虎机在线学习算法后悔度上界的理论分析, 提出了有理论保证的贪心在线学习、在线聚类算 法,证明了小世界模型复杂传播的随机路由下界; 2. 提出了具有良好局部性和低计算代价的 图小波神经网络,大幅降低了传统图卷积算子的 参数个数和计算复杂度,在图半监督学习任务上 显著超过了图灵奖得主 Yann LeCun 等人提出的 谱图卷积神经网络,被研究同行评价为“期待已 久的工作”; 3. 提出了结构一致性的度量指标对网络的 “可被预测的程度”进行刻画,通过分析推荐网 络的演化结构特征,基于该链接关系构建个性化 推荐模型,解决了因系统演化引起的偏好漂移的 影响; 4. 提出了社团结构挖掘的引力模型,设计 了基于局部结构特征和传播动力学特征的大规模 网络节点影响力排序算法、重要链路挖掘算法以 及意见领袖挖掘算法,为从微观、介观和宏观层 面研究网络结构提供了理论方法,部分成果已落 地应用; 5. 大幅拓展了社会网络中影响力传播最大 化的研究范围,提出并研究了非次模影响力最大 化、在线影响力最大化、影响力最大化的鲁棒性 等模型,给出了模型的数学分析,证明了求解的 计算复杂性,并为多个模型设计了多项式时间近 似算法。 项目组共发表 SCI 索引论文 108 篇,CCF A 类期刊会议论文 40 篇,培养博士后 4 人,博士 生 24 人,硕士生 40 人。本项目已按计划完成全 部研究工作,达到预定目标,成果突出
结题验收成果简介) 结题验收成果简介 web信息检索与数据挖掘 国家杰出青年科学基金项目“web信息检型,有效克服了预测精度和预测可解释性之间的 索与数据挖掘”(批准号:61425016),起止鸿沟,已成为基于深度学习的流行度预测的代表 时间为2015年1月至2019年12月。该项目于性工作之 2020年1月14日通过了国家自然科学基金委员 5.研制的“网络空间大数据的融合分析与处 会信息学部验收 理引擎系统”在30余个国家业务单位部署应用 项目完成情况如下 成果在中国科学院组织的鉴定中被评价为技术处 1.提出了基于特征交互空间的文本匹配新范于国际先进水平,应用领域广。 式和文本匹配系列技术,其中层次化文本匹配方 6.研制的“面向文本的网络空间突敏事件 法的论文是本领域的高被引论文之一,相关技术检测、预警与应急处置平台及应用”系统,获得 形成了开源工具 MatchZoo,被 Analytics评价2017年国家科学技术进步奖二等奖和中国电子学 为2018年十大最活跃的开源工具之一。 会电子信息科学技术奖一等奖。 2.提出了“编码-映射”联合优化的目标关 7.知识产权方面,发表论文90篇,其中 联方法,克服了跨域目标关联面临的数据高维稀CCF-A类期刊或会议论文50余篇,申请国家发 疏、映射空间大等挑战,精度比国际主流方法提明专利40项,授权发明专利15项。 升30%,被评价为本领域最具代表性的基准方法 8.人才培养方面,1人入选国家“万人计划” 领军人才,1人获得国家优秀青年科学基金资助 3.从感知、度量、决策三个层次深入探讨了2人被评为中国科学院青年创新促进会优秀会员 相关性的机理,提出了基于深度神经网络的相关3人入选北京智源人工智能研究院智源学者,10 性建模框架和基于视觉感知的相关性度量模型,名博士生获得博士茡位、18名硕士生获得硕士学 获得 ACM CIKM2017最佳论文 Runner Up奖。位,2名博士后出站。 4.提出了基于深度点过程的信息传播预测模 题验收成果简介
23 结题验收成果简介 结 题 验 收 成 果 简 介 Web 信息检索与数据挖掘 国家杰出青年科学基金项目“Web 信息检 索与数据挖掘”(批准号:61425016),起止 时间为 2015 年 1 月至 2019 年 12 月。该项目于 2020 年 1 月 14 日通过了国家自然科学基金委员 会信息学部验收。 项目完成情况如下: 1. 提出了基于特征交互空间的文本匹配新范 式和文本匹配系列技术,其中层次化文本匹配方 法的论文是本领域的高被引论文之一,相关技术 形成了开源工具 MatchZoo,被 Analytics 评价 为 2018 年十大最活跃的开源工具之一。 2. 提出了“编码 - 映射”联合优化的目标关 联方法,克服了跨域目标关联面临的数据高维稀 疏、映射空间大等挑战,精度比国际主流方法提 升 30%,被评价为本领域最具代表性的基准方法 之一。 3. 从感知、度量、决策三个层次深入探讨了 相关性的机理,提出了基于深度神经网络的相关 性建模框架和基于视觉感知的相关性度量模型, 获得 ACM CIKM 2017 最佳论文 Runner Up 奖。 4. 提出了基于深度点过程的信息传播预测模 型,有效克服了预测精度和预测可解释性之间的 鸿沟,已成为基于深度学习的流行度预测的代表 性工作之一。 5. 研制的“网络空间大数据的融合分析与处 理引擎系统”在 30 余个国家业务单位部署应用, 成果在中国科学院组织的鉴定中被评价为技术处 于国际先进水平,应用领域广。 6. 研制的“面向文本的网络空间突敏事件 检测、预警与应急处置平台及应用”系统,获得 2017 年国家科学技术进步奖二等奖和中国电子学 会电子信息科学技术奖一等奖。 7. 知 识 产 权 方 面, 发 表 论 文 90 篇, 其 中 CCF-A 类期刊或会议论文 50 余篇,申请国家发 明专利 40 项,授权发明专利 15 项。 8. 人才培养方面,1 人入选国家“万人计划” 领军人才,1 人获得国家优秀青年科学基金资助, 2人被评为中国科学院青年创新促进会优秀会员, 3 人入选北京智源人工智能研究院智源学者,10 名博士生获得博士学位、18 名硕士生获得硕士学 位,2 名博士后出站。 结题验收成果简介
2019 科研成果年报 结 题 验 收 成结题验收成果简介 果 介高效通用数据中心体系结构研究 “高效通用数据中心体系结构研究”(批准号 3、在第6届RSCV国际研讨会上正式发 61420106013)是国家自然科学基金重点国际合布并开源,建立标签化RSCV新分支 github 作研究项目,起止时间为2015年1月至2019年com/ fsg-ict/ abeled-RsCV,受到包括UC 2月,该项目于2020年1月16日通过了国家 Berkeley的 David Patterson教授等国内外同行 自然科学基金委员会信息科学部验收。 的认可与关注; 该项目完成情况如下 4、设计并实现支持QS的数据中心资源管 1、提出标签化冯·诺依曼体系结构控软件栈,深入剖析了阿里巴巴数据中心负载特 ( Labeled von Neumann Architecture,征及资源瓶颈,指出大规模容器化JAVA应用导 LwNA),遵循标签调控性能和标签最小污染原理,致内存管理复杂低效,内存成为当前阿里云平台 通过标签贯通云计算系统栈,实现有序可控的云的新瓶颈。基于硬件Q③S资源管理机制,提出基 计算系统 于多层感知网的应用资源动态调节模型Magi 2、研制8节点PPGA概念原型系统-“火单节点监控调整工具 Autopilot,于阿里神马系 苗”,验证了LwNA架构的可行性,达到国际先统落地,同时归入阿里开源项目 OpenKruise; 进( Berkeley于2018年6月发布同类平台), 5、已发表论文24篇,其中CCFA类文章 标签化功能处于领先水平。利用标签机制可实现6篇;申请专利19件,国际专利7件,其中授权 无需软件 Hypervisor的虚拟化技术 NoHype,发明专利13件; 利用硬件标签直接划分多个相互独立的分区,运 6、毕业博士生19名,硕士生16名;在读 行独立的操作系统;内存带宽控制,利用“标签博士生33名、硕士生14名。 +令牌桶”实现内存带宽精准控制
24 2019 科研成果年报 结 题 验 收 成 果 简 介 高效通用数据中心体系结构研究 “高效通用数据中心体系结构研究”(批准号: 61420106013)是国家自然科学基金重点国际合 作研究项目,起止时间为 2015 年 1 月至 2019 年 12 月,该项目于 2020 年 1 月 16 日通过了国家 自然科学基金委员会信息科学部验收。 该项目完成情况如下: 1、 提 出 标 签 化 冯 • 诺 依 曼 体 系 结 构 (Labeled von Neumann Architecture, LvNA),遵循标签调控性能和标签最小污染原理, 通过标签贯通云计算系统栈,实现有序可控的云 计算系统; 2、研制 8 节点 FPGA 概念原型系统 -“火 苗”,验证了 LvNA 架构的可行性,达到国际先 进(Berkeley 于 2018 年 6 月发布同类平台), 标签化功能处于领先水平。利用标签机制可实现 无需软件 Hypervisor 的虚拟化技术 NoHype, 利用硬件标签直接划分多个相互独立的分区,运 行独立的操作系统;内存带宽控制,利用“标签 + 令牌桶”实现内存带宽精准控制; 3、在第 6 届 RISC-V 国际研讨会上正式发 布并开源,建立标签化 RISC-V 新分支 github. com/fsg-ict/labeled-RISC-V, 受 到 包 括 UC Berkeley 的 David Patterson 教授等国内外同行 的认可与关注; 4、设计并实现支持 QoS 的数据中心资源管 控软件栈,深入剖析了阿里巴巴数据中心负载特 征及资源瓶颈,指出大规模容器化 JAVA 应用导 致内存管理复杂低效,内存成为当前阿里云平台 的新瓶颈。基于硬件 QoS 资源管理机制,提出基 于多层感知网的应用资源动态调节模型 Magi, 单节点监控调整工具 Autopilot,于阿里神马系 统落地,同时归入阿里开源项目 OpenKruise; 5、已发表论文 24 篇,其中 CCF-A 类文章 6 篇;申请专利 19 件,国际专利 7 件,其中授权 发明专利 13 件; 6、毕业博士生 19 名,硕士生 16 名;在读 博士生 33 名、硕士生 14 名。 结题验收成果简介
结题验收成果简介) 结题验收成果简介 动态可配置的压缩感知成像系统 “动态可配置的压缩感知成像系统”目是国CPU相比,恢复速度提高了100倍以上。基于 家自然科学基金科学仪器基础研究专项(课题编 Xilinx V72000,实现了一套完整的硬件化压缩 号:61327013),起止时间是2014年1月至感知数据采集重建架构,实现从数据采集到重建 2017年12月,本项目旨在面向压缩感知成像研全过程的硬件化,数据同步和控制精度达到纳秒 究的实际需求,提供任意值测量矩阵的配置,用级,对外数据带宽达到10Gbp5,实现高速采集 以验证不同的测量矩阵在光学成像中的实际效果;和重建结果高速回传。 实现图像采集,恢复,呈现一体化,让研究人员 目前项目组与国内外研究机构紧密合作,与 高效快捷地验证自己的恢复算法和成像效果。经美国德州大学奥斯汀分校,加拿大阿尔伯特大学 过4年的研发,本项目取得如下成果 德国哥根廷大学等国外著名大学研究者合作发表 1.实现了动态可配置的压缩感知成像装置,文章多篇。在顶级期刊和会议上发表论文28篇, 采集方式包括和单像素成像,阵面成像;成像方其中在SC|收录22篇。培养博士生5名,硕士 式包括无透镜成像和有透镜成像;采集对象包括生6名,申请10项国家发明专利。 图像和视频;测量矩阵实现包括液晶与DMD; 采集频谱包括红外与可见光。并且实现了采集恢 复流程一体化,给研究人员提供高效快捷的压缩 感知实验平台。 2.提出一种基于残差网络的压缩感知图像 恢复网络DR2Net,对目前压缩感知测量中常用 的经典测量矩阵,通过探索压缩感知图像重建的 特性与过程,利用深度学习构建适用于不同采样 率的恢复网络,实现快速非迭代的压缩感知图像 重建。保持对传统算法100倍速度优势的情况下 平均PSNR提高了3dB左右。 3.在压缩感知图像重建硬件加速方面,并 实现了GP心U并行的压缩感知图像恢复算法,与 缩感知成像系统外观图 题验收成果简介
25 结题验收成果简介 结 题 验 收 成 果 简 介 动态可配置的压缩感知成像系统 结题验收成果简介 “动态可配置的压缩感知成像系统”目是国 家自然科学基金科学仪器基础研究专项(课题编 号:61327013), 起 止 时 间 是 2014 年 1 月 至 2017 年 12 月,本项目旨在面向压缩感知成像研 究的实际需求,提供任意值测量矩阵的配置,用 以验证不同的测量矩阵在光学成像中的实际效果; 实现图像采集,恢复,呈现一体化,让研究人员 高效快捷地验证自己的恢复算法和成像效果。经 过 4 年的研发,本项目取得如下成果: 1. 实现了动态可配置的压缩感知成像装置, 采集方式包括和单像素成像,阵面成像;成像方 式包括无透镜成像和有透镜成像;采集对象包括 图像和视频;测量矩阵实现包括液晶与 DMD; 采集频谱包括红外与可见光。并且实现了采集恢 复流程一体化,给研究人员提供高效快捷的压缩 感知实验平台。 2. 提出一种基于残差网络的压缩感知图像 恢复网络 DR2-Net, 对目前压缩感知测量中常用 的经典测量矩阵,通过探索压缩感知图像重建的 特性与过程,利用深度学习构建适用于不同采样 率的恢复网络,实现快速非迭代的压缩感知图像 重建。保持对传统算法 100 倍速度优势的情况下, 平均 PSNR 提高了 3dB 左右。 3. 在压缩感知图像重建硬件加速方面,并 实现了 GPU 并行的压缩感知图像恢复算法,与 CPU 相比,恢复速度提高了 100 倍以上。基于 Xilinx V7 2000T,实现了一套完整的硬件化压缩 感知数据采集重建架构,实现从数据采集到重建 全过程的硬件化,数据同步和控制精度达到纳秒 级,对外数据带宽达到 10Gbps,实现高速采集 和重建结果高速回传。 目前项目组与国内外研究机构紧密合作,与 美国德州大学奥斯汀分校,加拿大阿尔伯特大学, 德国哥根廷大学等国外著名大学研究者合作发表 文章多篇。在顶级期刊和会议上发表论文 28 篇, 其中在 SCI 收录 22 篇。培养博士生 5 名,硕士 生 6 名,申请 10 项国家发明专利。 压缩感知成像系统外观图
2019 科研成果年报 结 题 验 收 成结题验收成果简介 果 介图像视频结构分析与表达 “图像视频结构分析与表达(批准号:该课题成果论文 Google Scholar统计引用2000 2015CB351802)”是973项目“基于视觉特性的余次,单篇最高引用389次。课题执行期间共 视频编码理论与方法研究(2015CB351800”的培养10名博士毕业生,15名硕士毕业生,其中 课题。2019年9月26日,受科技部委托,项目CCF优博获得者1人,中科院优博获得者2人, 首席科学家组织了课题验收会。 获2015年度国家自然科学二等奖1项 课题主要目标是建立图像视频信号与特征协 课题成果作为项目的两个代表性成果之一推 同的、与任务适配的、多层次结构化的视觉表达荐在项目验收会上报告。 与计算模型,为视觉数据的编码及多态应用奠定 理论和方法基础。课题面向项目的关键科学问题 二(即“构建图像视频结构与内在关联特性相关 的表示模型”)开展研究,成果展示了将生理学报内容 心理学研究成果融入计算模型的可行性与有效 性,为图像视频关联信息的挖掘提供了多样化解 决方案;关于层次化特征视觉重构的研究,为关 联图像群组编码提供了理论支持;关于多模态跨 域迁移表达的研究,为基于内容的精细化视觉表 征与编码提供了新的思路。构建了视觉概念库原 型系统,支撑了项目其他课题的研究。 课题的研究成果发表 EEE TPAM/JCV论文 973项目“基于视觉特性的视频编码理论 5篇、国际会议CVPR/CCV/ECCV论文26篇 与方法研究课题验收会
26 2019 科研成果年报 结 题 验 收 成 果 简 介 图像视频结构分析与表达 “ 图 像 视 频 结 构 分 析 与 表 达 ( 批 准 号: 2015CB351802)”是 973 项目“基于视觉特性的 视频编码理论与方法研究 (2015CB351800)”的 课题。2019 年 9 月 26 日,受科技部委托,项目 首席科学家组织了课题验收会。 课题主要目标是建立图像视频信号与特征协 同的、与任务适配的、多层次结构化的视觉表达 与计算模型,为视觉数据的编码及多态应用奠定 理论和方法基础。课题面向项目的关键科学问题 二(即“构建图像视频结构与内在关联特性相关 的表示模型”)开展研究,成果展示了将生理学 / 心理学研究成果融入计算模型的可行性与有效 性,为图像视频关联信息的挖掘提供了多样化解 决方案;关于层次化特征视觉重构的研究,为关 联图像群组编码提供了理论支持;关于多模态跨 域迁移表达的研究,为基于内容的精细化视觉表 征与编码提供了新的思路。构建了视觉概念库原 型系统,支撑了项目其他课题的研究。 课题的研究成果发表 IEEE TPAMI/IJCV 论文 5 篇、国际会议 CVPR/ICCV/ECCV 论文 26 篇, 该课题成果论文 Google Scholar 统计引用 2000 余次,单篇最高引用 389 次。课题执行期间共 培养 10 名博士毕业生,15 名硕士毕业生,其中 CCF 优博获得者 1 人,中科院优博获得者 2 人, 获 2015 年度国家自然科学二等奖 1 项。 课题成果作为项目的两个代表性成果之一推 荐在项目验收会上报告。 结题验收成果简介 973 项目“基于视觉特性的视频编码理论 与方法研究”课题验收会