大数据时代的自然语言处理: 前沿与进展 孙茂松 清华大学计算机科学与技术系 第十四届中国少数民族语言文字信息处理 学术研讨会 2013年9月14日,兰州
大数据时代的自然语言处理: 前沿与进展 1 孙茂松 清华大学计算机科学与技术系 第十四届中国少数民族语言文字信息处理 学术研讨会 2013年9月14日,兰州
目录 1.引言 2.三个重要前沿及其进展 (1)基于深度学习的句子结构预测 (2)开放域信息抽取 (3)知识图谱 3.题外话
目录 1. 引言 2. 三个重要前沿及其进展 (1)基于深度学习的句子结构预测 (2)开放域信息抽取 (3)知识图谱 3. 题外话
目录 1.引言 2.三个重要前沿及其进展 (1)基于深度学习的句子结构预测 (2)开放域信息抽取 (3)知识图谱 3.题外话
目录 1. 引言 2. 三个重要前沿及其进展 (1)基于深度学习的句子结构预测 (2)开放域信息抽取 (3)知识图谱 3. 题外话
现实世界、网络空间与人类认知 三位一体:有史以来深度和广度最蔚为壮观的虚实结合的空间 “人本传感器”:中国网民规模达5.64亿,微博用户3.09亿(2013年1月) “人本传感器”信号:仅新浪微博每日发布超过1亿条微博(2012年12月) 人本传感器 感知/认知 社会行为 写读 现实 over 网络一中文 世界 豆播加以NA网空间 大数据 O新浪微博 臏讯微博 时空中的人、物、事
现实世界、网络空间与人类认知 • 三位一体:有史以来深度和广度最蔚为壮观的虚实结合的空间 – “人本传感器”:中国网民规模达5.64亿,微博用户3.09亿(2013年1月) – “人本传感器”信号:仅新浪微博每日发布超过1亿条微博(2012年12月) 4 现实 世界 网络 空间 人类 认知 时空中的人、物、事 感知/认知 社会行为 写 阅 读 中文 大数据 人本传感器
机器阅读理解互联网 人类“管中窥豹式”阅读难以形成对虚实空间完整准确的认识 机器阅读理解网络空间的中文信息是实现网络洞察力的关键 人本传感器 感知/认知 社会行为 写读 现实 over 网络一中文 世界 豆b如M△8空间→大数据 O新浪微博 臏讯微博 时空中的人、物、事
机器阅读理解互联网 5 现实 世界 网络 空间 人类 认知 时空中的人、物、事 感知/认知 社会行为 写 中文 大数据 人本传感器 • 人类“管中窥豹式”阅读难以形成对虚实空间完整准确的认识 • 机器阅读理解网络空间的中文信息是实现网络洞察力的关键 阅 读