人工智能-数据标注 雷梦婕 昆山市城北中心小学校 1mj1mj_2008@126.com18601421627 愿意现场分享
人工智能----数据标注 雷梦婕 昆山市城北中心小学校 lmjlmj_2008@126.com 18601421627 愿意现场分享
什么是数据标注? 如果把人工智能比作金字塔,最顶端的是人工智能应用(比如无人车、 机器人等),而最低端则是数据服务。人工智能的最终目标使计算机能够 模拟人的思维方式和行为。若想达到这个目标,则需要大量优质的训练数 据使人工智能可以通过学习从而形成更好的模型,变得更加智能化。所以 简单来说,数据标注就是使用自动化工具通过分类、画框、注释等等对收 集来的数据进行标记以形成可供计算机识别分析的优质数据的过程
什么是数据标注? 如果把人工智能比作金字塔,最顶端的是人工智能应用(比如无人车、 机器人等),而最低端则是数据服务。人工智能的最终目标使计算机能够 模拟人的思维方式和行为。若想达到这个目标,则需要大量优质的训练数 据使人工智能可以通过学习从而形成更好的模型,变得更加智能化。所以 简单来说,数据标注就是使用自动化工具通过分类、画框、注释等等对收 集来的数据进行标记以形成可供计算机识别分析的优质数据的过程
例如 我们有张飞机的图片,并且上面标注着"飞机"两个字,然后机 器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这 时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了
我们有张飞机的图片,并且上面标注着 " 飞机 " 两个字,然后机 器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这 时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了。 例如
训练集与测试集 再以飞机为例子,假设我们有1000张标注着"飞机"的图 片,那么我们可以拿900张作为训训练集,100张作为测试集。 机器从900张飞机的图片中学习得到一个模型,然后我们 将剩下的100张机器没有见过的图片去给它识别,那么我们就 能够得到这个模型的准确率了
再以飞机为例子,假设我们有 1000 张标注着 " 飞机 " 的图 片,那么我们可以拿 900 张作为训练集,100 张作为测试集。 机器从 900 张飞机的图片中学习得到一个模型,然后我们 将剩下的 100 张机器没有见过的图片去给它识别,那么我们就 能够得到这个模型的准确率了。 训练集与测试集
哪些数据需要标注以及标记什么? 数据标注的对象主要分为文本、图片、音频、视频四个种类: 1)文本标注主要包括情感分析、知识库、关键词提取、文字翻译、搜索引擎优化等。就比如, 识别一句话蕴含的情感,翻译等等: 2)图片标注主要包括图像分割、物体检测、图像语义理解、图像生成、图片加注等服务: 3)音频标注主要包括对全球主要语言和语料、包括方言、特殊情景语音进行识别标注,语音 识别等等: 4)视频标注主要包括对视频中出现的物体、文字、语音、情景等进行标注
哪些数据需要标注以及标记什么? 数据标注的对象主要分为文本、图片、音频、视频四个种类: 1)文本标注主要包括情感分析、知识库、关键词提取、文字翻译、搜索引擎优化等。就比如, 识别一句话蕴含的情感,翻译等等; 2)图片标注主要包括图像分割、物体检测、图像语义理解、图像生成、图片加注等服务; 3)音频标注主要包括对全球主要语言和语料、包括方言、特殊情景语音进行识别标注,语音 识别等等; 4)视频标注主要包括对视频中出现的物体、文字、语音、情景等进行标注