2019年8月1日,字节跳动发布了反低俗工具“灵犬3.0”,采用“BERT模型(Bidirectional EncoderRepresentationsFromTransformers+半监督学习”的技术,提高了相关文本的识别度和图像识别能力。同时,字节系内容平台通过人工标注和模型训练的方式,能够以93%的准确率识别主流价值内容,并在此基础之上优化内容推荐相关优质文章将获得1:5~2倍的加权推荐
●2019年8月1日,字节跳动发布了反低俗工具“灵犬3.0”,采用 “BERT 模型( Bidirectional Encoder Representations From Transform ers)+半监督学习”的技术,提高了相关文本 的识别度和图像识别能力。 ●同时,字节系内容平台通过人工标注和模型训练的方式,能够以 93% 的准确率识别主流价值内容,并在此基础之上优化内容推荐, 相关优质文章将获得1.5~2倍的加权推荐
(二)认知并理解用户展开多元化、多样态的用户研究,文本分析、消费者画像等技术广泛应用。首先是理解用户“是谁”。·新媒体机构普遍将用户画像作为一项基础技术,并且在画像颗粒度方面不断精细化。这一方面要求新媒体机构掌握更多来源和类型的数据,另一方面则在很大程度上考验其算法和算力。超大型的互联网媒体机构,更有可能完成精细化程度较高的用户画像
( 二)认知并理解用户 ●展开多元化、多样态的用户研究,文本分析、消费者画像等技术 广泛应用。首先是理解用户“是谁” 。 ●新媒体机构普遍将用户画像作为一项基础技术,并且在画像颗粒 度方面不断精细化。这一方面要求新媒体机构掌握更多来源和类 型的数据,另一方面则在很大程度上考验其算法和算力。 ●超大型的互联网媒体机构,更有可能完成精细化程度较高的用户 画像
例如,YouTube一方面基于Google的账号体系,通过cookie、像素代码、服务器日志等常规意义上的数据采集技术对用户数据进行采集,并将数据大致分为个人数据、设备数据、活动数据以及位置数据四个维度,数据上传至Google服务器并通过后台机器学习技术进行分析处理,刻画用户画像,该用户画像包括基础信息、兴趣爱好、行为习惯等在内的超过60个标签,每个标签都详细标注了形成原因,实现了对用户的基本洞察。另一方面,由于机器的认知缺陷以及用户行为偏好的不稳定性,通过机器学习技术自动描绘的用户画像在某些情况下可能失去精准性,为此,YouTube还开放了一定的权限给用户,充许他们对自身标签与画像数据进行修改,将机器理解与用户人为修正相结合
●例如,YouTube 一方面基于 Google 的账号体系,通过 cookie、 像素代码、服务器日志等常规意义上的数据采集技术对用户数据进 行采集,并将数据大致分为个人数据、设备数据、活动数据以及位 置数据四个维度,数据上传至 Google 服务器并通过后台机器学 习技术进行分析处理,刻画用户画像,该用户画像包括基 础信息、 兴趣爱好、行为习惯等在内的超过60个标签,每个标签都详细标 注了形成原因,实现了对用户的基本洞察。 ●另一方面,由于机器的认知缺陷以及用户行为偏好的不稳定性, 通过机器学习技术自动描绘的用户画像在某些情况下可能失去精准 性,为此,YouTube 还开放了一定的权限给用户,允许他们对自 身标签与画像数据进行修改,将机器理解与用户人为修正相结合
·其次是理解用户的需求在人工智能技术的支撑之下,我们基本做到了对用户即时需求和长期需求、显在需求和潜在需求进行精准划分与动态描墓。例如,阿单巴巴在2020年7月再次升级达摩盘,并将RFM(最近一次消费Recency、消费频率Frequency、消费金额Monetary)模型与消费者的情感因素相结合,从需求和价值维度对消费者需求进行了重新分类,从而帮助品牌商家找到最具价值的“超级用户”,即高净值用户、高价值用户、高传播力用户。达摩盘同时还支持“超级用户”的Lookalike人群投放,系统自动识别种子人群的显著特征和显著商品偏好,投放时加大所选“超级用户”的特征在扩展人群中权重,找到真正的高价值人群
●其次是理解用户的需求。 ●在人工智能技术的支撑之下,我们基本做到了对用户即时需求和 长期需求、显在需求和潜在需求进行精准划分与动态描摹。例如, 阿里巴巴在 2020年7月再次升级达摩盘,并将RFM(最近一次消 费Recency、消费频率Frequency、消费金额 Monetary)模型与 消费者的情感因素相结合,从需求和价值维度对消费者需求进行 了重新分类,从而帮助品牌商家找到最具价值的“超级用户” , 即高净值用户、高价值用户、高传播力用户。达摩盘同时还支持 “超级用户”的 Lookalike人群投放,系统自动识别种子人群的 显著特征和显著商品偏好,投放时加大所选“超级用户”的特征 在扩展人群中权重,找到真正的高价值人群