小程序码
公众号
论坛
(1)数据处理
对关键词、摘要、刊名等文本信息进行拼接处理,对标签值进行文本编码。
(2)文本表征
利用预训练模型(Bert)对上述拼接文本进行语义表征;为丰富语义特征,本模型采用Bert后5层[CLS]对应的向量拼接作为文本表征。
(3)生成器及判别器的训练(recall & rank)
随机生成负样本,通过对正负样本的识别对判别器进行训练。
"DSSM模型总的来说可以分成三层结构,分别是输入层、表示层和匹配层。
输入层 将用户、物品的信息转化为数值特征输入;
表示层 进一步用神经网络模型学习特征表示;
匹配层 计算用户特征向量与物品特征向量的相似度;
获取用户订阅user和书本books的海量曝光和借阅数据,训练阶段分别用复杂的深度学习网络构建用户侧特征的user embedding和书本侧特征的books embedding,线上infer时通过计算两个语义向量的cos距离来表示相似度,最终获得推荐模型"