如何通过RALM模型框架实现种子人群扩展的思想,达成“准而全”的营销投放述求呢?本文作者通过微信看一看广告资源位场景下的实例,对“Look alike”策略进行了分析,一起来看一下吧。
上篇讲完“look alike”常见的机器学习&深度学习策略,我们今天找个具体在微信看一看广告资源位场景下的实例,更加深切感受一下look alike的策略,如何通过RALM模型框架实现种子人群扩展的思想,如何达成“准而全”的营销投放诉求。
一、RALM模型框架在微信看一看中的应用
RALM模型框架说明
(资料图片仅供参考)
大体的过程主要分成三个模块,分别是最下层的离线训练、到在线异步处理,再到在线服务。
1. 离线训练离线训练架构图
离线训练,主要包含representation learning(用户表示学习)和look alike learning(用户相似性学习),进行完 look alike learning 之后,可以把 user 经过全连接层的 user 表达 Eu缓存起来。全量用户,有10多亿,可以 catch 到 KV 中。可以提供给在线服务做缓存,线上不用做实时全量传播。
1)representation learning(用户表示学习)
用户表示学习
这个模型有点类似经典的Youtube 的 DNN双塔模型,左侧下班部分是用户的各种Feature,通过embeding lookup 然后再pooling,最后把所有的特征做融合,过一个全连接层就输出了User emedding;右边则是感兴趣的item,也会做embedding生成。最后要预测内容:用户在点击了这么多 item 之后,下一个要点击的 item,最后要预测的就是表达用户兴趣的 embedding。(每个域表示一个行为分布,例如电商下单行为、公众号阅读行为)
2)Look-alike learning(用户相似性学习)
用户相似性学习
一个种子用户需要包含的信息,可以先做假设,种子用户的表达= 共性信息+个性信息。
每个用户都有自己的兴趣,但对整个群体的人群信息存在不同的贡献度,我们称为群体的共性信息:global info。共性信息和目标用户无关,只和用户群体自身有关。种子用户群体的个性信息。种子群体中一定存在一小部分用户和 target 用户兴趣相似,这时,当 target 人群变化时,信息会变化,称为 local info。获取global info的用户的embedding,首先用 global attention,只和 user 相关,和 attention merge 的方法类似,也是一个 self-attention。作用是把种子用户乘以矩阵转换,再乘以种子用户自己,所做的就是捕捉用户群体自身内部的兴趣分布。
local info呢,它的公式是把种子用户的矩阵乘以 w,再乘以 target user 的 embedding,再做一层 softmax,再乘以种子用户自己,这是一个典型的乘法 attention。它的作用是提取种子用户群体中和 target user 相关的部分,捕获种子用户的 local info。是一个用公式得到的这两种 local & global embedding 之后,进行加权和,这就是种子用户群体的全部信息。
2. 在线异步处理在线异步处理架构图
离线训练结束后,是在线异步处理,主要作用是某些可以离线且和线上请求无关的计算,可以先计算完,如更新种子用户。每个 item 候选集都会对应一个种子用户列表,更新种子用户列表,可以每一分钟更新一次,这和访问用户无关,只和候选集的 item 有关。可以实时拉取用户的点击日志,更新点击某个候选集的种子列表,保证种子用户实时性。
可以把 global embedding 预计算 ( gl 只和种子用户有关,是 self-attenion,可在线做异步处理,如每隔一分钟算一次 )。计算 k-means 聚类中心,也是只和种子用户有关,可以提前计算好,如推到推荐系统内存中。所有的东西都是定时更新,不需要线上实时计算。3. 在线服务在线服务说明
线上把聚类中心、global embedding 和所有用户的 embedding 都已缓存好,只需要拉取 user embedding,和候选集的 global embedding 和聚类中心。线上只需要计算 local embedding,是 target user 到种子用户的 attention,这需要根据线上请求的 urn 来实时计算。再计算一次 cosine,就可以得到相似度,这个计算量很小。
4. 最后实验结果在微信看一看上的实验结果
算出 look alike 相似度之后,相似度的分数,可直接给到排序服务,做曝光依据。这是当时原文作者写论文之前做的在线计划 AB testing结果,对比的是用户画像匹配推送的策略,上线之后,在扩大曝光规模的前提下,CTR 基本正向稳定+1.09%(说明获取到了更多相关性的流量),种类丰富性+8.435%,标签丰富多样性+15.938%,说明在扩展过程中同时也获得了更多多样性展开的流量。
二、关于look-alike定向策略总结与思考
Look-alike策略RALM模型的在微信看一看策略大体如上,整体上的思路从用户兴趣特征出发,去探究用户的个性兴趣和人群共性兴趣去探索种子人群的边界,并且在上线实验中也取得了明显的收益效果,通过离线+在线计算的方式保证了种子人群的实时性和效果。
业界还有非常多关于Look alike的论文,我在这里就不一一枚举了,像是阿里妈妈目标人群扩展策略、网易云音乐种子人群扩展策略等等。
和大家一起在策略产品道路上“日拱一卒,功不唐捐”,帮助你成为极具职场壁垒的策略产品,如果有帮助到大家欢迎点赞、收藏以及评论一下。
作者:策略产品Arthur,5年大厂策略产品专家。
本文由 @策略产品Arthur 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
关键词:
如何通过RALM模型框架实现种子人群扩展的思想,达成“准而全”的营销投2023-06-16
读国际硕士真的很有用。国际硕士的作用主要体现在就业市场、学术背景、2023-06-16
姆巴佩表示,梅西可能是足球史上的最佳,他不明白为什么那么多人对他的2023-06-16
广西>>防城港港口区_防城区_东兴市地图头一次认真看家乡防城港的地图[2023-06-16
一、题文螳螂捕蝉文言文翻译(《说苑》)二、解答选自:《说苑·正谏》2023-06-16
想必现在有很多小伙伴对于有谁知道言承序的《多出来的自由》歌词一定要2023-06-16
1、对于怀孕6周的孕妇,HCG值的参考范围为4000-100000IU L L,临床上通2023-06-16
北京时间6月16日,中国男足在大连对阵缅甸。赛前,中国足协为郑智举行2023-06-16
【正文】最近,随着社交软件的快速发展,各大平台开始竞相推出新的升级2023-06-16
在5月29日的COMPUTEX上,英伟达CEO黄仁勋现场视频展示了一款名为IsaacA2023-06-16
日前,广东悦圆堂大南药种植科技发展有限公司布渣叶规范化种植基地在新2023-06-16
2023-06-16
杨德龙|立方大家谈专栏作家本周A股市场整体上走出了震荡反弹的走势,特2023-06-16
本文来源:时代周报作者:何珊珊微软创始人比尔·盖茨再度访华。这距离2023-06-16
1、潜伏期是指人体感染的病毒、细菌或其他疾病。当时感染第一天不会马2023-06-16
6月15日,河北省保险行业协会会同河北省保险中介行业协会、石家庄市保2023-06-16
1、WinAirCrackPack是一款无线局域网扫描和密钥破解工具,主要包括airo2023-06-16
民企迎新机③丨深耕CDMO行业18年,博腾股份稳固先发优势,制剂,医药,制2023-06-16
百城住宅价格指数查询、重点城市房价变化同环比,前往中指云查看→3月2023-06-16
今天(6月16日),新任国防部新闻发言人张晓刚亮相。张晓刚介绍,中国2023-06-16
专访乌兹别克斯坦第一副议长:中国的人权理念更值得借鉴“中国人权模式2023-06-16
6月16日下午,机器视觉板块震荡拉升,大华股份尾盘涨停,拓斯达、海康2023-06-16
1、从地铁一号线(迈皋桥站)上车,坐5站至(鼓楼站)下车,下车后步行约16分2023-06-16
福清打响“取消限售第一枪”,专家:有助于住房交易活跃2023-06-16
徐州鼓楼区、云龙区、泉山区2023年幼升小报名时间:2023年全区小学招生2023-06-16
