【摘要】从智能推荐谈起:探索360购物小蜜的秘密

智能推荐如今在互联网可谓无处不在,大家也都逐渐了解并且越来越适应“以我为中心”的内容展示,商品推荐,乃至猜你喜欢的音乐,关注的新闻:
个性化广告展现,以聚效为代表的DSP广告平台推送的个性化创意;
豆瓣会基于你的历史评论和收藏给你推荐可能感兴趣的电影;
Amazon等电商平台则依据你看了哪些商品、买了哪些商品,购物车都有哪些宝贝等信息进行预测并试图引导你的购买行为。
屏幕背后仿佛有个神奇的侦探福尔摩斯,就像与华生初次会面就凭借极强的观察能力准确推敲出“从阿富汗回来的”那样,信息时代,你的每一次搜索、每一次浏览、每一次消费,都塑造着每一个“华生”。你会惊讶地发现,满屏看到的都是符合心意,让你龙颜大悦的商品和广告。
但,今天我们不谈广告,只聊智能推荐算法。
推荐引擎算法直接影响到推荐系统推荐内容的相关性和价值匹配度,在实践中常用的推荐引擎算法如下:

绕晕了有木有,别担心,我们接下来聊的大家都懂的。
首先,我们来了解下几个典型推荐机制的工作原理
1、基于人口统计学的推荐
通过对你和周围朋友的基本信息(性别、年龄、所在城市等)进行相似度计算,得分相近则归类成“闺蜜”或“基友”,并且认为你和闺蜜、基友们有着相似的品味。

从图中可以清楚地看到,女神和白富美在给出的三个维度上都比较相近,于是系统认为她俩是相似人群,也就是所谓的“闺蜜”。并且有理由相信,女神喜欢的弹钢琴项目,在很大程度上也会被白富美同学所喜欢。
但基于用户推荐的缺点是,单纯基于身份信息的推荐似乎不那么可靠。比如,你和你的如花一样30开外的年龄,高度一致的性别,但你可能对游戏就是没兴趣。
2、基于内容/物品的推荐
通过对物品和物品之间的相似度进行计算,比如《双节棍》和《龙卷风》这两首歌在风格、年份都比较相近,演唱者也都是周杰伦,如果女神正在听《双节棍》,那么我认为她应该也会喜欢我为她点的这首《龙卷风》。这种物与物之间的关联,与其他用户与物品之间的喜好是脱离的。

在现实的应用中我们可以观察到关键词和标签(Tag)被认为是描述物品元数据的一种简单有效的方法。两个物品彼此所附带的标签重合度越高,则认为是相似的。
3、基于协同过滤的推荐
即利用用户过去的行为或者意见来预测用户当前可能喜欢哪些东西或者对哪些内容感兴趣。协同过滤与上面两种推荐不同之处在于,它综合考虑了用户与物品之间的交互。
从用途上来说,协同过滤更适合“给用户带点新鲜的东西”的使用场景,比如“逛”淘宝的用户。
协同过滤的推荐又细分为基于用户的协同过滤、基于物品的协同过滤和基于模型的协同过滤三种。
a、基于用户的协同过滤
基于用户的协同过滤机制是依据用户的历史偏好来计算用户的相似度。
这个过程可描述为:我喜欢吃麻辣烫和火锅,白富美喜欢吃西餐,如花喜欢吃麻辣烫、火锅和沙县小吃。于是系统会将我和如花归为一类,并且为我推荐沙县,虽然我的内心强烈抗拒与如花为伍,可真相是……我确实很喜欢吃沙县!
以上的过程可描述为下图

b、基于物品的协同过滤
基于物品的协同过滤推荐的基本原理也是类似的,只是说它使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。
这个过程可描述为:如花喜欢看韩剧和爱情片,白富美喜欢看美剧、韩剧和爱情片,女神喜欢看韩剧。系统基于如何和白富美二人的研究案例发现,喜欢韩剧的都会喜欢爱情片,于是将韩剧和爱情片归为一类,并且为喜欢韩剧的女神推荐了爱情片。以上的过程可描述为下图

c、基于模型的协同过滤推荐
基于模型的协同过滤推荐就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测,计算推荐。怎么理解呢?
女神家新请了一位厨师,上一任师傅告诉他女神喜欢吃西餐和日料,不喜欢麻辣烫和沙县…但新厨师其实并不知道女神否喜欢吃川菜、东北菜…于是通过不断的尝试与反馈吸收,最终他对女神的口味把握得越来越准,甚至对葱姜蒜等作料的量都拿捏得恰当好处。
到目前为止,是否对推荐算法有了大致的了解?OK,下面终于等到今天的主角——360购物小蜜登场时间~

别看这个小条其貌不扬,如今已经跃然成为中国国内安装量最大的购物插件,它的背后离不开奇虎360那10几名性感的工程师数百个昼夜的coding,现聚效广告的帅气工程师们也加入了他们的队伍,一同为网民们最佳的购物体验不懈努力着。
那么小蜜又是如何“猜你喜欢”的?
有了上面的基础概念的铺垫,再去了解购物小蜜是如何运作便简单多了~
首先,来看看你在小蜜眼里是什么样子呢?

答案是,你是一个很大很大的表格里的一串数字。
对,你就是大学数学里学过的,矩阵中的一行,一个向量,仅此而已。
基于内容/物品推荐的“大家还在看”
“大家还在看”是聚效与360购物小蜜合作的第一个基于商品类目定向的单品广告位,日单品展现机会高达5亿。商品推荐广告拥有超大流量、设置简便、超高转化、有效竞价及创意形式新颖等特点,故享有“黄金展台”的美誉。
类目定向的官方定义:商品类目定向是根据用户当前访问商品的名称和所属类目进行的定向,与其访问单品页的类目相关性高的商品将获得展现机会。
有人会说,看上去比协同过滤简单多了嘛。其实不然,类目定向也是需要强大的算法做支撑滴。先来看看系统是如何分解一个标题的:2014夏装新款蕾丝绣花仙女短袖雪纺连衣裙LA10340X特
1)首先,我们需要对具体的产品/类目进行定位与正确的分类,比如在这个例子中我们定位“连衣裙”。但在其他case中,商品标题内容可能是复杂的,比如 “美国正品韩版雪纺连衣裙 内搭背心”,该标题中既有“连衣裙”,也有“背心”,且这两个产品属于不同的类目,算法就需要对这种情况识别出来,这条商品到底卖的是什么东西。我们注意到,除了品类词,商品标题中还会有一些其他词,“韩版”、“雪纺”等,在服装品类中出现的概率比其他品类要大,我们的算法综合考虑商品标题中的所有词来对品类进行准确的预测。
2)接下来,会考虑价格因素。对一定价格范围内的商品之间进行匹配,尽可能地避免在“大家还在看”展现的商品与当前商品价格差距过大而产生的不协调感。
3)经过品类预测与价格匹配之后,我们会进一步判断两个物品相关性的高低,通过分析标题的关键词和标签(Tag),对两个物品所附带的标签进行重合度计算,得分越高则认为两者越是相似。
所以小V的建议是:录入尽量全面、准确的商品信息及分类信息,以此来提高商品类目匹配的成功率,也尽可能多地得到应有的广告展现机会噢。
当然,智能推荐算法博大精深,以上提到的这些也只是推荐引擎中的皮毛而已。购物小蜜广告位的推荐算法也不仅限于以上提及的3点,我们的工程师会结合不同情境,同时参考后续各项指标对算法不断地调整。点击率越高,转化越可观,也就能证明这个算法是先进、有效的。
随着技术的发展,也不断的会有新的方法和理论加入到推荐系统之中,聚效将与360精诚合作,继续为广大用户带来最佳的购物体验,同时也为广告主们带来最好的投放效果。
已有0人收藏
已有0人点赞
发表评论
请先注册/登录后参与评论