猜人心的淘宝 “刷”着“逛”的电商
时间:2018-10-22 作者:未知
三桐可能是最懂中国女人的男人,因为他总能知道你想买点什么,然后在恰当的时候送到你眼皮底下。甚至很多时候,他比你自己更清楚那些隐秘的欲望。
尽管他分不清豆沙色、枫叶红这些口红色号,也不知道这一季流行豹纹衬衣还是法式连衣裙,但他写的算法懂。
人们总是清楚的知道自己想要什么吗?从事消费者行为研究的说服心理学家凯文·霍根认为,大量的购物决策在发生时,人们是无意识的。“人们对于自己未来将如何行动,或者有无可能购买什么产品,几乎没有预测能力,而且他们肯定也无法准确告诉你过去这么做的理由。”
事实上,商家对此早有感知。消费者需要不断被观察,试探和刺激,才能卖给他们更多商品。
过去这是那些巧舌如簧的导购员们的绝活,现在,电商已经开始尝试让机器算法和大数据充当这个角色。
三桐正在干的就是这件事。他是阿里巴巴搜索事业部的资深算法专家,最近几年在研发一系列利用搜索和推荐技术让电商产品Feed化的算法,也就是人们常说的“千人千面”。
今年,“三桐们”格外抢手。Boss直聘2018年二季度人力报告显示,搜索和推荐算法工程师成了当下最热门的岗位。不只新晋独角兽拼多多,甚至一些A轮的早期电商公司,都在高价寻觅AI科学家。8月底改版后的手淘,个性化推荐栏目不仅在首页占了两个板块,还占据了第二屏往后的全部位置。这些都意味着,“逛”和“刷”成了用户使用电商App的新模式。
一个算法比你更懂你的购物时代,已经悄然而至了。
平均每个月有6.34亿人在淘宝上购物。倚着早高峰8-9点的地铁栏杆,或者晚上9-11点坐靠在床头,无数男男女女端着手机,一页一页地刷着淘宝个性化推荐板块“猜你喜欢”和“有好货”,希望淘到点好东西。
这是一群很难搞定的消费者——心思多变又经常漫无目的。一个刚开启健身生活的上班族可能盘算了一早上午餐要点份蔬菜沙拉,但只因为被隔壁同事的汉堡的气味吸引,意志就在一瞬间溃败。
这意味着,预测用户需求的机器需要反应迅速又极有眼色——甚至你浏览商品时划动手机屏幕的速度,都能成为考量你正被吸引还是因无聊而烦躁的指标。
所有人在搜索栏输入关键词,浏览着一模一样的商品的年代已经翻篇儿了。
是什么诱发了“千人千面”在电商行业的爆发?追溯源头,一方面因为电商平台的商品丰富度到了一个庞大的量级。以淘宝为例,如今平台上有几十亿商品,几千个子类目,涉及十几个行业。与此同时,当人们的购物渠道从十几英寸的电脑转移到几英寸的手机屏幕,展示空间却急剧缩小,这时候Feed化的滚动展示,让所有商品都有露脸的机会,就显得很有必要。
另一方面,消费者的要求越来越高,相对于早年间的爆款,他们开始追求符合自己调性和偏好的商品。浏览大量不符合用户偏好的产品,会浪费用户的时间,消磨他们对电商平台的认可度,最终商家会失去他们。
早在几年前,淘宝就在为这个转变做准备。2011年,淘宝内部出现了第一个推荐算法的实验项目。
那一年阿里资深产品专家方圆刚加入淘宝,作为项目经理牵头做了个名叫“ 母婴档案”的个性化项目,主要为母婴客户推荐适合的产品。这个项目之所以诞生,源于淘宝希望提高搜索效率,让用户能更快找到符合自己需求的商品,增加交易量。在此之前,传统电商搜索对于所有用户都是以同一套算法计算的,也就是所谓的“千人一面”。
有时候推动技术进步的往往是现实业务中的瓶颈。2013年左右,随着平台上的商品越来越多,对所有用户采用同一套搜索算法,已经不能满足用户需求了。蘑菇街和美丽说这类主打“小而美”的新型竞争对手出现了,但用户对淘宝的认知仍停留在低价爆款,这意味着人们可能只来淘宝采购低价商品,淘宝将在后续的竞争中受到很大限制。
与此同时,淘宝的UV增速开始放缓,需要用算法创造新的用户场景,刺激新的增长。为此,淘宝把个性化推荐和搜索正式提上日程,迎合用户开始走向多元化的需求。
淘宝用聚划算做了一次至关重要的个性化推荐测试——以往聚划算的商品展示的排序是遵循每个小时计算出的销量,上了个性化排序后,商品成交量很快提升了一倍。
这给了淘宝后来全面做“个性化”的信心,到2014年All in无线后,个性化业务的地位显得更加重要。继电商搜索团队后,阿里又成立了专门的推荐技术团队。
方圆每个月都要在淘宝上花个1、2万,他每天起床后都习惯性地打开淘宝,用产品负责人的视角检验推荐算法的效果。
他对最近一次淘宝推荐的结果很满意——前几个推荐展示位分别是洗漱包、日式茶杯、幼儿早餐奶和新生儿用品,他觉得这准确契合了一个正处于连续出差中、爱喝茶的新晋二胎奶爸的用户画像。
“整个结果摆在我面前,就是我理解的自己的生活状态。”他对36氪说。
所谓电商推荐,就是把用户和商品数据化成机器能理解的语言,然后挖掘出用户与商品、甚至商品与商品之间的关联规律,实现精准的推送和高成交率。
“推荐也好、搜索也好,都是一种关系的构建。对我们来讲去构建这样的关系是很重要的工作。”三桐进一步解释。
定义一个方圆这样的用户,在整个阿里巴巴的生态内(包括淘宝、支付宝、UC、高德…)有几百个维度的数据,而每个维度下面又能细分出无数属性标签。比如价格偏好是一个维度,它下面又可以按照高、中、低价范围划分出几个属性。算下来,定义一个人总共能有几十亿个标签。
除却性别、年龄这些基本信息,你的行为会以一种隐秘的方式向机器透露你是个什么样的人,你的偏好又是什么?比如购物历史、搜索历史和浏览轨迹,都能为机器定义你提供依据。
在机器的上帝视角下,一切细碎的行为都被赋予意义:它能通过你购买前的浏览比对次数知道你是否是个纠结的选择困难症患者,也能敏感的察觉到用户是否对当前的推荐感到厌倦。
“我们可以观察你的每次浏览行为中,比如10个坑位里你看的商品是否是都是相似的,当推荐的品类过于集中,机器通过一些信号感应到用户(审美)疲劳了,下一步的推送就会提高探索度,推荐点其他的。”三桐告诉36氪,商品推荐最糟糕的情况就是用户看了、商品曝光了,但一直在滚动屏幕,用户不点进去。
不过相对来说,商品的定义或许比人更难,甚至有时候是一场算法工程师跟商家之间的斗智斗勇。
淘宝的商品标签体系有超过1万个类目,以及包括品牌,尺寸、尺码、款式、颜色在内的上百个属性。就像三桐先前说的,仅颜色一个属性,又能细分成几千个子标签。打这些标签,有的依靠人工,比如品牌,有些则用深度学习技术生成。
给商品打标签,就是将商品的信息标准化。这是项复杂且工程庞大的工作。
坐在我对面的三桐微拧着眉头,“你知道光是机器颜色打标签有多难吗?就说颜色,淘宝上一共有几千个颜色。什么灰白、银白、奶白…米色到底是白色还是什么东西?反正我不知道,除了那七种颜色,很多我们都没见过。桃红色、玫红色,甚至不带红色的也能是个红色,叫赤色。”
在淘宝这类平台电商,每天无数商家会自行编辑不同的商品叫法、上传不同的图片,即便完全一样的商品在两个商户的店铺里,也会有不一样的叫法、属性描述,更不用提还有山寨品。
“一个商品的标准属性应该怎么写?如果商家随便挂一个,我们又怎么识别哪个对、哪个错,”三桐见识过不少商家在宣传词汇上的无穷创造力,有些甚至让他感到头疼,“媲美耐克、金耐克、比耐克还舒服……这些都是商家创造出来的词,但涉及到品牌侵权是非常严肃的事情。”
在一个每天不断上架新品,总计几十亿商品的电商池里,这种筛查不可能全部依赖人工,算法需要有能力识别物品跟这些标签之间的匹配是否真实又恰当,让商品顺利流入推荐序列,又避免消费者被误导。
此外,每个行业在标签上又都有各自的特殊规则。比如羊绒衫,按照国家标准,羊绒含量90%以上才可以称为羊绒衫。保健品、医疗器械等等的名称规范,又各有各的门道。
不仅用户和商品画像,购物行为也是需要经过标准化才能被机器理解。
算法试图在看上去没有逻辑的用户行为中揪出逻辑。这是个令人头大的任务,三桐无数次看到用户在淘宝上杂乱无章的行为轨迹:搜索裙子——中途跑去家电板块看手机——然后再回来看裙子——最后买了罐奶粉走了。
这说明两个相继的行为之间未必存在必然的联系,它们是割裂而碎片化的。相当比例的用户打开手淘时并没有非常明确的目标,或者说持续有一系列明确的目标。这就像逛大街一样,人们什么都想去试试、看看,购买行为可能是被突然出现的眼缘激发的。
而电商们的转化机会,就存在于准确预测眼缘并推荐。
要在一团乱麻的行为中抽离规律,淘宝的算法工程师有两种手法去应对:一种是实时推荐。机器要对人的心思实时感知,和我们一样多变,这背后需要一系列复杂的模型和算法迅速理解每次点击背后的意图。
举个例子,可能当你在“有好货”的Feed流里点开过一款皮包,当你退回Feed界面会发现原先在信息流中排在这款产品下面的几个推荐位已经换成了跟它风格接近的皮包。
另一种,把这团乱麻式的行为分类。可以先把牵扯到服饰、手机这些不同品类的行为区分开,然后每个品类下面再设置不同的观察维度。比如关注手机类目下的品牌,一位连续两天浏览了华为手机的用户很可能在近期就有针对性的购买行为。又比如连衣裙品类重要的观察维度可能是款式和价位,再比如小说书籍类目的标的可能是恐怖、历史、军事、言情这些内容风格。不同购物主题下对应的预测模型是差异化的。
再往深一步看,也有一些规律交叉在不同的品类之间。譬如20多年前,沃尔玛就曾通过大数据发现那些放了听装啤酒的购物车里可能也会放进婴儿纸尿裤。这类顾客通常是受了太太嘱咐下班来买东西的丈夫。沃尔玛因此把啤酒和纸尿裤的货架并列放在一起,结果是两类产品的销量都大幅增长。
淘宝的推荐逻辑在逐渐外扩,从推荐物品、到推荐品类、再到今年主要做的推荐场景。举例来说明这种变化:机器的智力发育,从知道你想要把北欧风的餐椅,从而给你推荐一堆椅子,升级到知道你喜欢北欧风餐椅,干脆尝试卖给你一屋子的北欧风家具。又比如当你购买了一样郊游用的烧烤工具,机器可以基于场景推给你烧烤食材、户外帐篷。这种转变,意味着从卖一样货、到卖一个场景,甚至再高级点,一种生活氛围或方式。
走向场景化推荐后,淘宝今年的推荐栏目使用率提升了30%。“30%其实只是我们的热身,接下来会提升得更快,”方圆对迄今的进展颇为满意。
到9月份,最新改版后的手机淘宝中,第二屏往下的位置已经全部属于“猜你喜欢”,甚至直播、全球等板块也用同样的推荐逻辑并入了这个板块。在以往旧版本的手淘中,占据主导地位的是最上方的搜索栏,以及以传统方式运营的各个栏目板块。
这个信号说明Feed化的兜售模式在淘宝的地位被进一步认可了。Feed真正让用户在电商场景完成了从单纯的搜到“逛”的转变,其中的好处不言而喻,增加激发你购物交易的可能性,并且把你的时间留在电商的超级App里。
不过电商推荐不准,也是经常被用户吐槽的一点。
三桐听了笑了笑,“推荐要做准确其实很容易。但过于准确也意味着局限性,我知道你有需求,但不能一天到晚只给你推荐必需品,所以要进行需求的探索,探索肯定没有那么准,可是一旦命中,对于平台就是很大的增量。而如果不做探索,用户看到的品类会越来越窄,最后他觉得淘宝就是这些东西,这对我们很致命。”
他说的探索,就是让机器会变着花样试探、猜测你的各种喜好。猜的准确率,猜到什么程度,甚至猜不中几次能在你的容忍范围内,这都是些技术活。
人们的确需要被挖掘到的惊喜感。大量的购物行为是在没有实现规划和意识到的情况下发生的,甚至所谓的冲动消费也是其中一种情况。
本质上,在准确和探索之间,电商推荐是一门关于“平衡”的艺术。
算法工程师会用一系列指标去衡量推荐的效果,比如最核心的CTR(点击通过率)、用户的浏览深度、看了多少页、点击了多少商品、疲劳度……他们追求让CTR在一定范围内的平稳增长。即不能为了提升CTR而过度牺牲探索力度,又要在CTR下跌较多的时候及时意识到已经探索过度,回调力度。
相对而言,女性消费者的心思让机器难以捉摸,比如她们未必会长期局限于一种服装风格,而是看心情每种买几件。但同时,她们也比男性对探索的容忍度更高,更乐于“逛”。
每个人对新事物的接纳程度,对探索的容忍度,都有所不同,这意味着每个淘宝账号背后的算法模型,都在逐渐被对应的用户“养成”个性化的,通过你点了什么、没点什么这些信号,越来越懂你。
什么时候套用什么规律?什么规律适用于什么群体或者品类,可能是件极复杂的事。
“也有的人抱怨为什么电商有时候会原封不动地推荐他买过的东西。但其实在书籍和某些品类,数据证明了人们就是有大量的复购率。而经典的纸尿裤和啤酒的搭配,也未必总是对的,”一位搜索从业者对36氪说。
电商搜索推荐技术在不断演进,淘宝希望做得再细一点——从分析一个群体,到分析个人。原因是消费者对推荐的要求越来越高。“过去的消费者要求如果他的孩子1岁,系统不要给他推3岁的玩具,但今天,他需要你告诉他1岁的孩子要买什么,去挖掘他的潜在需求。更高级的,有的消费者希望机器预测出哪一天婴儿奶粉喝完,尿不湿用完,然后提醒他去买。”方圆告诉36氪,如今用的深度学习、强化学习的算法模型已经越来越复杂。
而在实际运营中,电商推荐还存在很多需要优化的地方。未来好的算法,不仅需要知道人们想买什么,需要买什么,它还要了解人们使用商品的那些场景究竟是什么样子,甚至需要理解消费者所处的人生阶段和生活状态,就像一面上帝视角的镜子。