我叫是王建强(Jay Wang),美国排名前15的统计系的博士,之后在湾区工作过8年,大家可以在领英、脉脉上搜到我。2015-2018年在Stitch fix上班,担任数据科学家, 一家已在美国上市的电子商务公司,美股代号SFIX,以大数据驱动,用科技和创新服装租赁公司。
与亚马逊、Nordstrom等线上零售的巨头不同,Stitch Fix致力于用算法+造型师的方式帮助客户挑选最适合他们的服饰。
今天我会结合我在数据科学中探索的心得体会,跟大家聊聊数据科学的话题。分享的对象是互联网公司的工程师、产品经理、运营同学和所有对数据科学感兴趣的读者。
用户在stitch fix注册时,需要填写详细的个人风格问卷。问卷涉及购买衣服时考虑的款式、颜色、价位、尺寸、版型等。Stitch Fix收到用户风格问卷后,结合算法和造型师的建议进行推荐,按月寄给用户五件搭配好的的衣服。用户选择喜欢的留下来,不喜欢免费退回。
在stitch fix我们做过些很有趣的数据案例。其中之一是算法应该给造型师推荐多少候选集:我们在A/B测试不同的桶中给造型师分别展示250,200,150,100,50件衣服。得到的结果是转化率随着候选集减少反而提升了!这个结果大大提升了我们对算法的信心,也从侧面验证了算法从数据中得到规律的价值,而造型师偏离算法排序结果可能导致结果变差。
其二是推荐转化率为什么周一周二最高,之后逐渐下降?这个问题曾经一直困扰我们。分析转化率的波动,我们一般会从库存质量,造型师水准和用户分层来研究。发现的一个有趣的结果是周末有大量衣服退回到仓库,库存的深度跟广度增加,可供平台选择的增加了,算法和人工的组合也就能产出更优的推荐了。
Stitch Fix后台算法根据多源信息,如季节、客户个人情况、衣服等信息作出演算,进行初步推荐,再由造型师们人工根据自己经验审核,挑选出五件单品寄给用户。
如果这五件用户都不满意,则支付20美元造型费并将衣物退回。若用户对其中一件甚至五件付费,则只为选中的产品付费,剩余退回,造型将免费。
与普通电商网站一退了之不同,即便失败,Stitch Fix鼓励用户回答问题、写明退货原因、与造型师沟通,让机器抓住这些宝贵经验“学习”。每一次购买,无论成功与失败,Stitch Fix都将拥有更多用户偏好。
经过积累,Stitch Fix拥有50多项用户个人信息,如体重、内衣尺码等;同时网站也将合作品牌的信息进行存储,包括衣物100到150个信息点,细分为颜色、袖长、衣长等各类信息。
为了更好的利用数据,作出最适合消费者的服饰推荐,Stitch Fix挖来了Netflix数据科学部门副总裁Eric Colson担任首席算法官。
与用户人机交互次数越多,数据库越充实,算法的结果将越准确,5000多位造型师越了解用户需求。最终stitch fix将成为用户的“闺蜜”,推荐出符合用户喜好、穿着场合的当季衣物。
更多数据科学家讨论群,加我微信meigu55