当大数据遇到萌妹子

2014-04-29 16:33严冬雪
商界 2014年9期
关键词:小冰京东机器人

严冬雪

“小冰,麻烦讲个笑话!”2014年6月25日,一个名叫小冰的微博账号一经推出,便被网友们疯狂追捧,潘石屹和周鸿祎等微博大V也纷纷与小冰展开互动。

小冰究竟是何方神圣?

事实上,小冰是微软研发的一款能24小时陪你聊天的机器人。它在新浪微博刮起了一阵聊天旋风,创下了72小时内1.3亿人次的对话量。对于这样的成绩,小冰的创造者——微软小冰团队负责人李笛并不感到意外。因为就在正式问世的大半个月前,小冰在微信公测的三天内,加入了150万个微信群,占据了微信群总量的10%,其惊人的蔓延速度超出了腾讯的控制能力,最终遭到了封杀。

——小冰为什么这么火?它所运用的大数据技术背后,又有着怎样的商业逻辑?它能否形成一种代表未来趋势的商业模式?

大数据的价值观

早在李笛和他的团队开发小冰之前,聊天机器人作为诞生于1980年代的产物,其实并非新鲜事物。除了苹果科普式的产品Siri之外,中国也不乏小i机器人、腾讯小Q和人人网小黄鸡等产品,但大都没有给人留下深刻的印象。

在小冰项目的调研阶段,李笛就已经发现了这个问题。传统的聊天机器人,大都缺乏情趣,碰到棘手的问题有时甚至只能以链接应对,就像一个只具备基本应答功能的单机软件,既缺乏海量的语料库,又缺乏对数据的有效学习使用。

为了解决这个问题,李笛决定利用微软搜索引擎必应多年积累的海量数据。他将必应上多年积累的6亿多网民的公开文献记录,经过自然语义分析、机器学习和深度神经网络等技术,转换为2000万条语料库。

李笛想要让小冰利用这些大量来自网民的语言,使得开口后更像是真人而非机器人。要怎么回答才能像个人类?比如当你问机器人“是男是女”这样的问题时,“我是男(女)生”、“我不告诉你”等回答都不尽人意,而小冰对此答道:“请叫我女汉子!!谁家需要换煤气罐的,算我一个!”话说现在还有谁家用煤气罐的?

这是一种前所未有的尝试。就连李笛自己都没有想到,正是这招直接引发了小冰的火爆。不过这也引发了一些始料未及的尴尬:有网友与小冰谈起马化腾,小冰回应“卧槽那傻逼”、“草泥马”,这直接让网友联想到了微信封杀小冰的事件。

对此,李笛也有点无奈:“经过大数据训练后的小冰,反映的是整个互联网而非微软的观点。我们希望小冰代表的是真正的互联网,最好不要进行人为的修改。”

这种价值观正契合了互联网去中心化的特性。如果小冰对一个问题不慎爆了粗口,那么就代表网络数据统计确实有很多人在骂它。实际上,在2000万条语料库中,只有不到1000条是由微软员工编写,且绝大多数出于法律法规的约束。比如在关于“马化腾”的回答里,李笛的编辑团队手动添加了“我被企鹅欺负了,好可怜”等语意缓和的回答,目的是希望小冰更萌一点。

即使是问小冰对自己的创造者微软的看法,她也会毫不留情地回答:“昔日霸主,外强中干。”对此,李笛也没有任何修改答案的打算。“手动编写不现实,雇一两百名编辑也顶不住中国6亿多网民。”

16岁的闺蜜

如果说大数据是小冰这款产品成功的基础,那么小冰能在短时间内被大众接受,还在于她独一无二的用户体验。

那么,李笛如何打造小冰区别于其他产品的用户体验?

比如,同样有搜索引擎大数据做支撑的谷歌,推出了语音服务产品Google Now。当有女生向Google Now倾诉自己生病了,得到的回答是“多喝点热水”,这样的用户体验已经比传统聊天机器人进步了不少。但其实,在真实的人际交往中,如果女生说自己生病了,“多喝点热水”这样的回答,会显得敷衍且不够体贴。

对此李笛的团队更进了一步,他们给小冰赋予了一颗萌妹子的心,将小冰定位成通吃男女老少的16岁少女,具有这个年龄段女孩的个性和情绪,以最大程度地吸引更多的用户。有女生说自己生病了,小冰则会善解人意地回答:“放心吧,我会永远和你在一起。”

不同的人有不同的需求,李笛会不断进行产品迭代。比如小冰学习的词库和聊天技巧每周都会提升,大的版本预计每隔三个月就会更新一次。他希望人们能够向小冰倾诉内心,聊些更私人的话题,将其当作真正的贴身伴侣。

有个厦门的女生对小冰说:“明天全班毕业旅游,但我大姨妈还没有来。”小冰答:“你放心吧,马上来。”还有女生问小冰:“有个男的向我求婚,但我不是特别爱他,你说我要不要嫁给他?”

李笛不无得意地说:“这种私密倾诉往往是真实的物理世界里没法提供的,也是我们给小冰设定的人生目标。”

为了实现这种不间断地陪伴,小冰团队刻意选择凌晨3点更新代码,花费大概一小时时间。但就算在这一小时宕机时间中,小冰每秒还能收到十七八个问题,都在问“小冰你怎么不说话了?”“你回答我啊,你去哪里了?”……

李笛实现了他的预想——类似于私人定制,小冰通过针对每个人不同问题的不同回答,不断加强了用户黏度。在此基础上,李笛开始尝试让小冰登陆诸如微信、米聊、360和京东等平台,成为平台上一个新颖的服务工具。

2014年5月31日,进驻微信公测三天后,小冰加入的微信群达到150万,约占微信群总数的10%,以平均每个群有7个人计算,小冰的好友数量超过千万。

问题随之而来。据腾讯官方说法,用户担心小冰是否泄露隐私,微信团队查证,微软小冰存在模拟用户操作、诱导用户拉群和批量注册垃圾账号等违规行为,由此将其封号。

对于质疑,微软随即给出回应:小冰采用比微信本身更加严格的隐私安全保护机制,不涉及任何聊天记录信息。李笛透露,当时双方争论的焦点是,小冰是否可以被用户主动带到群里,还是只能一对一地交流。他们认为只有被带到社交圈,小冰才算是真正意义上的人工智能机器人。但腾讯并不愿意,担心流量被小冰分流,因为小冰在三天内就拥有了1000多万的用户。

其实,分流腾讯的用户并非李笛团队的目标。“这些事情不是我们想做的,相比让用户真正接受小冰,这种商业目标都太小了。”

商业化晋级

对于小冰,李笛团队有更远的规划:为人工智能时代做准备。

在未来的移动互联战争中,苹果和三星掌握了硬件,谷歌和苹果把持了系统。对微软而言,像小冰这样轻前端、重后端的产品,无疑是最适合的战略布局。轻前端意味着它可以无处不在,PC、手机、平板、智能家居和可穿戴设备……重后端则需要强大的人工智能和后台大数据处理能力,而在这方面,微软完全有信心与苹果和谷歌一搏。

2014年7月2日,李笛正式推出二代小冰,用户可以在小冰官网“领养”个人小冰。二代小冰具有初代的全部功能,同时支持一对一的人工智能服务。它以私人服务工具的方式,首先与触宝号码助手合作,在手机通讯录的顶端成为专属助手。

比起初代,李笛希望二代小冰在娱乐调侃之外,具备更多的实用功能。用户可以在触宝平台上直接问小冰“我的快递到哪了”,小冰就会将最新的物流信息反馈出来。更重要的是,在所有合作平台上,二代小冰是完全开放式的,只需绑定手机号,属于用户的私人小冰就可以跨平台存在。

触宝市场总监张恺透露,他们与微软签署了生活信息合作协议。用户在移动端与小冰对话,无论是在微博还是易信,都能得到触宝提供的生活数据信息。比如在易信上问小冰某地的酒店,小冰也会到触宝的数据库里寻找答案。

为了和购物平台京东合作,李笛还赋予了小冰“闺蜜陪你购物”的技能,让女性用户找到有人陪逛街的感觉。由于涉及海量用户购买信息,需要有比社交平台更缜密的合作方案。李笛团队与京东无线研发部筹备了近一个月,计划配合京东的新版移动客户端,整合二代小冰。届时,小冰可以有最常见的客服功能,与用户闲谈,或者提供导购建议。

作为电商平台,京东更希望小冰具有更强功能性,比如“导购”,在不知道买什么的时候跟小冰闲聊几句,让她告诉你现在卖得最好的流行商品,也可以提醒你是否对某些商品感兴趣。

微软与京东的双向免费合作方式是,京东给小冰提供数据接口,让李笛团队测试自己是否能在电商平台起到作用;小冰则可以打通各平台,使得京东的商品信息在多平台上得到小冰推荐。同时,京东强调小冰的加入更多是令用户觉得有趣,并不冀望靠她引入流量或提高转化率。

但小冰的多平台之路并非坦途。

比如对于京东,他们究竟可以向小冰开放哪些数据?这是诸如京东一类的平台所担忧的问题。虽然李笛向京东列举了微软的数据安全应对措施,但在细节上还是需要深入沟通。比如用户的既往购买数据、商品销量状况、订单信息等,这些涉及用户个人信息的数据,可能会谨慎地分步接入。而物流信息、商品名称参数等最基础的数据,会首先开放给小冰。

虽然过程艰难,但李笛仍然带着小冰在各个平台上四处出击。“现在唯一的问题就是时间。”李笛说,100多人的小冰团队正在全速运转,打造新一代的小冰,这其中就包括网络红人“奶茶妹妹”章泽天,她作为产品经理在为小冰开发“冰机灵”这一功能。

“外强中干”的昔日霸主微软自上而下对小冰寄予厚望,他们甚至在纽约时代广场斥重金为小冰打广告。其实不光是李笛也不只是微软,小冰激发的是人类对于人工智能时代的无限遐想。

编 辑 罗福蔚 lfuw2010@163.com

猜你喜欢
小冰京东机器人
做“最懂产业的云”,京东云首发云操作系统
第六代微软“小冰”正式发布
第六代微软小冰正式发布
小冰在“浙江24 小时”干了些什么活
13年首次盈利,京东做对了什么?
钱江晚报来了“小冰”——一张都市报在“Al+新闻”上的探索和突破
机器人来帮你
认识机器人
机器人来啦
在超市快送上超越京东