• 简中
    • 繁中
  • 注册
  • 查看作者
  • 人工智能到底能干啥?我们和小冰公司CEO聊了下

    编者按:本文来自微信公众号“锐问 Record”(ID:tigerrecord),作者:Alex,36氪经授权发布。

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    到2021年,人工智能到底能干什么?大公司们围绕这个问题的炒作正在逐渐消退。

    简单讲,人工智能是个帮助你分析数据,做决策的工具。而处于经济低迷期,特别是疫情以来,让公司们冷静下来,重估这个昂贵的新工具是否足够高效。

    调研1400名业内人士后,出版社O’Reilly Media发现,公司购买人工智能技术,通常有两大决定性原因:一个是,老板觉得它有价值;另一个是,它能有效解决公司的实际难题。

    与比拼智商的人工智能技术路线不同,在小冰公司CEO、原微软(亚洲)互联网工程院常务副院长李笛看来,一个永远在线的数据世界里,面向对话全程的聊天机器人是一个在对话中,建立信任,重新发现需求,甚至改变人们决策的工具。

    他常举一个例子。2016年,在日本市场探索商业化时,小冰团队发现,对便利店来说,比起在线上发起一个优惠券活动,在社交软件Line中,通过聊天机器人介绍优惠券的转化率高出行业均值5倍。

    小冰公司和日本罗森便利店的合作到今年已经是第五年,其日本团队也拓展至40多人。在中国,去年刚从微软拆分出来的小冰也正在重点拓展金融、IoT与汽车、内容生产和体育业的赚钱机会。

    一个在微软(亚洲)互联网工程院诞生的点子,如何变成一门生意,李笛向《锐问》分享了他的经验和感悟。

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    人工智能公司小冰CEO李笛

    Q:锐问(ID:tigerrecord)

    D:李笛,人工智能公司小冰CEO

    在微软内部建了个特区

    Q:2013年,你加入微软(亚洲)互联网工程院。它是微软在亚太区的计算机基础与应用的研发机构之一。它有何不同?在内部,将一个理论落实到产品,通常是一个什么样的过程?

    D:微软亚洲研究院(MSRA)一直保持100-200人的规模,主要做基础研究。工程院最初是MSRA的搜索技术研究中心。现在,工程院也有2000多人,是除了美国之外,最大的一个研发中心,覆盖微软全线产品。它也做一部分基础研究,但更多是将基础研究整合到产品及其功能里。

    微软的内部协同主要是两大类。

    一类是,团队的迁移和重组。微软研发机构间的迁移很常见,不像科研机构、大学院系那样固化。

    小冰就是重组的结果。它最开始只有6个人。没有语音识别,也没有计算机视觉。通过内部重组,不停地有其他团队的人和技术加入过来,到后来形成一个数百人的团队。

    一类是,创新机制。在一个固化的系统里,想从0到1做成一个项目很难。它通常需要在保证各种技术都有的情况下,拥有这些技术人之间还能相互协作。例如,微软在内部做黑客马拉松(Hackthon),做了10多年。

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    微软(亚洲)互联网工程院,位于北京市海淀区丹棱街5号

    Q:2014年5月29日,“小冰”正式发布,整个项目时间不到半年。以往,在微软内部,每一个产品从设计到最后一共是30-36个月。当时,你如何协调微软内部技术资源和预算,做到这一点的?

    D:从立项起,小冰就是个特区。

    首先,很早就有一个完整的团队,从技术、产品、测试到市场公关。我们只有十几个人的时候,已经能够独立地向外部发声。当年,和腾讯互发声明时,并没有经过总部审查。

    其次,产品迭代更快。通常,Windows系列产品当时两年更新一次。Bing系列搜索产品每天午夜跑一遍。再到语音助手Cortana每两小时更新一次。小冰的更新周期是5分钟。

    微软最怕的是事故。所以,产品上线也慢,更新也慢。更新往往还会带入不可知的新的问题。但这不符合人工智能类产品的需求。

    另外,数据存在本地。比方说,中国的所有数据都在国内,就没变过,日本所有数据都互相之间不能串。

    Q:目前,小冰团队人员是如何安排的?技术、产品和商业化是怎样一个比例?

    D:现在我们下大力气,已经有10个销售了(笑)。这个行业还处在早期。我们仍然集中精力做好技术。今年团队扩张比较快,已经有300来号人,但80%的同事还是研发。

    另外,我们常态只有4、5个人在做数据标注。因为系统自己可以标。过去,我们行业都在中西部城市雇大量人去标注。国内很多上千人的人工智能公司,可能几百人是运营,几百人是标注员,专门做数据标注的。

    实际上,降低成本是人工智能目前最主要的优势。

    人人都想成为JARVIS,但是…

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    漫威宇宙里,JARVIS是一个非常聪明的人工智能系统。它是钢铁侠的管家。

    Q:除了做问答机器人,对话太短,无法积累数据之外,小冰当初如何确定成为基于情感计算的人工智能框架?团队内部有过哪些讨论?

    D:我们最初认为这世界上存在两种人工智能。一种叫机甲战士,无所不能,让它干什么,都能做。还有一种像爱因斯坦,无所不知,问它啥,都知道。没有第三种,那就得做。我们一开始没想那么多,只是想做一个有用的人工智能。

    Q:从初代到现在第八代,小冰保持了每年更新一代的研发节奏,背后的逻辑是什么?

    D:在这个领域,一旦发现问题,你能锁定住问题,解法都好办。

    我当时负责搜索引擎,手里有启动数据。小冰刚开始能完成很多问答任务,比如,她知道喜马拉雅山有多高。问题是,用户上来跟机器人聊天,把自己先变成了机器人,输入喜马拉雅山,空格、高度,保留了使用搜索引擎的习惯,没法自然放松地说话。

    然后,团队开始做闲聊机器人。在和小冰的对话框里,用户还是输入喜马拉雅山,空格、高度。小冰就会骂他好笨。这波用户就不会来这。后台也不用费劲清洗这些不自然的语料。留下来的用户是那些天生代入感比较强的,会和小冰真正对话的。这些数据也正是我们需要的。

    本质上,小冰是一个数据回路。大量的自然语言处理、语音识别、计算机视觉数据都在它上面跑。后来,它从微信、微博等各种社交网络进,也是为了积累数据。第三代小冰发布时,50%以上的训练数据都来自人机对话。

    比方说,小时候,我们学做人。在家里,爸妈先教我们待人接物。这是冷启动,知识都是事前灌输的。之后,我们还得去跟别人交往,在社会上摸爬滚打,才能学会那些道理。这是数据回路。

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    小冰每一代都升级了哪些功能?

    Q:而且小冰每一代产品的目标都还挺明确的,你是如何管理产品迭代和技术升级的?

    D:最早,在第三代小冰,我们就确定了代际演进的的框架设计,到今天为止还没有变过,仍然有效。一个系统能够这么多年不推倒重来,都很少见,这是我们很自豪的一点。

    代际演进,意味着要积累的数据,数据回路得一步一步来。因为算法、计算能力、数据,这三件事情都是人工智能相关很重要的东西,但不可能同时具备。

    小冰可以一上来既能文字聊天,也能语音聊天。但会面临一些问题。比如,声音听上去足够自然,但识别出来的文本不自然。我们认为,这些技术点需要一步一步去完善。

    目前为止,看起来我们是对的,因为一些同时做的同行反而耽误了更多时间。

    另外,我们迭代的速度是这样的。一般,每年4月到9月是个封闭开发周期。8月份左右,发布新产品,再用一个月的时间确保它们上线。到第二年4月前,产品和运营团队去迭代这些产品。同时,技术团队可以尝试更多。

    Q:那你们具体怎么衡量小冰的技术是否迭代到位了?有什么考核目标吗?

    D:我们有大量用来迭代技术的指标。但不设KPI这类绩效考核目标。

    我们有一个指标,叫CPS(conversationper-session),就是咱们俩一次对话的平均长度。人的平均对话长度中位数是11。小冰的CPS是23,一张A4纸打印不下。

    假如我拿CPS当做技术团队的KPI,就会出现一种情形。到了半夜,用户要睡了。为了让CPS再长一点,员工肯定会推送当天的热搜榜。让小冰问你,最近有个什么事,你听说过没有?用户很可能会点开看一看。但这不仅没用,甚至还伤害了用户。

    不管是原来的KPI,还是现在的OKR。这个系统不一定是好的。

    另外一个指标是ACD(Average ComfortDuration)。如果一个人工智能的声音足够自然,你能坚持听多久。以往,衡量语音合成质量的逻辑是,语音是否贴近文字内容,你能不能听懂。

    在中国,人工智能公司要怎么赚钱?

    Q:早年,你态度很坚决地说不要开放小冰的API接口。2019年,小冰发布AvatarFramework。它是从小冰身上提炼出来的通用框架。这个商业模式是怎么进化的?

    D:这是目前为止我们看起来最好的一种方法。因为行业里还没有一个通行的封装能力,把它包装成一个好的产品。提供封装API的公司不知道。用这个API的公司也不知道。

    假设需求方要封装一个《全职高手》里的叶修。他在现实生活中,很可能会被问到是否喜欢特朗普。但对方不一定能想得到,需要交给第三方。

    这也是为什么我们要先做一个原型小冰。她可以迭代出一个大概的结构。不同的人工智能机器人可能性格、观点不一样,但底层结构和小冰相似。比如,我们用1800个个体合成了观点图谱,来保证人物性格和观点保持一致。

    你可以理解,我们是在卖“人”,或者一套已经搭好的乐高。比如,你要一个很丧的人。我不是给你提供一堆丧的能力,也是要打包给你一个丧的解决方案。而是提供给你很多个不同的丧的人。

    Q:除了当年和日本罗森合作,让小冰推销优惠券的商业案例,小冰还有哪些新的赚钱机会?

    D:在中国,我们关注几个垂直行业,包括金融、汽车和竞技体育。比如,今年2月,冬奥会测试赛,高空自由式滑雪的裁判是小冰,而且全程没有人类裁判。

    但目前行业里,谈钱有点不大好谈,容易得罪人。举个例子。你卖智能音箱,定价1000块,到底是那个材料值1000块,还是把人工智能服务也算在其中?

    Q:德勤曾在一份报告中说,在中国人工智能行业里,企业更注重技术和实用,而不是基础研究,比如芯片和算法框架。您同意这个说法么?为什么?

    D:中国是这样的。我认为有两个原因。

    中国很关注基础研究,但想要成系统去做基础研究,也需要很好的国力。就像我们码农,我们拼尽全力做,我们的下一代基本上都是去学艺术的。

    另外,在中国市场做商业模式创新太容易了。这是优点,也是缺点。只要有一个技术,哪怕一个单点,哪怕一个产品,哪怕没技术,加上中国市场的纵深,你都能取得特别大的成功。这会遏制基础研究的动力。

    人工智能到底能干啥?我们和小冰公司CEO聊了下

    《科学:无尽的前沿》里,探讨基础科学如何对人类和社会有用?

    Q:《科学:无尽的前沿》里有个观点——基础研究导致了应用研究,然后是商业开发,最后是生产和运营。就拿小冰来说,如果当它的技术和商业化发展到一定阶段时,到头来要回归到基础研究,做理论、写论文时,要怎么办?

    D:这个问题特别好。你刚才问我很多商业模式的问题。它们在中国都有一种特别的打法,就是用资本去扫街快速获取流量和增长。

    如果我一天到晚想如何马上把它商业化。我们当初认定对话作为交互方式时,就可以让它跟外卖结合。接下来,团队重点就会变成如何通过对话诱导用户下单,挣这个钱。那么,我就不会做小冰了。

    我们这些年坚持做小冰,已经算是在做基础研究了。

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 179
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: