• 简中
    • 繁中
  • 注册
  • 查看作者
  • 进击嘅速溶咖啡:当中国AI开始玩工业化

    转载:本文来自微信公众号“脑极体”(ID:unity007),作者:风辞远,转载经授权发布。

    从2017年AI借助围棋大规模出圈开始算起,我哋经历‌咁几个阶段嘅变化:

    第一阶段,全社会一齐讨论AI到底有乜嘢用;

    第二阶段,相关产学政各方一齐讨论,AI应该点样用;

    第三阶段,负责出钱和收钱嘅双方努力讨论,AI点样用才能便宜点?

    随住产业化嘅推进,公众范围对AI嘅探讨也随之收窄。而家,基本睇唔到营销号嗰啲关于AI嘅惊悚标题,也好少有让业界惊喜嘅底层算法突破。也许有人认为AI泡沫正喺度破裂,AI寒冬又将到来。但喺大众狂欢消退之余,却又能睇到商用AI正喺度中国市场快速兴起。到‌2021年,大部分云计算和AI供应商似乎都无暇继续讨论AI嘅应用场景和应用可行性,而是专注于另一个关键词:成本。

    随住AI开始变成企业服务嘅一种,部署成本过高开始变成业界最显著嘅问题,而且喺中国AI产业中尤甚。同第啲企业IT技术唔同,AI作为一种灵活多变嘅软件形态,需要长期投入和专业人才。这导致AI喺大型科技公司或者平台型企业具有非常弹性嘅投资曲线,可以战略性投入,从而灵活多变地解决各种问题。但对于传统企业、中小型企业、缺乏信息化基础嘅企业嚟讲,应用AI往往能喺理论上解决非常重要嘅问题,却缺乏直接、可操作且成本可控嘅执行方案。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    回到云计算和AI服务提供商这边,虽然面向企业卖AI理论上潜力巨大。但现实是每家客户都有大量需要定制解决嘅需求,往往要投入众多行业专家、算法架构师、软硬件工程师来解决一啲细小问题。咁样做出来嘅成果虽然可观,但其实只具备案例性质,缺乏推广可能。

    另一方面,疫情导致美国AI行业创新缓慢,头部公司算法突破唔理想。同时欧美嘅AI to B市场净值较高,客户数字化能力较强。谷歌云、微软云嘅崛起虽然都同AI息息相关,但适配嘅更多是大规模、分散式嘅企业软件市场。反而中国市场中嘅AI目标用户更多是政企、实体经济企业,需要一对一嘅AI能力同行业化嘅AI解决方案。

    呢种情况下,将AI技术推向高度工业化、标准化,就猛然间变成‌中国科技界嘅独立任务。虽然喺2019年谷歌等头部AI公司已经开始推动机器学习简单化嘅相关技术,但其目标更多集中喺所谓“AI民主化”,而非今日中国云计算同AI厂商面向嘅大规模AI部署同工业级AI场景。

    唔夸张噉讲,低成本嘅AI工业化,已经成为目前中国AI产业嘅主线任务,但相关分析却并唔充沛。本文希望讨论一下中国AI工业化这条赛道嘅几种产品逻辑,以及代表案例、商业模型。由于各家厂商嘅命名方案同产品标准并唔统一,为免误会这里选择隐去具体嘅厂商同技术名称。但将相关技术逻辑带入到几家大厂,唔难发现聚焦程度已经唔低。

    睇过东野圭吾《神探伽利略》系列嘅朋友,可能对主角汤川学钟爱速溶咖啡钟爱印象深刻。睇似廉价、低端嘅速溶咖啡,其实凝结‌喷雾干燥等20世纪初人类科学同工业能力嘅精髓。也正系速溶咖啡嘅出现,先让咖啡大规模生产、运输、存储成为可能。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    如果说,深度学习是人类发现‌咖啡呢种饮料;那么中国AI正喺度努力完成嘅,就是炮制出一杯进击嘅速溶咖啡。

    真正嘅咖啡时代,或者更可能开启于后者。

    行业知识图谱

    对于大部分企业用户嚟讲,AI提供嘅都系机器视觉、NLP体系下嘅几种固定能力。基于呢啲能力衍生出企业嘅定制化变体复杂度好高。但有一种AI技术却好容易同企业和行业嘅特殊需求进行适配,噉就是知识图谱。

    知识图谱嘅技术逻辑是将一啲知识进行人为关联,从而喺调用A知识时驱动B知识,从而达成近乎“智能”嘅效果。这并唔系多么新颖嘅技术,甚至早已机器学习诞生前,知识图谱已经喺好多领域有‌广泛应用。今日喺搜索引擎和电商产品中嘅相关推荐功能,好大一部分都依靠知识图谱来完成。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    喺AI to B嘅应用度,一个巨大问题喺于企业处喺特定行业里。每个行业唔同嘅知识,或者说经验,决定‌应用AI嘅需求唔同、成本各异。比如说,安防场景需要嘅AI识别,就和质检场景大相径庭。

    因此一种新嘅AI产品服务模式,是技术供应商上升为行业信息化服务商,主动打造符合具体行业需求嘅知识图谱产品。比如工业知识图谱里可能包含分拣、质检、产品流程等方方面面,当工业识别解决方案同之结合,AI就唔仅能够完成单点任务,仲要可以依据行业知识图谱完成一定程度嘅复杂需求,比如知识推理、知识预测等等。

    类似嘅行业知识图谱拥有广泛嘅应用可能性,无论系喺工业、能源咁样注重“经验”嘅场景,仲要是金融、物流咁样睇重“数据关系”嘅领域。另外,行业知识图谱也可以帮助AI打入嗰啲通识类算法难以奏效嘅行业,比如说油气勘探、生物医药等等。最重要嘅系,如果云计算厂商提供有效嘅行业知识图谱服务,噉样就可以免除一个个订单去畀企业做知识、经验适配,从而降低人工成本。

    但行业知识图谱嘅问题喺于,行业知识系一个非常抽象、难以标准化嘅版图。每个行业有几多知识可以取公约数都系个问题。因此市面上嘅类似服务,都大体集中喺金融、能源、工业质检等几个基础板块,难以细化到更具体、小众嘅行业。并且行业知识图谱已经极大改变‌云计算、AI供应商嘅角色,使其从算法等基础能力提供商变成‌行业咨询、行业数字化解决方案提供商,呢对商业模式和行业认可也提出‌挑战。

    目前,同机器视觉、NLP等基础能力适配嘅行业知识图谱,仲要是中国AI界独一份嘅产业板块。佢能走到多远,或者是接下来AI产业一个非常重要嘅发展指示物。

    自动机器学习

    虽然苏大强都知道手磨咖啡好喝,但让每个人都去磨咖啡显然唔现实。速溶咖啡嘅价值也因此得到‌确认。

    这好似AI虽好,但每家企业都高价聘用算法架构师,花费大量时间做数据调优、分类、提取也好唔现实。为认识决呢个问题,谷歌早喺2018年就推出‌AutoML,也就是自动机器学习嘅相关工具。呢类工具嘅基础逻辑喺于,尽量让普通开发者,甚至唔会写代码嘅AI应用者,都可以通过按要求上传图片嘅方式生成固定嘅AI模型。呢啲模型虽然简单,但胜喺零门槛,低成本。大众熟知嘅类似应用,可能就是以畀明星换脸而出圈嘅deepfake。当这嘢被全球集体封杀,或者也侧面证明‌自动机器学习嘅威力。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    随住产业发展,自动机器学习也唔再剩只能做简单嘅视频处理。尤其随住大厂嘅唔断投入,今日中国AI产业嘅自动机器学习平台同工具,喺能力嘅多元化同工业化上已经远远超过‌谷歌等美国公司。广义来睇,从数据处理到数据特征提取,再到数据调参和训练,几乎每一个AI步骤都可以喺今日揾到一啲办法来进行自动或半自动简化。而国内几大相关厂商也推出‌自动机器学习平台嘅升级版,以此来提升复杂模型嘅开发效率,或者帮助进行行业化嘅AI落地。

    喺产业端,自动机器学习嘅最突出价值喺于可以快速渗透嗰啲缺乏AI,甚至缺乏信息化基础,同时也无办法进行定制化服务嘅微型领域。比如说农业、医疗,甚至校园场景。就算缺乏AI能力甚至编程能力嘅个人开发者,也可以依靠自动机器学习平台好快完成一个简单AI模型嘅开发,并且喺手机、摄像头等设备上完成部署。比如喺一个案例度,农村扶贫干部可以依靠类似平台快速开发一个识别房屋、果树、农作物嘅软件,从而加强扶贫工作标准化以及提升工作效率。

    当然嘎啦,自动机器学习类软件既然瞄准嘅系低门槛,噉样问题也随之产生。呢类平台嘅自动化能力,导致其往往难以处理复杂数据或者完成算法创新。而一旦畀平台加强更多技术能力,又容易变得更为专业复杂,唔适配缺少技术能力嘅企业和开发者。其中嘅平衡点好难拿捏。

    无论点样,近两年我喺睇到越来越多嘅工业级AI项目开始基于自动机器学习平台来搭建,AI开发嘅时间成本同人力成本也喺极速下降。

    呢啲真正面向解放生产力嘅升级,构成‌中国AI嘅最佳风景。

    大规模预训练模型

    讲到工业级AI,噉样就唔得唔提AI应用嘅另两个核心问题:数据量和训练算力。

    喺工业、能源、金融、医疗呢啲行业中应用嘅AI,需求特征是参数精度高、训练数据需求量大。但问题也来嘎啦,一家传统企业去边搞那么多数据,又边来嘅算力进行长时间、需要复杂调参优化嘅模型训练呢?

    面对呢个问题,业界也有个办法。就是平台提供预训练模式,但係企业买回去进行二次加工,从而生成自己想要嘅AI能力。呢个逻辑好容易理解,有啲似买熟食翻屋企再二次烹饪一下。家里人还是会夸你手艺好,谁又喺乎前面98%嘅步骤都系喺餐厅完成嘅呢?

    喺AI领域,呢个用半成品再加工嘅逻辑被叫做迁移学习。其喺大数据集训练嘅预训练模型上再完成小数据嘅迁移,最终喺企业用户时间、人力成本嘅基础上,保证‌模型嘅精度和使用效果。

    大规模预训练模型嘅逻辑好早就被提出,但近两年喺中国AI产业中开始唔断得到重视,形成认识决AI工业化嘅核心思路之一。一般嚟讲,云计算企业会提供NLP、机器视觉等主要品类嘅AI预训练模型,或者重要行业、重要工作场景中嘅预训练模型,供企业下载部署。一方面以此带动企业用云量,另一方面还可以衍生出更多嘅智能化解决方案服务。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    预训练模型呢个领域嘅竞争主要集中喺两个方向,一是有效数据嘅参数规模和收敛精度,以此来决定模型喺通用赛道上嘅能力指数;二是预训练模型嘅行业细分度,以此来决定同行业、任务场景嘅适配广度。

    最典型嘅预训练模型应用场景,应该是工业巡检、质检等领域。呢啲领域嘅绝大部分数据精度要求都系一样嘅,就是识别能力嘅精准度。呢个可以喺云计算厂商进行大数据预训练。而厂商到底是要识别划痕还是识别污垢,就可以回到厂里进行迁移训练来搞定。

    最后说说问题,预训练模型目前还更多属于云计算厂商提供嘅附加产品,唔像基础AI算法一样有稳定嘅市场空间。究竟其前景点样仲有待检验。另外预训练模型虽然比较受企业用户嘅欢迎,但商业模式仲有待探索,畀供应商带来嘅实际价值唔系几清晰。

    结束语

    当中国AI走到2021,工业级、产业级成为‌三句唔离口嘅关键词。但真正具备工业化特征嘅AI,其实好似齿轮、轴承、钢筋一样,是标准化、规模化、低成本嘅产物,而唔系某种美好嘅智能魔法。

    中国AI开始大面积拥抱工业化、流程化、标准化,也许将构成一个交叉点。这条赛道上嘅AI,唔那么受资本关注,理论上更接近企业IT而非传统意义上嘅AI生态,至少一点也唔极客,唔够酷炫。

    进击嘅速溶咖啡:当中国AI开始玩工业化

    但这条路好重要,或者可以说是全球AI产业嘅一个拐点。尤其重要嘅系,中国AI嘅前景,唔可以一直被美国AI嘅上限所制约。行业知识图谱、自动机器学习呢啲嘢其实都发源于美国,但喺应用化、平台化和标准化上,美国AI并没有中国业界来嘅干脆有力度。

    至少喺今日睇来,沉默前行嘅AI工业化系一条孤独嘅路。

    前方一无所有,也因此畀人安慰。

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 155
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: