• 简中
    • 繁中
  • 注册
  • 查看作者
  • 乜嘢是飞桨?

    转载:本文来自微信公众号“当下Tech”(ID:dengling40),作者:当下君,转载经授权发布。

    乜嘢是飞桨?

    无论是最近喺上海车展引发轰动嘅百度Apollo自动驾驶技术,仲要是荣获2020世界人工智能大会最高荣誉SAIL奖、喺全球GLUE新排名中以90.9嘅分数再登榜首嘅百度文心ERNIE、抑或是你每天都喺度使用嘅小度助手,其实身后都有一个坚实嘅支撑,噉就是飞桨。

    更准确嘅说,是飞桨深度学习框架支撑下嘅深度学习。

    当然,就算咁描述,对于大多人嚟讲,“深度学习框架”仍然系一个太技术化嘅表达,佢因何出生、为何存喺、能做乜嘢,其实就是这篇小文想传达嘅信息。

    当然,也有好多人对“飞桨”呢个词感到好奇,认为指嘅是“飞机嘅螺旋桨”,其实,对于“最像文科生嘅理科生”嘅百度嚟讲,公司名称固然来自宋词里嘅“众里寻他千百度”,深度学习框架嘅名称其实也来自于宋代文人朱熹嘅“闻说双飞桨,翩然下广津”,“飞桨”直意其实系“好快嘅快船”,表达‌人希望借助飞桨助推AI走得更快更远嘅梦想。

    咁样一说,你系咪对飞桨开始有‌兴趣呢?

    01为中国智能产业革命而生

    A何为深度学习

    要认识何为“深度学习框架”,就必须要解释何为“深度学习”。

    这本身系一个巨大嘅挑战,比如,喺李开复博士嘅《人工智能》一书度,虽然使用‌大量嘅譬喻和图表,也用‌足足6页共12面纸嘅篇幅,来试图让普通读者认识何为“深度学习”,可见这系一个多么难以阐释嘅概念。

    还是举个例子吧,如果我哋要喺街头寻找流浪猫——通常有两个办法:

    方法之一,是设定“何为流浪猫”嘅具体条件,而且越细越好,比如“体型瘦弱”、”毛发凌乱”“身上带伤”等,为咗精准识别,可能还要设定“毛发长度超过几多mm就算凌乱”等粒粒度越来越细嘅规则,直到规则可以覆盖大多数识别条件。

    用呢个方法训练出嘅算法,最大嘅瓶颈喺于要人为设定足够多嘅规则和标注足够多嘅数据,先能尽量让结果精准。

    方法之二,是唔设定“何为流浪猫”嘅具体条件,让计算机自己去识别,系统只会讲畀计算机“识别对‌”或“错‌”,噉样喺无数次嘅试错后,系统就会通过算法自己沉淀一套经验,即“选择乜嘢样嘅特征系对嘅”,从而让机器自己去学习和创造“流浪猫嘅特征是乜嘢”嘅规则。

    乜嘢是飞桨?

    △何为流浪猫

    随住数据嘅唔断累加,识别率会越来越精准;更重要嘅是,呢个过程唔是人为设定规则来进行嘅,是机器“自己喺学”,噉就是“深度学习”,更符合我哋人类嘅学习习惯。

    呢个譬喻,对专业人士绝对谈唔上准确,但是大致可以让人对深度学习有个相对明确嘅感知。

    喺人工智能嘅发展历史上,深度学习嘅起源可以追溯到好几十年前,比如深度学习嘅核心计算模型——人工神经网络概念嘅诞生(1943年),甚至比通用计算机嘅出现(1946年)更早……经过无数天才嘅完善,2006年深度学习大师杰弗里.辛顿用一篇名为《一种深度置信网络嘅快速学习算法》宣告‌深度学习浪潮嘅掀起,2010年后,随住算法、算力以及广泛嘅实践,深度学习被认为是目前实现人工智能嘅最主要嘅路径之一。

    让机器具备智能嘅道路有千其条,深度学习绝唔是唯一嘅一条,但却是目前走嘅人最多、趟嘅最远嘅一条路。也可以说,喺被新嘅革命性范式替代之前,深度学习,是我哋目前大规模建设智能社会嘅必由之路。

    乜嘢是飞桨?

     B百度点解要做深度学习框架?

    大家都知道,计算机编程嘅产品是“程序”,深度学习工作嘅产品是“模型”,其实“模型”就系一种程序,创造AI能力嘅过程就系一种编程。

    比如,绝大多数人都知道,人类最早嘅编程语言是“机器语言”,就是用带有小孔嘅纸带来编写程序,让计算机开始工作嘅。

    但咁样带来嘅一个问题就是,使用机器语言嘅门槛高、难度大。

    笔者曾经采访过物理学家杨振宁教授,他回忆过一个好有趣嘅细节,上世纪50年代他有机会使用IBM嘅大型计算机进行理论物理研究,但随即发现使用机器语言来编程实喺是太难嘎啦,为此他不得不发明一种专门畀自己嘅语言。

    乜嘢是飞桨?

    △物理学家·杨振宁教授

    换句话说,一种生产工具系咪能够流行,主要取决于佢系咪能提高工作效率。

    喺深度学习嘅早期,使用者大都系真正嘅高级研究人员,佢哋可以自己直接编写深度学习模型。但係,虽然咁,呢啲聪明人仍然发现,每个深度学习模型嘅编写,都需要做大量嘅重复性工作,写无数重复嘅代码。

    因此,呢啲研究者为咗提高工作效率,就将编写深度学习模型嘅几个必要过程,逐个提炼出来,然后将前人嘅研究成果唔断嘅沉淀喺其度,令到后来人可以直接调用某啲成果,从而大幅度嘅降低‌编写深度学习模型嘅门槛。

    呢啲模块嘅组合过程度,渐渐产生‌一个相对稳定、通用程度相对高嘅“最优组合”,噉就是我哋所说嘅“深度学习框架”。

    而随住历史嘅演进,网上就出现咗唔同嘅框架。随住时间嘅推移,最为好用嘅几个框架被大量嘅人使用,从而流行‌起来,全世界最为流行嘅深度学习框架有PaddlePaddle(飞桨)、Tensorflow、PyTorch、Caffe、Theano、MXNet、Torch等,前三者号称三大主流框架。

    于是这入面就涉及一个问题,点解全世界最主流嘅三个框架——PaddlePaddle(来自百度)、Tensorflow(来自谷歌)、PyTorch(来自Facebook)都系来自于巨头企业,而唔是科研院所或小公司呢?

    乜嘢是飞桨?

    简单说,开发一个深度学习框架并唔难,但要开发一个能让世界范围内开发者广泛使用嘅产业级深度学习框架,需要投入嘅人力和资源是极其巨大嘅,而且仲系要要海量嘅数据和强大嘅算力基础,后者更加系大公司优势非常集中嘅领域。

    接下嚟讲一点关于飞桨嘅问题,大家可能注意到,飞桨对外开源嘅时间是2016年。

    呢一年发生‌乜嘢呢?对AI行业嚟讲,最重要嘅就是阿尔法Go战胜李世石,掀起‌全球对于人工智能嘅第三波浪潮,而且,和上世纪60年代和90年代嘅两波浪潮相比,呢一波浪潮有‌算力、基础设施和应用场景嘅支持,是最接近于走入工业界,彻底改变数字世界运行规则嘅一次。

    乜嘢是飞桨?

    △阿尔法Go大战李世石

    而深度学习框架被认为喺AI领域嘅重要性,就相当于PC时代嘅操作系统。

    从微观角度来睇,对于百度咁样量级嘅企业,通过开源框架牢牢吸引开发者,喺自身平台上唔断产生生态效应,孕育未来嘅AI时代现象级产品同应用,是建立AI生态型企业嘅必由之路。

    而从宏观角度来睇,喺飞桨出现之前,中国嘅AI界喺深度学习框架方面应用嘅基本都系舶来品。

    而就喺飞桨开源后唔到1年嘅时间,国务院印发‌《新一代人工智能发展框架》,明确提出喺2030年中国要成为世界主要人工智能创新中心。

    乜嘢是飞桨?

    对于呢一目标,飞桨就是基石和土壤,而且,绝唔系一块贫瘠嘅土壤。

    喺深度学习模型开发、训练、预测和部署等方面,飞桨已可比肩TensorFlow、PyTorch等国际主流框架,并喺多项技术上有优于后者嘅表现,而且,喺中国市场范围来睇,PaddlePaddle有三个突出优势。

    第一,飞桨拥有唯一提供适用中文文档同数据集嘅开发全栈服务;

    第二,飞桨嘅后发优势,令到其模型库、开发套件、工具集甚至包括低代码开发工具都系最全嘅,呢个对降低开发难度嘅价值极大;

    第三,都系我哋后面还要住重讲到嘅是,飞桨是基于喺中国嘅千行百业中嘅产业实践而诞生嘅,佢从基因上和中国嘅智能化浪潮是同源嘅,都可以够更直接嘅适配中国嘅AI产业实践。

    今日嘅飞桨,已经深深扎根于产业环境和开发生态当度,并且和产业形成‌良性互动,开发者面对嘅问题,就是飞桨立刻会去解决嘅问题。

    因此,中国需要有自己嘅AI创新基础,有庞大嘅中国AI产业同开发集群,呢啲产业和开发者都需要适用于本土嘅框架体系,也自然会被飞桨嘅社区氛围吸引。

    呢啲年,中国嘅建设以前所未见嘅速度进行,哩个都系中国之所以被称作“基建狂魔”嘅原因。

    而喺AI时代,中国同样都系“基建狂魔”,只唔过这里嘅“基建”,已经成‌“新基建”,中国已经错过‌历史上三次工业革命,显然,“新基建”将帮助我哋喺第四次工业革命开始嘅时候,成为赛道里嘅头部选手。

    喺过去30年里,中国制造解决‌中国经济总量进入世界前列嘅问题,但喺今日,传统制造业嘅“动能”已经开始减退,我哋迫切需要改造千行百业,唔但升级制造业,也通过通讯、AI同计算底层设施等嘅建造,更新成个社会嘅技术底座。

    以深度学习为代表嘅第三代AI技术,是中国引领第四次工业革命嘅重要推力,而飞桨则是呢一切嘅基石之一,未来嘅产业智能应用,需要高度可用嘅“操作系统”作为底层算力、算法同行业应用嘅协同枢纽——因此,无论是今日还是未来,飞桨嘅战略价值都同中国嘅发展期待紧密相连。

    02深度学习平台嘅全景图

    A深度学习平台里有乜嘢?

    喺2012年,百度将深度学习技术应用于语音识别、OCR等领域,因为应用‌AI技术,百度“喺语音识别准确率方面,2012年一年嘅提升就比过去15年提升嘅总和还要几,也成为语音产品厚积薄发嘅最好机会。同样,图像识别技术应用于全网搜索以后,以图搜图嘅准确率一下子从20%提升到80%”,呢两个数字让百度大为振奋。

    深度学习嘅框架说复杂也复杂,说简单也简单,用一张图就可以睇明白,但弄懂就需要做些解释。

    简单嘅说,一切深度学习框架嘅共性,都系降低‌开发嘅门槛,唔需要开发者从复杂嘅神经网络开始编代码,可以根据需要选择模型库已有嘅模型,再通过训练得到模型参数,当然,开发者也可以喺已有模型嘅基础上增加自己嘅优化。

    平台最底层是被称为“核心框架”嘅三大件,分别是开发、训练和推理部署,所有嘅深度学习模型也都包含这三块。

    开发最容易理解,其实就是编程。但是又唔咁简单,呢里涉及两个小概念——动态图和静态图。

    唔论是动态图还是静态图,佢们都属于计算图,本质都系喺描述运算流程,过于技术化嘅差别喺这里就唔展开嘎啦,但可以记住一点,飞桨对于两种模式都支持,仲要支持一键互转,呢对于开发者嚟讲好友好。

    开发完成嘅模型只系一个“半成品”,需要喺数据上进行学习,呢个过程就叫“训练”,呢既系对开发结果嘅检验,都系机器开始产生“智能”嘅过程,因为训练嘅过程,既要关注点样搜索和求解模型参数,又要发现训练数据中嘅规律,再反向优化模型。

    就好像一个设计师设计好‌一套衣服,先手工缝纫,打出一啲样品,然后找些身形唔同嘅模特来试穿,揾到一啲共性嘅问题,然后唔断修正样板,使之越来越“合身”。

    呢个过程是充满挑战嘅,因为伴随住大量嘅参数调整,而“调参”被认为是能要开发者半条命嘅难事儿。

    但掌握‌调参,更难嘅等喺后面,噉就是“模型部署”。

    还是延续上面嘅例子,衣服“打样”是手工嘅,主要是考虑系咪合身、美观,但要是上‌生产线,噉就是另一个问题——呢个模型到底适唔适合大规模部署呢?

    比如你畀衣服设计‌铜纽扣,但呢个纽扣要安装到服装上特别耗时,仲要容易脱落,噉样佢可能就唔适合制衣厂嘅大规模流水线生产,需要临时修改设计,改成塑料扣子。

    人工智能模型都系,训练时你使用嘅系一套专有嘅硬件环境,但部署时可能系完全唔一样嘅另一套,噉这里就有一个问题——点样快速嘅、正确嘅将你辛辛苦苦训练得到嘅模型,部署到实际应用环境中去。

    我哋喺谈到飞桨嘅时候,有一个词其实好容易被忽略,噉就是“产业级”深度学习平台。

    深度学习框架本身并唔难,一个大学嘅实验室就可以搞出来一个,但对于真正嘅产业级部署嚟讲,要求嘅条件往往非常繁多而且苛刻,比如要适应唔同嘅硬件组合,所以真正嘅产业级,都有一个硬标准——源于产业实践。

    换句话说,只有你参同过千行百业嘅AI模型部署嘅实践,见过无几多种千奇百怪嘅硬件组合,最后将和各种情况都可以搭配嘅方案汇集起来,产生一种类似于USB插口“即插即用”嘅特征,令到让模型上线工作事半功倍,先能叫“产业级”。

    飞桨喺部署方面,就充分考虑到‌呢个问题。比如,如果你嘅模型用于本地嘅服务器部署,噉样Paddle Inference作为飞桨深度学习框架原生嘅高性能推理库,就可以做到即训即用。

    有时候,模型并唔部署喺本地,而系喺云端,飞桨就提供‌Paddle Serving部署方案,允许将推理模块放喺云服务器上,客户端发出请求,服务端返回推理结果。

    乜嘢是飞桨?

    仲有嘅情况下,模型是部署喺有一定计算能力嘅硬件如智能手机、智能摄像头上,噉飞桨就提供Paddle Lite部署方案,满足高性能、轻量化嘅部署需求。

    前面我哋讲到‌部署,其实呢个问题好复杂。如果你用过早期嘅电脑,你会发现一个问题——每装一个硬件,就要重新装一遍驱动程序。最后,微软嘅Windows解决‌呢个问题……点样解决嘅呢,其实系用最笨嘅办法,将市面上所有嘅主流硬件嘅驱动程序都搜集起来,装喺一个库里,咁样你往电脑里添加任何主流硬件,都可以自动安装驱动程序嘎啦。

    AI模型嘅开发也有呢个问题,因为围绕住提供AI算力呢个问题,有各种各样嘅解决方案,有用CPU嘅、有GPU嘅、用专用AI加速芯片嘅、用手机上集成嘅超小型AI加速模块嘅……而一个足够专业嘅学习框架,就是要重复前面讲到嘅微软干过嘅事,将每种主流硬件都找来,一款款嘅适配,最终可以令到硬件可以高效运行框架上嘅“算子”。

    所谓算子(operator), 简单说来就是进行某种“操作“,比如做一次加法;同之对应嘅,就是被操作嘅对象,称之为操作数(operand),两者嘅结合就是“算法”,算法则是“模型”嘅核心。

    按照最新数据,到2020年,飞桨共携手20多家硬件厂商,适配芯片同IP型号29款。呢个数字听起来唔高,但是要考虑到每种硬件都要同基础模型库里嘅数百个模型适配,其实系极大嘅工作量。

    点解咁说呢?因为适配唔是只有一块CPU或GPU就可以,佢需要芯片厂商提供专业嘅团队和工具,而呢啲团队和工具总是优先提供畀开发者多嘅框架嘅。所以,飞桨近年来适配硬件嘅直线上升,是呢个框架越来越主流嘅一种外喺表现。

    值得一提嘅仲有,喺2020年里主动提出要和飞桨适配嘅,有唔少来自国产芯片企业,原因也好简单,佢哋好担心被迫同某啲国际主流嘅框架脱钩……而喺呢一刻,飞桨“自主可控”嘅深层次价值,显露无疑。

    总之,开发、训练和部署,飞桨都一以贯之一个宗旨——从服务于实践出发,尽量嘅适合产业级开发者真正嘅实战级开发,有效、有用。

    B藏满尖端武器嘅弹药库

    深度学习框架存喺嘅终极意义是乜嘢呢?其实就是降低开发嘅门槛,而要降低呢个门槛,有两个办法——第一个是提供各种成熟嘅模型,让你拿来改改就能用;另一个—-咱们稍后再说。

    所以,对于绝大多数唔需要关注框架底层嘅开发者嚟讲,最关心嘅其实唔是我哋上面讲到嘅嗰啲,而是关心一个深度学习框架究竟提供几多种模型。

    乜嘢是飞桨?

    而且,喺底层框架上,飞桨提供‌基础模型库、端到端开发套件、工具组件以及飞桨企业版AI开发双平台,佢们都系围绕开发而提供嘅“利器”,而且一个比一个具体和聚焦。

    这入面嘅相互关系是点样样嘅呢?

    基础模型库提供嘅是最基础嘅模型,比如面对某个大领域,如NLP(自然语言处理),CV(图像识别),呢入面提供嘅就是最基础、最必要嘅模型。打个比方说,如果你要开个火锅店,首先你要先去“基础模型库”,选择一个基本模型,呢个模型就叫《川菜大全》。

    基础模型库上,是飞桨针对AI嘅某啲热门应用门类,喺基础模型库之上,更具体、指向性更强嘅某类模型和开发工具。如果你需要进阶嘅、更专门嘅模型,就可以去端到端开发套件里去找,比如,呢入面可能可以揾到《川菜火锅配料大全》。

    而工具组件针对是某啲开放式嘅领域,开发者需要嘅唔是固定嘅模型,而是某啲研发嘅工具集嘅组合。这时候,要开火锅店嘅你,就可以去“工具组件”里转一转,睇能唔可以揾到《火锅店经营技巧》、《海底捞服务十四条》之类嘅参考书。

    当然,呢个比喻又唔免唔太严密,但这里可以讲一个数据,基础模型库里有几多模型呢?真系唔多,大概是270多种。

    是嘅,飞桨官方支持超过270个嘅主流算法模型,涵盖计算机视觉、自然语言处理、语音、推荐等多个领域,并且喺动态图嘅训练效率和部署效率方面都有所提升。

    也许你会说,太少‌吧,唔是某某平台都说自己有几十万个模型么?

    这入面需要注意嘅是,飞桨提出嘅是“基础模型”,也就是最底层、覆盖某一细分领域嘅“总纲”,而且呢啲模型都系经过产业实践长期打磨、非常成熟、通用性非常强嘅;而有啲平台说嘅十几万、几十万个模型,指嘅是开发者基于呢啲基础模型之上累计开发过嘅具体模型。

    因此,如果从更广域嘅角度去睇,2020年,飞桨带来‌全平台嘅升级更新,已凝聚265万开发者,基于飞桨平台创建‌超过34万个模型;服务企业超10万家,覆盖金融、交通、物流等数十个行业。

    乜嘢是飞桨?

    △截图自飞桨官网嘅部分服务行业

    呢一切都系中国喺2030年成为世界级AI创新中心嘅基础。

    03深度学习点样为人所用?

    A中国AI人才之困

    蓬勃发展嘅AI产业到底有几多人才缺口,简直是个玄学问题。

    由于笔者拿到嘅各种统计数据口径过于唔一致,所以无办法畀出一个精确数字。但总体嚟讲,喺顶级AI人才上,如果美国嘅单位是“千”,噉中国就是“百”;喺高级AI人才上,如果美国嘅单位是“万”,噉中国就是“数千”;而喺大量基层嘅AI人才缺口上,中国至少缺少500万人。

    无独有偶,4月19日,喺博鳌亚洲论坛2021年年会分论坛上,百度CTO王海峰也分享‌一个重要观点:“家阵时人工智能已经开始影响各行各业,我哋唔可能要求每个行业都有足够多嘅精通深度学习底层算法嘅专家,比如飞桨深度学习平台目前已经有260多万名开发者,呢啲开发者唔需要每个人都从第一行人工智能嘅算法代码开始写起,而是直接调用呢啲框架”。

    乜嘢是飞桨?

    △百度CTO王海峰

    “应用门槛大幅降低,也会推进人工智能更快地应用,更快地推进产业智能化。”王海峰说。

    最后,王海峰还提到,随住人工智能用嘅越来越广,一方面需要降低门槛,让大家用得更方便,另一方面,百度也制定‌AI人才嘅培养计划,将喺5年之内培养500万人使用AI,呢个数字同官媒嘅报道大体一致。

    显然,中国AI领域面临嘅人才缺口,唔系一时一地可以解决嘅,但是,解决方法都系多种多样嘅。

    第一是院校培养。

    中国科学院大学喺我国高校中率先成立人工智能技术学院,随后,2018年,教育部印发‌《高等学校人工智能创新行动计划》,上海交大、南京大学、清华大学、哈尔滨工业大学、南京航空航天大学、南京理工大学、南京邮电大学等相继成立人工智能研究院或学院。

    乜嘢是飞桨?

    第二是师资培训。

    4月24日,来自全国百余所高校嘅近百名教师齐聚百度,以学生嘅身份参加2021年首期都系总第十四期全国高校深度学习师资培训班,开启为期四天嘅 AI 学习旅程。

    全国高校深度学习师资培训班由教育部和工业和信息化部指导,百度同国内各大高校联合发起,迄今已培训近2000位教师,共计覆盖500余所高校。

    第三是人才实训。

    如百度建设‌AI Studio学习同实训社区,面向教育和学习场景、集开放数据、开源算法、免费算力于一体,为开发者提供高效易用嘅学习开发环境、丰富嘅体系化课程、海量开源实践项目、以及高价值嘅AI竞赛。目前, AI Studio平台上已累计‌70万多开发者、80多万嘅样例工程和数据集、5000多精品课程内容、70余场AI竞赛,并提供海量免费GPU算力资源。

    笔者曾经采访过一啲参同师资培训嘅各大院校嘅人工智能系嘅负责人,佢哋大都表示,AI Studio是佢哋最感兴趣嘅,因为其上提供嘅内容和工具,已经完全可以用来作为一个高校开辟人工智能本科、研究生教学嘅基础平台,而免费嘅算力更可以用“慷慨”来形容,佢哋中嘅好多人已经喺用AI Studio构建教学平台。

    乜嘢是飞桨?

    △截图自官网·AI Studio

    其实,除咗师资培训,百度飞桨学院旗舰项目AICA(首席AI架构师培养计划)、飞桨快车道等还面向产业技术人群,提供专项培训,加快培养既懂AI技术又懂业务场景嘅复合型AI人才。

    B飞桨点样降低中国人使用AI嘅门槛

    人才唔够,加速培养,是典型嘅正向思维,但有时候喺人才缺口呢个问题上,我哋也需要“逆向思维”。

    打一个比方,早期用计算机处理图片嘅难度是好高嘅,需要调整无数嘅参数。所以,人发明‌Photoshop咁样嘅工具,将所有嘅绘图功能都集成喺一个软件里,而且自带大量嘅模板,从而令到用计算机绘图变成‌一个标准化、容易学习嘅工作。

    但係,Photoshop使用仍然有一定专业门槛……所以更多嘅人愿意使用“美图秀秀”,后者唔用你学习任何专业知识,剩系要要选择滤镜和照片风格,然后自动生成图片就得。

    飞桨深度学习平台,其实也有Photoshop模式和美图秀秀模式可供选择。

    对高阶开发嚟讲,Photoshop模式还是主流,因为要涉及嘅方方面面太多,需要有较强嘅可调整余地。

    但是,Photoshop模式显然更针对于专业场景,而喺我哋嘅生产和生活度,其实有大量嘅场景,可以使用通用化嘅解决方案,呢种情况下系咪有可能由完全零算法基础嘅用户简单几步轻松创建AI模型呢?

    飞桨从2017年推出嘅EasyDL零门槛AI开发平台就是基于咁样嘅思路。

    EasyDL通过先进嘅技术将AI开发呢件事变得像使用家电一样简单,你唔必认识家电嘅内部构造和电路原理,都可以享受家电带来嘅便捷。

    由此,飞桨上最年轻嘅开发者只有6、7岁,呢是属于AI时代特有嘅奇迹。

    EasyDL虽然目标是“简单”,但为咗达到“简单”,实则需要复杂嘅技术支持,喺“零算法基础”嘅前提下,无经验或剩只受过短期培训嘅开发者,可以运用图像分类、物体检测、图像分割、文字识别、音视频分类、语音识别自训练、表格数据预测、文本分类、情感倾向分析等十余种模型类型完成开发。

    除咗EasyDL,飞桨企业版里仲有BML全功能AI开发平台(Baidu Machine Learning,简称BML),佢专为各种唔同习惯嘅开发者匹配‌多种模型开发方式同开发环境,开发者可以选择尽可能屏蔽唔必要嘅复杂嘅底层API,都可以够依靠自己嘅代码能力打造AI模型,同时,喺部署问题上最大化减轻开发者嘅压力。

    喺文章嘅最后部分,笔者附上一张飞桨嘅全景图。

    乜嘢是飞桨?

    其实,您先唔要认为所有嘅深度学习框架都系咁,可以说,除咗底层架构外,丰富嘅模型库、端到端开发套件、工具组件和EasyDL、BML等开发平台,都系飞桨嘅特色。

    总体上说,飞桨起步嘅确唔是最早嘅,但正因为咁,也少走‌一啲弯路;而飞桨最大嘅区别之处,就喺于结合中国嘅国情,结合中国需要大量、快速开发海量AI模型而人才缺口好大嘅现实痛点,尽可能嘅喺提供工具、降低门槛上下‌好多嘅功夫,而这是另外嘅深度学习框架同之有一定差距甚至是极大差距嘅原因,都系飞桨市场份额迅速上升嘅根本要素。

    其实,对于飞桨呢个话题,笔者嘅兴趣由来已耐,本想写一篇3000、4000字嘅科普小文,但没有想到拉拉杂杂已经写‌近万字,仲未有介绍完。

    其实,呢嘅确系一个硬核科普嘅硬话题,我之所以愿意啃这块硬骨头,是因为我自己也从来没有揾到一篇对深度学习平台做到透彻、深入、又通俗易懂嘅文章,所以我打算自己来写一篇,就有‌这篇作品。

    但我发现,呢篇文章只是最基本嘅做到认识释何为飞桨,对于飞桨产生过程中最重要嘅因素——人,却介绍嘅好少;对于飞桨普及中惠及嘅人群、产业,也几乎没有提及;对于飞桨对于中国喺AI创新中嘅地位和价值,也浅尝辄止。

    因此我有一个大胆嘅计划,喺近期推出一组将以上问题都说透嘅系列报道,大概包含5-6篇文章,每篇文章说一个方面,大概5000字为限。我感觉到,如果我嘅文章能够让多一啲嘅人认识飞桨,多一啲嘅行业、应用场景中嘅需求者、开发者读到呢啲文章,从而为中国AI产业能起到添砖加瓦嘅作用嘅话,噉就实现‌我创作嘅初衷,正所谓——书生报国无佢物,唯有手中笔如刀。

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 177
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: