• 简中
    • 繁中
  • 注册
  • 查看作者
  • 转载首发 | AI数据服务公司「爱数智慧」完成B轮融资 即将上线开源社区MagicHub

    作者:许跃鑫

    编辑:石亚琼

    转载获悉,AI数据服务公司爱数智慧已经喺2021年初完成B轮融资,融资金额达到数千其人民币。本轮融资由凡创资本投资.爱数智慧嘅创始人兼CEO张晴晴博士讲畀转载,本次融资嘅资金将主要被用于打造覆盖全球嘅AI开源社区MagicHub,人工智能对话式AI嘅训练数据集产品设计和数据采集标注SaaS平台嘅研发等方面。

    随住人工智能在各种场景嘅落地应用,上游嘅AI数据服务行业嘅市场规模不断扩大。数据、算法、算力是驱动人工智能发展嘅三大核心要素。数据作为人工智能技术架构嘅基础层,其数量和质量会直接影响算法嘅训练效果。AI数据服务是指将语音、视频、文字等原数据经过加工处理后形成AI算法模型能够直接使用嘅训练数据。

    爱数智慧成立于2016年,为超100家国内外客户提供专业嘅人工智能数据解决方案,包括数据处理方案设计、训练\测试数据集产品、数据标签化,以及数据处理系统嘅私有化部署等。爱数智慧讲畀转载,爱数智慧不但拥有十几万个钟头嘅覆盖多语种多种方言嘅训练数据集,仲要为大型客户提供数据采集标注私有化部署。

    张晴晴认为数据识别率嘅提升包括三个阶段:分别是0-90%,90%-95%、95%-100%,第一阶段嘅绝大部分场景并唔需要定制数据,标准化训练数据集即可满足;第二阶段可以使用标准化+部分定制嘅垂类数据集,第三个部分才真正需要100%精准定制。语音数据嘅标签化涉及语音、情感、信号等多维度,规则和规范十分复杂,一旦某啲步骤出现问题,数据训练出来嘅效果可能会不尽如人意,非常浪费客户嘅成本和生产周期。

    爱数智慧讲畀转载,目前公司已处于AI语音数据服务行业嘅第一梯队;2020年,爱数智慧嘅营业收入接近亿元。客户包括国内外头部互联网公司、移动通信、知名算法公司等,呢啲客户将成为爱数智慧新嘅营收增长来源。此外,喺业务板块上,爱数智慧还于2020年开拓‌文本数据业务线,提供文本数据嘅产品和服务,以完善对话式AI业务板块。

    为响应国家十四五规划提出嘅支持数字技术开源社区,同时在行业深耕多年嘅经历,爱数智慧发现AI工程师最崩溃嘅就是点样在汪洋大海里揾到好数据/能用嘅数据。俗话说,巧妇难为无米之炊,数据作为基础层,为算法提供‌坚实嘅基础,没有好数据,乜嘢也做不嘎啦。于是,MagicHub开源社区应运而生。MagicHub开源社区嘅发布将满足更多行业和AI从业者对于训练数据嘅需求、降低数据使用门槛,解决找数据难嘅问题,爱数智慧将会在4月15号开源30种语音训练数据集,首批数据集包括NLP数据集、ASR数据集、TTS数据集和LEX发音词典,涵盖‌多个语种、场景和领域,未来每个月都会更新训练数据集。

    爱数智慧建立开源社区为AI从业者提供丰富嘅训练数据集和数据处理工具,探索训练数据集即可满足企业业务需求嘅可能性,从而帮助企业降本增效,促进AI行业嘅快速发展。

    最后,张晴晴博士总结说,训练数据集、数据采集标注SaaS平台以及MagicHub开源社区是爱数智慧业务三大基石。

    数据作为虚拟世界嘅原油,针对数据处理嘅核心竞争点在于对数据业务嘅专业性理解和提供解决方案嘅能力。除咗爱数智慧外,AI语音数据服务行业已有嘅玩家还包括海天瑞声、澳大利亚企业APPEN、标贝科技等企业。

    cantonese.live 足跡 粵字翻譯

    2021-04-12 12:35:44

  • 0
  • 0
  • 0
  • 165
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: