• 简中
    • 繁中
  • 注册
  • 查看作者
  • 大量资本涌入,图数据库要火?

    转载:本文嚟自微信公众号“中智观察”(ID:Hapiweb-soft6),作者:海策,校对:陈杨,转载经授权发布。

    早在上个世纪九十年代,数据储存意识就已经深入企业内部。随住市场环境变化及企业自身发展,绝大部分企业完成数据储存建设嘅同时,对数据存储嘅功能需求都在不断地增加演进。

    而随住数据驱动决策越嚟越深入人心,企业对将数据转换为资产越嚟越关注。于是在数据资产化嘅道路上,各类产品、技术、解决方案层出不穷。

    所以数据资产化到底在资产化乜嘢?好似人力资源、资金资源、空气水一样,数据能够为企业带嚟点样嘅价值。事实上,数据资产化就是要推动数据辅助企业精进业务:通过理性有效嘅数据分析推动企业进行高效决策。

    2021年开年,图数据库新锐TigerGraph宣布完成1.05亿美元C轮融资,成为迄今为止行业中最大单笔融资。资本嘅涌入,等图数据库再以新嘅势头进入大众视野,越嚟越多嘅舆论认为图数据库大火,甚至成为未嚟嘅趋势。但,事实果真咁吗?

    01 图数据库“亮”在边

    图数据库,以图结构进行语义查询,使用顶点、边同属性嚟表示同存储数据嘅数据库。换句话说,图数据库即基于图模型,对数据进行存储、操作同访问,同关系型数据库中嘅联机事务处理(Online Transactional Processing,OLTP)数据库类似,支持事务、可持耐化等。

    从概念上嚟睇,图数据库并没甚值得称道嘅地方。而从图数据库嘅实践案例中嚟睇,其到底有何优势值得一火,一目‌然。

    在金融行业度,信用借贷一直是数据被畀予厚望嘅场景。要降低借贷门槛,又要减少用户违约、失联等风险,这需要大量嘅用户数据,嚟支撑借贷方掌握用户嘅风险值,呢种工作嘅频度甚至达到日级。喺呢个过程度,数据量实时不断增加、计算能力压力增大,随之而嚟嘅系耗时耗力中伴随嘅风险值增加,提升风控效率一直是急需解决嘅事项。

    图数据库为其带嚟嘅改变是:首先,帮助借贷方构建用户之间嘅图关联。从用户顶点出发,根据各种属性(如账号、交易、资金、地址、手机号等)之间嘅关系进行连接,进而揾到显性或隐性嘅用户社会关系,通过实时不断嘅连接从而更精准地计算出用户嘅风险值。

    其次,喺图数据库平台上,基于对数百亿节点数万亿边嘅大图进行操作,识别同失联用户相关度最高嘅顶点,例如经常出现嘅快递寄送点、寄送用户等属性,通过自动化修复失联数据,进而提升人工效率,挽回损失。

    大量资本涌入,图数据库要火?

    在能源行业,电力运维是一种非常智能嘅场景,发电厂、铁塔、变电站、用电设备等节点构成嘅物理网络,对于图数据库具有天然嘅亲和力。喺运行过程度,随住节点不断增加、需求响应负荷大规模发展,电网各业务部门之间迫切需要打破数据孤岛,实现“全网”状态实时感知,敏捷响应,随需迭代等智能电网能力。

    图数据库在做嘅系,首先将电力网络中实体同关系映射为图,通过自动化嘅关联,从而节省电流检查作业/全网状态评估作业嘅时间,实时储存数据并接入新嘅联系。

    其次,喺电力运维预案度,图数据库在提升庞大节点管理同关联分析上发挥‌高性能嘅优势。以供电设备节点为顶点,通过演练嚟分析其节点关闭带嚟嘅影响,从而合力规划设备调整并提前预警。

    大量资本涌入,图数据库要火?

    图数据库架构 来源于星环科技官网

    从这两个典型案例中不难睇到,图数据库所表现出嚟嘅优势主要有两大点:

    一、极具敏捷性、高拓展性。图数据库能够自动化建立节点关联,实时完成数据拓展联系补充,从而支持图计算在海量数据关系运算度,处理大数据关联分析嘅分析计算;

    二、高效查询功能。用图数据库支持大视图下嘅快速导入同高效查询、快速完成百亿级数据导入实现毫秒级查询响应。

    02 大宏图,小规模

    2019 年,Gartner在数据同分析峰会上首次将图数据库列为 2019 年十大数据同分析趋势之一,并预计到 2022 年,全球图处理及图数据嘅应用将以每年 100% 嘅速度迅猛增长,2020 年保守估计为 80 亿美元。Gartner认为市场尚处于蓝海,竞争却遍布全球。

    在现实中嘅情况却是,图数据库已经具备‌比较成熟嘅产品及实践案例,但截止目前,图数据库嘅应用范围仍然较小。例如,喺国内图数据库主要被应用在金融风控、推荐、社交、故障运维、销售等场景,而用户都多集中在大型金融方、电商、社交服务商等。不难睇出,图数据库嘅应用是非常具有针对性嘅、高门槛嘅。

    在国内,图数据库行业起步略晚,市场都尚未形成规模。据中国软件网记者不完全统计,目前国内出现频率较高嘅图数据库产品主要有一下11种,呢啲产品嘅厂商哋主要有互联网厂商、大数据公司以及原生图数据库公司:

    大量资本涌入,图数据库要火?

    中国软件网整理

    通过观察可以发现,从产品功能层面,但系以将图数据库产品大致划分为三大类:偏查询类(联机事务图)、偏分析引擎类、偏图计算引擎(离线图分析)。例如,杭州欧若数网科技Nebula Graph,支持多种后端存储、计算下推、Space 支持多租户物理隔离、属性查询等;星环科技Transwarp StellarDB,面向属性图(Property Graph)嘅综合性分布式图数据库,能够支撑千亿边规模嘅超大图,为业务人员提供存储、查询同分析图嘅能力;腾讯云数图TGDB(Tencent Graph Database)通过支持PageRank、社群发现、相似度计算、模糊子图匹配等社群发现算法进而实现高性能图计算。

    从技术层面嚟睇,分布式图数据库成为主流。例如,蚂蚁金服嘅分布式图数据库GeaBase、字节跳动嘅分布式图数据库ByteGraph等,分布式扩展、分布式架构容灾方案等设计,从多个方面确保图数据库储存、查询、分析、计算高性能运转。

    大量资本涌入,图数据库要火?

    蚂蚁金服GeaBase风控场景 来源于蚂蚁金服官网

    从存储方式上睇,目前图数据库产品多采用连接第三方存储而非原存储方式,并唔断优化性能。例如,百度安全HugeGraph图数据库,支持同Hadoop、Spark、HBase、ES等大数据系统集成以及多种Bulk Load操作,从而实现海量数据快速插入等。

    从商用化上嚟睇,原生图数据库公司实践表现唔错。例如,费马科技帮助京东金融强化风控等级、帮助搜狗提升百倍搜索精度、帮助国家电网设备节点关联分析;平安银行签约Ultipa Graph等。

    03 下得功夫,方能成事

    综上,高扩展性、灵活性、敏捷性等特征同优势,使得图数据库家阵时虽然处在“幼苗”期,但其发展壮大嘅路径是有迹可循嘅。那么,图数据库大火嘅机遇在边?

    建立原生数据库,同时要支撑灵活部署同迁移。喺图数据库关键嘅高可拓展性能度,需要其建立自身能够用于处理高度连接数据嘅查询同存储数据库,以支持数据激增中创建、读取、更新或删除 (CRUD) 等实时动态变化需求,从根本上改变数据嘅存储、处理嘅速度、安全性同成本,提升敏捷性。同样同之相对应嘅系,喺数据存储嘅过程度,图数据库都要解决多种数据库类型嘅关联问题,从而满足数据调度、迁移。

    持续高性能运转,支撑复杂分析功能。支持更高遍历嘅复杂分析、查询执行,以亚秒级响应能力为目标。同样哋,加深图数据库深度应用,推动更多复杂分析能力集成。

    优化便捷应用。喺面向技术开发人员度,零代码开发方式会系图数据库带嚟更多竞争优势;面向企业用户,图数据库急需优化用户自定义索引同查询语言,降低操作门槛。

    随住海量数据关联性越发强烈同复杂,图数据库嘅优势将会愈发凸显。此外,同第啲“类型” 嘅数据相比,图数据库嘅融合性都将是其招牌。但不得不重视嘅系,图数据库要大规模应用,根本嘅仲是产品技术本身急需突破。

    cantonese.live 足跡 粵字翻譯

    2021-03-24 20:07:20

  • 0
  • 0
  • 0
  • 189
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: