首页 专业知识 36氪首发 | 基于自研分布式内存及流数据库技术,「柏睿数据」获2亿元C轮融资

36氪首发 | 基于自研分布式内存及流数据库技术,「柏睿数据」获2亿元C轮融资

来源:晰数塔互联网快讯 时间:2020年06月19日 07:56

36氪获悉,大数据与人工智能公司「柏睿数据」本日正式宣布完成2亿元C轮融资,由海通证券旗下南方融合基金与盛石资本旗下长三角产业创新基金联合领投,同时B轮投资方东方嘉富亦追加了投资。

柏睿数据成立于2014年,定位大数据实时分析处理服务商,以国产自主可控的分析型数据库产品为核心,为企业提供数据技术、产品、服务等整体解决方案。

随着大数据时代的到来,如何高效地储存、运用大数据辅助商业决策成为了大数据领域研究的重要问题,因而催生了巨大的数据库市场。据Gartner 2019年的报告统计,整个数据库市场规模在2017年即达到388亿美金,是企业基础设施软件市场中的最大组成部分。

目前的主流的数据库类型可以分为两种,分别为OLTP (联机事务处理,Online Transaction Processing)及OLAP (联机分析处理Online analytical processing)。

OLTP对应传统的关系型数据库,主要进行基本、日常的事务处理,标志性产品包括电商、银行、证券的业务系统。OLTP发展多年,已经出现了如Oracle、SAP等业界龙头。

OLAP对应分析型数据库,是数据仓库的主要应用。OLAP强调复杂、快速查询,提供直观易懂的查询结果——如果说OLTP一秒读写数十笔数据,OLAP的量级可为百万量级,这为BI(商业智能)、AI等公司提供了商业决策的底层支撑。这一领域出现了多种产品,包括Oracle旗下的Exadata、HP Vertica、EMC收购的Greenplum、IBM Netezza等。而随着Hadoop分布式架构的出现和发展,关系型数据库发展到第三代,基于Hadoop之上的Hive、Impala、Spark SQL等分布式SQL查询引擎则让分析型数据库进一步完善,朝着第四代发展。

以国产自研分析型数据库为核心

与基于Hadoop等开源架构做数据库解决方案的公司相比,柏睿数据的特点是从数据库的底层技术上做革新。柏睿拥有完全自主研发的分布式内存数据库及流数据库核心技术,并基于这两种技术之上提供分析型数据库的数据智能解决方案。

当前,柏睿数据围绕内存处理对大数据实时分析的全新升级,已经建立了完备的产品体系,包括全内存分布式数据库RapidsDB、全内存分布式流数据库Rapids StreamDB、库内人工智能Rapids ParallelAI、跨源异构联邦连接器Rapids Federation等。

柏睿数据董事长兼CTO刘睿民向36氪介绍了各项核心产品的特性。传统的OLTP数据库主要在磁盘中处理数据,而柏睿全内存分布式数据库RapidsDB是在内存中处理,通过分布式运算的方式并行运算,查询数据库的速度可以提升得非常快。

分布式流数据库Rapids StreamDB的主要应用场景则包括工业互联网、物联网等。比如在工厂当中应用了智能传感器后,每一秒都有大量的数据传送到数据库,此时Rapids StreamDB则可以对数据进行实时的清洗和分类,加载一些运算模型,相当于预处理数据,大大提升了此后的查询和应用效率。刘睿民表示,在流数据库方面,柏睿的性能指标在过去三年在全球范围内都是领先水平,目前可以在15分钟内处理75GB的滚动数据增量。

跨源异构联邦连接器Rapids Federation则是定位跨数据源的关联查询,这其中运用了多种柏睿的核心技术。“跨数据源查询的首要难点是需要打通各个数据库,”刘睿民表示,“客户当下采用的数据库类型多种多样,在打通数据库之后,还需要把数据的类型和定义弄清楚,再统一输出结果。”

在性能方面,柏睿的分析性能计算能力是传统数据库与数据仓库的数百倍,对流式数据处理高达80万条/每核/每秒可实现日增量20TB;支持大于300/s的超高并发,可以满足大数据实时分析场景中对流式数据处理、智能实时分析等技术需求。基于此,柏睿建立的大数据实时分析平台,能够为企业提供便捷的一站式大数据系统构建服务。

此外,柏睿还开发了AIwork Flow、Data Fabic等多款数据智能技术应用工具来降低机器学习与深度学习、数据迁移等数字化进程的实施难度。

在产品落地层面,柏睿数据已经拥有超过数百家用户,覆盖政府、运营商、金融、制造业、能源、交通、教育等十多个行业,并且已完成了对多个国外产品的迁移和替代,客单已达300万-500万元,近三年营收增速在200%左右。

刘睿民表示,目前柏睿RDP平台的四个功能模块都可以灵活购买,产品收费方式方面则分为两种,按服务量或者CPU节点收费。在服务客户和合作伙伴的过程中,柏睿数据库基本是标准化交付的方式,柏睿会提供提供包括产品技术架构培训、设计及优化等服务,合作伙伴则会基于柏睿的数据库为客户做部分定制。

谈及今年的疫情影响,刘睿民表示,由于疫情原因,一些对经济运行情况的监测、产业链组织等系统的需求大为增加,老客户的紧急项目采购需求增多。从上半年的数据来看,柏睿的一季度同比去年大约是2-4倍的增长。

将实行“产业+基金+基地+智库”组合发展模式

在本轮融资后,柏睿数据将朝着几个方向发展。

首先是团队扩张。目前柏睿数据约有150人,销售及研发人员各占一半,今年将引进更多人才。此外,柏睿也将拓展渠道和代理体系,并大力发展重点行业的标杆项目,进一步在各行业复制落地。

而在未来发展战略上,柏睿数据将实行“产业+基金+基地+智库”组合模式发展战略。

在全内存数据库方向上,柏睿数据是国内探索较早的公司,并且也对行业标准有所贡献——柏睿数据是30多年来中国厂商中唯一一家主笔制定《SQL9075 2018流数据库》与《AI-in-Database库内人工智能》数据库国际标准的企业。

同时,柏睿数据也在北京、上海等地设立研发基地,以建立数据智能生态行业智库。2020年1月,柏睿数据注册了北京柏睿数据技术研究有限公司,此外还与国家信息中心数字中国研究院在上海市嘉定区成立了新一代数据库与人工智能研究中心,吸引更多高水平人才,推进不同行业和领域的场景应用。

而在高校层面,柏睿数据先后联合中国人民大学、华中科技大学、中国矿业大学、上海嘉定工业区、甘肃丝绸之路信息港等政府、科研机构和企业,建立了智能数据处理领域的科学实验室。

刘睿民表示,柏睿数据过去发展的6年里,以国产数据库自主创新为主轴线,以大数据关键核心技术为主攻方向,实现了公司核心产品从“全内存数据库系统”到“数据智能生态构建”的演变。在未来,柏睿会坚持做好国产数据库,这也是推动新基建建设、夯实底层软件的基础。

附柏睿数据融资历程:

2015年,柏睿数据获得蓝驰创投近千万元PreA轮投资;

2016年获得数千万A轮融资,由信中利领投;

2017年5月,柏睿数据宣布获得中科院国科嘉和基金投资的千万级美元B轮融资;

2018年获得东方嘉富、盛世泰诺等亿元人民B+轮投资。

相关推荐

36氪首发 | 基于自研分布式内存及流数据库技术,「柏睿数据」获2亿元C轮融资
创投日报 | 「柏睿数据」获2亿元C轮融资,「MycoTechnology」获3900万美元D轮融资;以及今天值得关注的早期项目
36氪首发 | 推出自主可控的分析型数据库,「聚云位智」获第四范式及正轩投资的5000万元A轮融资
36氪独家 | 超融合厂商「SmartX」完成2亿元B+轮和C轮融资,继续拓展中高端企业云市场
创投日报 |「玩物得志」完成8000万美元C轮融资;「小睿智洗」获数千万元pre-A轮融资 ;以及今天值得关注的早期项目
36氪首发 | 「极睿科技」获红杉领投的亿元级 A 轮融资,用人工智能改变万亿服装业的“人货场”
36氪首发 |「中科闻歌」获2亿元人民币C轮融资,从数据智能走向决策智能
36氪首发 | 三维实景地图服务商「AIRLOOK」获近亿元B+轮融资,广发乾和领投
36氪首发 | 「熵简科技」获数千万美元 B 轮融资,帮助企业建设“全域数据中台”
创投日报 |「捍宇医疗」获5亿元D轮融资,「中天安驰」获亿元人民币C轮融资;以及今天值得关注的早期项目

网址: 36氪首发 | 基于自研分布式内存及流数据库技术,「柏睿数据」获2亿元C轮融资 http://www.xishuta.com/zhidaoview11060.html

所属分类:创业投资

推荐专业知识