Hologres为什么要流批统一的存储?

作者阿里云代理 文章分类 分类:阿里云服务器知识库11 阅读次数 已被围观 11次

客户问题场景:

Hologres为什么要流批统一的存储?

凯铧互联技服回复:

Hologres 定位是能够做离线数据和实时数据的存储。对于典型的 Lambda 架构,是将实时数据通过实时数据的链路写入到实时数据存储中,离线数据通过离线数据的链路写入 到离线存储中,然后将不同的 Query 放到不同的存储中,再做一个Merge。对于Hologres,数据收集之后可以走不同的处理链路,但是处理完成之后的结果 都可以写入Hologres中,这样就解决了数据的异质性问题,也不需要去区分离线表和实时表,降低了复杂度,也大大降低了使用者的学习成本。Hologres 底层支持行存储和列存储两种文件格式,对于两者的处理也有略微不同。数据写入的时候先写log,log 是存储在分布式文件系统中的,保证整个服 务的数据不会丢失,因为即便服务器挂掉也可以从分布式系统中恢复。Log 写完之后再写 MemTable,就是内存表,这样子才认为是数据写入成功。MemTable 有一定的大小,写满了之后会将其中的数据逐渐 Flash 到文件中,文件是存储在分布式系统中的。而对于行存储和列存储的区别就在 Flash 到文件的这个过程中,这个过程会将行存表 Flash 成行存储的文件,列存表会 Flash 成列存文件。在 Flash 的过程中会产生很多小文件,后台会将 这些小文件合并成一个大文件,这里也会有所不同。

 
 

阿里云2021年开年有礼!

爆款产品:阿里云服务器|云数据库|云安全0.6折起 详情访问了解更多:https://partner.aliyun.com/shop/30466075
 

以上就是Hologres为什么要流批统一的存储的说明。凯铧互联提供阿里云服务器/腾讯云服务器/华为云服务器/百度云服务器等产品的代购服务,为您提供云产品专属优惠折扣,通过凯铧互联购买可以获得折上折,若您需要帮助可以直接联系我方客服!同样的品质,更多贴心的服务,阿里云代理商凯铧互联专业技术团队同时为您提供便捷专业的7x24一对一专业全面的技术服务。 电话专线:136-5130-9831,QQ:3398234753。

为什么选择我们:北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里巴巴、腾讯等,作为阿里云,华为云,腾讯云,百度云,金山云,华为云重要的合作伙伴,专注于为企业用户提供云计算及基于云服务器的解决方案。总部设在北京,并在内蒙设有办事处。做为一家综合性方案商,凯铧互联向各行业用户提供基于云服务器的各种解决方案。为用户获得优质服务的同时,秉承"专业规划、周到服务"的服务理念,根据用户的实际情况,充分考虑各种网络资源的特点及功效,为用户量身定做一套适合于其实际应用需求的网络应用方案。帮助用户利用互联网的力量展开新的营销方式,并大大缩短了项目实施周期,获得用户的一致好评。

本公司销售:阿里云、腾讯云、百度云、天翼云、金山大米云、金山企业云盘!可签订合同,开具发票。
?