云原生湖仓

云原生湖仓 云原生湖仓
云原生湖仓

云原生湖仓整合数据湖和数据仓库,依托云原生特性,支持多种数据高效存储、分析。可在线扩容,提供强大的ETL、数据治理、机器学习支持,支持实现自助式BI。为企业带来高效数据处理、快速决策响应和创新能力,助力业务发展。

云原生湖仓整合数据湖和数据仓库,依托云原生特性,支持多种数据高效存储、分析。可在线扩容,提供强大的ETL、数据治理、机器学习支持,支持实现自助式BI。为企业带来高效数据处理、快速决策响应和创新能力,助力业务发展。
产品优势
云原生大数据

具备存算分离、弹性扩缩、灵活调度等优势。独立存算,确保系统灵活性,弹性扩缩自动匹配资源,灵活调度提高协同效率,为企业提供卓越的创新动力。

湖仓一体

充分融合数据湖与数据仓库优势,保持数仓高性能和易管理特性,同时支持多类型数据、ACID事务、高并发等数据湖特性。实现数据湖与数据仓的协同发展,为企业赋能更全面、灵活的数据管理能力。

引擎创新升级

平台以开放性为设计核心,整合并深度优化了多元计算引擎。通过精心改良,Spark、Flink等引擎展现出更为强大的计算性能。为企业提供高度灵活、强大且多样的计算支持,助力应对业务高速发展带来数据的多样化挑战。

核心能力
湖仓一体,一份数据服务多种业务场景

湖仓一体引擎以云原生架构为基础,融合数据仓库和数据湖的优势,将所有结构化、半结构化、非结构化数据统一入湖,实现了对数据进行高性能管理与灵活应用的完美平衡,可以使一套数据服务于多种业务场景。通过统一接口支持实时查询、OLAP分析,确保了数据高效与敏捷的共享。引擎还具备ACID特性,支持数据上传、修改、查询等操作,提升事务性处理能力,使其成为适应各类复杂业务需求的卓越选择。

存算分离,节省数倍存储资源

采用对象存储与Kubernetes技术构建了大数据存算分离架构,解耦存储与计算,实现了数倍存储资源的节省。按需扩展计算和存储节点,提高系统灵活性,有效满足大规模数据处理需求,进而实现更高性能和可扩展性。助力企业资源优化与降低成本的同时,增强数据的安全性和隔离,提高企业的应变能力与竞争力。

弹性扩缩,百分百计算资源利用率

引入Flink Operator与Spark Operator,实现计算资源的自动弹性伸缩,根据数据潮汐效应灵活动态分配资源,避免离在线任务抢占,确保最佳计算资源利用。支持智能调整应用程序按需申领资源,以保障高效利用,为企业提供在需求波动中的灵活响应,实现最大化计算资源效益。

统一元数据,赋能全方位数据治理

统一元数据通过全面收集和展示数据元信息,实现高效的数据搜索和发现,使用户能快速准确地找到所需的数据资源。支持血缘追踪、数据质量监控和修复,提升数据的可信度、可追溯性、一致性和准确性。通过元数据分类和标记,增强对敏感信息的管控,有效降低潜在的合规风险。

引擎增强,让计算引擎更稳更快更弹性

采用Apache Celeborn作为RSS工具,有效解决大数据量Flink和Spark作业中常见的磁盘写满、网络不稳定以及随机IO等运行稳定性问题。计算引擎更为稳定,同时在大数据量Shuffle方面取得显著性能提升,加速计算任务的执行速度和提高任务运行质量。

核心能力
湖仓一体,一份数据服务多种业务场景

湖仓一体引擎以云原生架构为基础,融合数据仓库和数据湖的优势,将所有结构化、半结构化、非结构化数据统一入湖,实现了对数据进行高性能管理与灵活应用的完美平衡,可以使一套数据服务于多种业务场景。通过统一接口支持实时查询、OLAP分析,确保了数据高效与敏捷的共享。引擎还具备ACID特性,支持数据上传、修改、查询等操作,提升事务性处理能力,使其成为适应各类复杂业务需求的卓越选择。

存算分离,节省数倍存储资源
弹性扩缩,百分百计算资源利用率
统一元数据,赋能全方位数据治理
引擎增强,让计算引擎更稳更快更弹性
应用场景
云原生湖仓集群搭建

业务痛点


主流数仓架构需要同时支持实时和离线两种计算模式,以及相应的存储方式。但是实时计算层与离线计算层、实时存储层与离线存储层之间并不统一,存在割裂。这使得企业需要投入更多硬件资源和精力来维护代码。


业务价值


简化管理:简化数据湖和数据仓库的管理与维护。

专注开发:无需关注数据转换,专注数据开发,提升业务洞察力。

降本增效:存算分离架构,使用对象存储,能够更加高效的利用存储资源。

云原生湖仓集群搭建

业务痛点


主流数仓架构需要同时支持实时和离线两种计算模式,以及相应的存储方式。但是实时计算层与离线计算层、实时存储层与离线存储层之间并不统一,存在割裂。这使得企业需要投入更多硬件资源和精力来维护代码。


业务价值


简化管理:简化数据湖和数据仓库的管理与维护。

专注开发:无需关注数据转换,专注数据开发,提升业务洞察力。

降本增效:存算分离架构,使用对象存储,能够更加高效的利用存储资源。