当代资讯

酷克数据发布新版HashData云数仓,用AI驱动数据分析

互联网

      近日,国内领先的云原生数据分析平台公司酷克数据正式发布了旗下云端数据仓库 HashData Enterprise 4.0 新版本,采用了全新升级的产品内核,提供了更加丰富的企业级分析与AI应用特性,进一步提升了产品易用性,助力企业更高效地应对 AI 时代的数据挑战。

      作为云原生与湖仓一体的倡导者,酷克数据公司专注于高性能、全托管的云端数据仓库技术研发,其产品通过创新的三分离架构、开源生态和完善的管理工具,致力于满足企业对多云环境下的资源管控与高效治理,赋能企业数智化转型。

 

      革新功能,赋能企业释放数据潜力

      2020年5月,HashData Enterprise 3.0 版本正式发布,率先落地实现了元数据、计算和存储三层分离,多集群共享统一数据存储的云原生架构,提供前所未有的大规模数据纳管与分析能力。历经四年的持续打磨迭代,HashData Enterprise 3 系列已发布数十个版本,成功帮助金融、运营商、能源等国民经济重要行业的领军企业加快数据架构的转型与升级,目前管理着 100+PB 的数据,每天处理1亿+的 SQL 查询。

      此次推出的 HashData Enterprise 4.0 在延续云原生架构优势的基础上,进一步聚焦性能优化、灵活性增强及 AI/ML 应用支持能力的提升,以更高效、更智能的方式助力企业加速迈向数字化未来,释放数据的真正潜力,赋能行业创新与变革。

 

      湖仓融合:连接多样化数据生态

      在现代数据管理中,企业面临的数据类型多样化以及存储环境复杂化对传统工具提出了新挑战。HashData Enterprise 4.0 通过湖仓融合的设计实现数据存储与分析的深度统一:

      ·无缝对接 Hive:通过 Hive Connector 和 HMS autosync 功能,无需迁移即可访问 Hive 生态数据,保障数据资产的完整性与使用效率。

      ·支持开放数据湖格式:集成 Iceberg、Hudi 和 Delta Lake 等主流数据湖技术,增强对分布式数据管理的灵活支持。

      ·逻辑数据仓库能力:迁移 PostgreSQL 生态丰富的 FDW 插件,轻松对接文件、关系型数据库及分布式存储,实现跨平台数据的高效分析与查询。

      通过湖仓一体的创新,企业能够更便捷地访问和管理分散的数据源,加速数据价值的释放,支持更多复杂分析场景的实现。

 

      AI/ML 应用:推动智能化分析场景落地

      HashData Enterprise 4.0 加强了对 AI/ML 及大模型场景的支持,帮助企业将数据分析能力拓展至智能化决策领域:

      ·向量数据支持:引入 pgvector 技术栈,实现向量存储和查询能力,为推荐系统、语义搜索等 RAG 应用场景提供有力支持。

      ·HashML 平台:整合业界最前沿的 AI 算法及 MLOps 功能,为企业提供从数据处理到模型部署的一站式体验,极致简化复杂的数据管理与分析,使企业能够专注于加速创新和业务价值。

      ·非结构化数据管理:新增 Directory Table 功能,支持文本、图像等非结构化数据的存储与管理,扩展分析场景的边界。

      这一系列功能将 AI 与数据仓库的深度融合推向新高度,降低了企业在智能分析场景中的技术门槛。

 

      查询性能优化:快速响应业务需求

      作为企业数据分析的核心能力,HashData Enterprise 4.0 在查询性能方面的升级尤为突出:

      ·向量化执行引擎:结合 SIMD 指令集与 JIT 技术,大幅提升批量数据的处理速度。

      ·行列混存技术:通过结合行式存储的高效写入和列式存储的快速读取,优化查询和存储性能。

      ·物化视图增强:支持增量刷新及自动查询改写,显著提升查询效率。

      ·缓存和索引优化:新增数据缓存层及主流索引类型支持,大幅提升小批量数据操作的性能,同时支持 HTAP 场景。

      这些性能优化为企业提供了更高效的数据处理能力,帮助快速响应业务变化,支持实时决策需求。

 

      强化安全防护,打造可信数据环境

      在数据安全和业务连续性方面,HashData Enterprise 4.0 实现了全方位升级,为企业构建可信赖的运行环境。

      ·数据脱敏与加密功能,通过规则灵活实现脱敏,结合 pgcrypto 加密函数确保数据在存储与传输中的高度安全性。

      ·动态故障转移与无缝恢复机制可实时检测并处理故障节点,通过一致性哈希算法重新分配数据文件,保障计算过程不中断,同时实现故障节点的自动恢复与集群再平衡。

      ·产品级异地灾备,通过 CDC 技术实现元数据和业务数据的高效同步,满足不同集群间数据一致性的严格要求,并支持自定义 RTO/RPO 以适应业务需求。

      ·多版本访问功能允许企业保留数据库对象的历史版本,提供时间旅行与 UNDO 操作能力,为数据的持久化与高效恢复提供了更强支持。

      ·多地多活架构打破了地域限制,实现跨地域集群的高效协同与备份,为企业提供稳定的业务连续性保障。

      通过全方位的安全升级与可靠设计,HashData Enterprise 4.0 帮助企业应对日益复杂的数据安全挑战,为其数字化转型之路提供可靠保障。

 

      AI 驱动下的未来云端数据仓库,加速企业数据智能化进程

      HashData Enterprise 4.0 新版本的推出,标志着酷克数据在云端数据仓库领域的又一次重大迭代。凭借湖仓一体的创新架构、AI 深度融合的智能分析能力,以及全面升级的安全防护体系,新版本为企业在 AI 时代的数据管理和分析提供了有力的技术支持。

      未来,酷克数据将继续秉持创新驱动的研发理念,聚焦企业数字化转型的核心需求,不断完善产品生态,为更多行业赋能。借助 HashData Enterprise 4.0 的强大能力,企业能够更加从容地应对数据挑战,加速迈向以数据驱动的高效、智能化未来。

标签: