甲骨文公司今天宣布推出
MySQL HeatWave Lakehouse,这款产品能够帮助客户处理和查询对象存储中数百
TB
量级的数据,支持各种文件格式,包括
CSV、Parquet
以及
Aurora
和
Redshift
备份格式。MySQL
HeatWave Lakehouse
是
MySQL HeatWave
产品组合的新产品,能够将事务处理、分析、机器学习和基于机器学习的自动化结合在单一
MySQL
数据库中。
MySQL HeatWave
Lakehouse
采用大规模并行横向扩展
MySQL HeatWave
架构,根据行业标准基准测试的结果,在运行查询和加载数据性能方面表现出色。此外,客户可以通过单个查询在
MySQL
数据库中查询事务处理数据,并使用标准
MySQL
语法将其与对象存储中的数据组合。甲骨文还宣布推出新的
MySQL Autopilot
功能,可提高性能并让
MySQL HeatWave Lakehouse
方便易用。MySQL
HeatWave
现推出了
Lakehouse
的
Beta
版供客户试用,正式版将于
2023
上半年发布。
客户从
AWS、Google
和本地环境迁移到
MySQL HeatWave
之后,已经在各种场景中使用该产品,包括营销分析,特别是广告营销活动效果的实时分析与客户数据分析,从而构建有效的营销活动。还有其他一些客户也从
AWS
迁移到这款产品上,包括汽车、电信、零售、高科技和医疗保健行业的佼佼者。
创新功能
•
更大数据量,标准
MySQL
语法
客户可以通过
MySQL HeatWave Lakehouse
查询多达
400 TB
的数据,HeatWave
集群可扩展到 512
个节点。客户可使用标准
MySQL
语法查询数据。
•
稳定的性能和压缩表现
MySQL HeatWave
为存储在
MySQL
数据库或对象存储中的数据提供相同的查询性能,10
TB 和
30 TB TPC-H
基准测试结果印证了这一点。此外,在这两种情况下,它所实现的压缩量和每个节点可以处理的数据量都是相同的。
•
支持多种文件格式
使用
MySQL HeatWave Lakehouse,客户可以加载和处理以各种文件格式存储的数据,例如
CSV 和
Parquet,以及
AWS 的
Aurora
和
Redshift
备份格式。因此,即便客户的数据并未存储在
MySQL
数据库内,他们也能从
MySQL HeatWave
的优势中获益。无论数据使用何种文件格式存储,客户始终可获得稳定的查询性能。
•
支持查询
MySQL
中的数据并将其与对象存储中的数据组合
使用
MySQL HeatWave Lakehouse,
客户可以查询存储在
MySQL
数据库中联机事务处理过程
(OLTP)
数据,并将其与存储在对象存储中的数据组合。对
OLTP
数据所做的任何更改都会实时更新,并体现在查询结果中。
新
MySQL Autopilot
功能
MySQL Autopilot
为
MySQL HeatWave
提供基于机器学习的自动化功能。多项现有
MySQL Autopilot
功能(如自动预配和自动查询计划改进)针对
MySQL HeatWave Lakehouse
进行了增强,从而进一步降低数据库管理开销并提高性能。此外,我们如今还为
MySQL HeatWave Lakehouse
提供了诸多
MySQL Autopilot
新功能。
•
自动模式推断
Autopilot
可自动推断文件数据到数据库中数据类型的映射。因此,客户无需手动为要由
MySQL HeatWave Lakehouse
查询的每一个新文件指定映射,从而节省时间和精力。
•
自适应数据采样
Autopilot
可智能地对于对象存储中的文件进行抽样,从而在尽可能减少数据访问量的情况下收集准确的统计信息。MySQL
HeatWave
将这些统计信息用于生成和改进查询计划、确定适宜模式映射以及其他用途。
•
自动加载
Autopilot
会分析数据以预测将其加载到
MySQL HeatWave
中所需的时间、确定数据类型映射,并自动生成加载脚本。用户不必手动指定文件到数据库模式和表的映射。
•
自适应数据流
MySQL HeatWave
Lakehouse
可动态适应底层对象存储的性能。因此,MySQL HeatWave
可充分发掘底层云基础设施的性能,进而提高整体性能、性价比和可用性。
其他增强功能
甲骨文公司宣布推出MySQL
HeatWave多项其他增强功能,覆盖机器学习到 VS 代码插件。MySQL
HeatWave
的数据库内机器学习功能也已得到进一步增强,添加了对于预测模型的支持。其中添加了新的机器学习解释技术,并且专门针对
MySQL HeatWave
进行了优化。数据科学家现在可以影响自动化
HeatWave ML
训练管道的各个阶段,包括算法选择、特征选择、评分指标和解释技术。HeatWave
机器学习还经过增强,让客户可以将机器学习模型导入
HeatWave。
新的多引擎
Hypergraph
查询优化程序可进一步提高复杂查询的性能,并且不再需要指定联接顺序。新增区域映射,可使用
MySQL HeatWave
为更广泛的查询加速。MySQL
的
VS
代码插件经过增强,可为
MySQL HeatWave
功能提供支持。
内容载自:ORACLE网站
