数据湖/数据仓库


出品人 : 代立冬

数据湖和数据仓库是存储和管理数据的重要解决方案,它们在数据管理、数据分析和决策中发挥着关键作用。 在ASF,有不少是与数据湖和数据仓库有关的项目,例如: Apache Hive, Apache Hudi, Apache Iceberg, Apache Paimon, Apache Cassandra, Apache HBase等。 在这个主题中,你将得到数据湖和仓库的最新情况,公司在生产中使用它们的最佳做法,以及这些项目的路线图。

2023-08-18

13:30 GMT+8 使用Apache Flink, Apache Hive和Apache Iceberg构建实时数据仓库的挑战和解决方案 中文演讲 Yan Liu 刘岩

14:00 GMT+8 基于 Flink 构建实时数据湖的实践 中文演讲 王正,闵中元

14:30 GMT+8 OpenEuler和Bigtop与Ambari:在现实世界中增强数据湖 中文演讲 顾煜祺

15:00 GMT+8 APACHE LINKIS 在湖仓一体架构下的数据处理实践 中文演讲 王华磊

15:45 GMT+8 数据湖 Iceberg 在小米的实践与优化 中文演讲 肖杰宝

16:15 GMT+8 字节跳动基于 Parquet 格式的降本增效实践 中文演讲 徐庆,王恩策

2023-08-19

13:30 GMT+8 云原生数据湖如何提速两倍以上 中文演讲 史少锋

14:00 GMT+8 Apache Paimon 流式数据湖:CDC 入湖与流读 中文演讲 李劲松

14:30 GMT+8 下一代超高性能大数据集成工具 - Apache SeaTunnel 在数据湖场景的应用 中文演讲 代立冬

15:00 GMT+8 基于Apache Iceberg, Apache Arrow和Apache Parquet的创新lakehouse设计 中文演讲 吴刚,付旭炜