大数据


出品人 : 代立冬,李岗

大数据正在深刻的引领和改变着各个行业,已经与我们的生活密不可分,大数据也是 ASF 的非常重要的组成部分,ASF 有非常多的大数据项目,比如大家熟知的 Hadoop, Hive, Spark, HBase, Kylin, Ozone, CarbonData, Doris, Cassandra等等,在这个主题中,大家会学习到这些技术的前沿趋势和来自一线用户的实践经验、原理、架构分析等精彩内容

2022-07-29

ROOM : A

13:30 GMT+8 Apache Doris 1.x极速版的新特性和云原生时代的未来规划 中文演讲 杨政国

14:10 GMT+8 Apache Atlas 数据模型的扩展和另一种开源用户界面 英文演讲 Wombacher, Andreas

14:50 GMT+8 Apache Druid云原生架构演进 中文演讲 金嘉怡

15:30 GMT+8 扩展开源大数据云应用是容易/困难的 英文演讲 Paul Brebner

16:10 GMT+8 使用Apache Ranger对云存储进行细粒度授权 英文演讲 Mukund

16:50 GMT+8 货拉拉大数据基础架构体系演进 中文演讲 张伟伟

2022-07-30

ROOM : A

13:30 GMT+8 捕获作业的每个线程统计信息——线程级IOStatistics——HADOOP-17461 英文演讲 Mehakmeet Singh

14:10 GMT+8 Apache Ozone 的最近进展和实践分享 中文演讲 刘岩, 陈怡

14:50 GMT+8 字节跳动基于 Apache Hudi 的数据湖表优化管理服务 中文演讲 喻兆靖

15:30 GMT+8 如何使用 Apache Seatunnel 简化数据同步 中文演讲 陶克路

16:10 GMT+8 Hadoop矢量IO:你的数据变快了! 英文演讲 Mukund Thakur

16:50 GMT+8 Apache Hive 4.0 的新特性 中文演讲 刘岩

2022-07-31

ROOM : A

13:30 GMT+8 Apache Ozone的灾难恢复 英文演讲 Sadanand Shenoy,Rakesh Radhakrishnan

14:10 GMT+8 更易用、更强劲的大数据分析平台 -- Kylin 5.0 社区路线一览 中文演讲 俞霄翔

14:50 GMT+8 Flink Table Store:流式数仓架构与场景 中文演讲 李劲松

15:30 GMT+8 开源大数据Studio: Dolphinscheduler + Notebook 中文演讲 高楚枫

16:10 GMT+8 虎牙基于图数据的应用元数据平台实践 中文演讲 邹磊

16:50 GMT+8 规模故事:分析在1000 QPS以上 英文演讲 Merlino Gian

17:30 GMT+8 Flink 实时写入Apache Doris 的优化实现与未来规划 中文演讲 杨勇强

2022-07-29

ROOM : B

13:30 GMT+8 使用Apache Kafka、Apache Pinot和Streamlit构建实时分析仪表板 英文演讲 Dunith Dhanushka, Karin Wolok

14:10 GMT+8 Apache Ozone:高效地处理文件和对象的多协议感知系统 英文演讲 Rakesh Radhakrishnan, Mukul Kumar Singh

14:50 GMT+8 eBay基于Apache Kyuubi(Incubating) 构建Unified & ServerLess Spark网关实践 中文演讲 王斐

15:30 GMT+8 Apache InLong在腾讯云中的优化与实践 中文演讲 Yunqing Mo

16:10 GMT+8 基于 Zeppelin 的 Flink/Spark 云原生实践 中文演讲 陶克路,王正

16:50 GMT+8 基于血缘的离线数仓数据发现方法 中文演讲 韩帅,孙科

2022-07-30

ROOM : B

13:30 GMT+8 模拟和人工智能行业背后的Apache Ozone 英文演讲 Kota Uenishi

14:10 GMT+8 What's new in Apache Impala 4.x 中文演讲 Quanlong Huang(黄权隆)

14:50 GMT+8 HBase在美团的改进和实践 中文演讲 哈晓琳

15:30 GMT+8 Support Customized Kubernetes Schedulers: 为Spark on Kubernetes提供更完善的调度能力 中文演讲 姜逸坤,王雷博

16:10 GMT+8 Cloud Shuffle Service 在字节跳动 Spark 场景的应用实践 中文演讲 魏中佳

16:50 GMT+8 在Kubernetes集群上使用Livy会话执行交互式数据工程工作负载 英文演讲 Anmol Chaturvedi, Haripriya Bendapudi, Praneet Sharma

2022-07-31

ROOM : B

13:30 GMT+8 升级Mpack的BIGTOP 3.0:大数据分发的新时代 英文演讲 Yuqi Gu(顾煜祺)

14:10 GMT+8 大规模迁移到Uber的Parquet 英文演讲 Huicheng Song

14:50 GMT+8 Spark在小米的应用实践 中文演讲 王准

15:30 GMT+8 Linkis 如何为多样化的大数据引擎提供计算治理能力 中文演讲 邸帅

16:10 GMT+8 基于 Apache Calcite 的多引擎虚拟列技术 中文演讲 谢佳君

16:50 GMT+8 大数据Python生态在传智教育的实践和思考 中文演讲 张敬存,赵晨杰