大数据


出品人 : 张铎, 堵俊平, 代立冬

大数据正在深刻的引领和改变着各个行业,已经与我们的生活密不可分,大数据也是 ASF 的非常重要的组成部分,ASF 有非常多的大数据项目,比如大家熟知的 Hadoop, Hive, Spark, HBase, Kylin, Ozone, CarbonData, Doris, Cassandra等等,在这个主题中,大家会学习到这些技术的前沿趋势和来自一线用户的实践经验、原理、架构分析等精彩内容

2021-08-06

ROOM : A

13:30 GMT+8 扩展Impala--常见错误和最佳实践 英文演讲 Manish Maheshwari

14:10 GMT+8 在Apache Ozone中是如何实现安全的 英文演讲 Bharat Viswanadham, Shashikant Banerjee

14:50 GMT+8 OpenLooKeng启发式指数框架架构分析与应用实践 英文演讲 Zheng Li

15:30 GMT+8 招商银行跨数据源的数据分析 英文演讲 Qiumin Wu

16:10 GMT+8 基于Java的大数据机器学习方案 中文演讲 Qing Lan

16:50 GMT+8 AWS上的Apache HUDI 中文演讲 Lianghong Fei

2021-08-07

ROOM : A

13:30 GMT+8 在Apache druid中分析事务性数据 英文演讲 Vijay Narayanan

14:10 GMT+8 OminiRuntime:一个简洁的大数据运行时框架 英文演讲 Jingfang Zhang

14:50 GMT+8 Apache Ozone:用于分析工作负载的高性能对象库 英文演讲 Rakesh Radhakrishnan, Mukul Kumar Singh

15:30 GMT+8 当Apache Atlas遇到Apache Flink 英文演讲 Josh Yeh, Yan Liu

16:10 GMT+8 Apache Liminal(孵化中)--研究机器学习管道 英文演讲 Aviem Zur, Assaf Pinhasi

16:50 GMT+8 Bigtop 3.0: 重塑社区驱动的Hadoop发布版 英文演讲 Kengo Seki, Masatake Iwasaki

2021-08-08

ROOM : A

13:30 GMT+8 安全的Apache Hadoop集群的技术诀窍 英文演讲 Akira Ajisaka, Kei KORI

14:10 GMT+8 腾讯云Hadoop-COS上的数据湖加速器 英文演讲 Li Cheng

14:50 GMT+8 Apache Kylin 4.0 : 架构升级与全新的调优之路 中文演讲 张智超

15:30 GMT+8 Uber Data Infra的大数据格式 英文演讲 Xinli Shang, Pavi Subenderan, Jianchun Xu

16:10 GMT+8 Milvus:用于非结构化数据处理的矢量数据库 英文演讲 栾小凡

16:50 GMT+8 基于Apache Arrow的Python数据处理的数据框架 英文演讲 Supun Kamburugamuve

2021-08-06

ROOM : B

13:30 GMT+8 星展银行[新加坡发展银行]的数据平台如何利用Apache CarbonData推动实时洞察和分析 英文演讲 Ravindra Pesala, Kumar Vishal

14:10 GMT+8 构建分布式容错可扩展的分析栈的挑战 英文演讲 Nishant Bangarwa

14:50 GMT+8 Kyuubi: 网易对 Serverless Spark 场景的探索与实践应用 中文演讲 Kent Yao (姚琴)

15:30 GMT+8 Apache Druid的存储和查询引擎内幕 英文演讲 Gian Merlino

16:10 GMT+8 通过使用Apache CarbonData的索引加快大数据分析的速度 英文演讲 Akash R Nilugal, Kunal Kapoor

16:50 GMT+8 洞悉开源社区的秘密--数据驱动的社区运营的最佳实践 中文演讲 Jun Zhong, Yikun Jiang, Lei Peng

2021-08-07

ROOM : B

13:30 GMT+8 由Cassandra驱动的工作流程实现了大规模的自动化 英文演讲 Maciej Swiderski

14:10 GMT+8 基于 Apache Impala & Kudu 打造的实时用户行为分析系统 中文演讲 Qianqiong Zhang

14:50 GMT+8 Apache Ozone如何通过Raft协议建立起高可用性 英文演讲 Li Cheng, Shashikant Banerjee, Nanda Kumar

15:30 GMT+8 在LinkedIn和Uber使用Apache Pinot进行大规模的实时分析 英文演讲 Siddharth Teotia, Yupeng Fu

16:10 GMT+8 Doris的过去、现在和未来 中文演讲 Mingyu Chen(陈明雨)

16:50 GMT+8 Apache InLong,一个一站式流数据集成解决方案 中文演讲 gosonzhang, leobiaoliu

2021-08-08

ROOM : B

13:30 GMT+8 使用HashiCorp Vault建立一个认证和授权系统 中文演讲 guangning

14:10 GMT+8 使用Apache C *,Spark和Pulsar实现大数据之Lambda架构 中文演讲 孟亚斌

14:50 GMT+8 Apache YuniKorn(孵化中)最新进展--用于大数据的云原生调度器的现状 英文演讲 Sunil Govindan, Julia Kinga Marton

15:30 GMT+8 在Apache Nemo上对数据处理进行灵活优化和高效执行 英文演讲 Won Wook SONG

16:10 GMT+8 变化-数据-捕捉的用例:设计一个常青的缓存 英文演讲 Nicolas Fränkel

16:50 GMT+8 新的Apache Bigtop 1.5和Wikimedia: 在现实世界中为BigData赋能 英文演讲 Yuqi Gu, Luca Toscano