扩展Impala--常见错误和最佳实践

Manish Maheshwari

英文演讲 2021-08-06 13:30 GMT+8  (ROOM : A) #bigdata

Apache Impala是一个复杂的引擎,需要全面的技术理解才能充分使用它。如果没有正确的配置或使用,Impala的性能会变得不可预测,最终用户的体验也会受到影响。

对于许多用户/管理员来说,Impala的正确配置仍然是一个谜。在我们与世界上一些最大的集群合作的过程中,我们发现了一系列配置和使用方面的常见错误,导致了很多失败的案例。

在本讲座中,我们将讨论保持Impala部署可扩展性的摄取最佳实践,以及为终端用户提供一致体验的准入控制配置。我们还将对Impala的查询配置文件进行高层次的研究,它被用作任何性能故障排除的第一站。此外,我们将讨论用户和BI工具在与Impala互动时常犯的错误。最后,我们将讨论一个理想的配置,以将上述的内容都呈现在实践中。

讲师:

Manish Maheshwari:我有15年以上建立超大型数据仓库和分析解决方案的经验。他在Apache Hadoop、DI和BI工具、数据挖掘和预测、数据建模、主数据和元数据管理以及仪表盘工具方面有广泛的工作。他精通Hadoop、SAS、R、Informatica、Teradata和Qlikview。