在本文中,我们将分享在为事务性数据构建高度可伸缩的多租户分析服务时所吸取的教训。我们将从大局和业务需求开始。然后描述具有用于数据准备、发布和查询引擎的批处理和交互式模块的体系结构,并注意相关的Spark技术。然后我们将深入Prism查询引擎的内部,重点介绍所使用的Spark SQL、DataFrames和Catalyst编译器特性。我们将描述在编译和执行复杂管道和查询时遇到的问题,以及如何使用缓存、采样和查询编译技术来支持交互式用户体验。 资源分享https://www.slidestalk.com/s/Lightning_Fast_Analyticsfor_Workday_Transactional_Data_
本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728