基于SparkSQL的海量数据仓库设计与实践

2017-05-13 17:10-18:00
嘉宾:

李振炜

奇虎360高级工程师
免费
收藏 5139 人浏览 扫一扫
分享
视频介绍
资料下载

嘉宾介绍

主题介绍

SparkSQL近年来以更强的性能优势正逐渐取代Hive在数据仓库领域强势地位,在奇虎360公司同样得到了大范围的推广使用。为了进一步提供提升SparkSQL的性能、扩展SparkSQL多数据源的处理能力,我们整合了ES、Kylin、Luence等开源组件,最终实现了一套统一的OLAP平台。本次分享会介绍SparkSQL的那些坑和整合ES、Kylin的设计思路以及借助Luence实现的海量数据即席查询的技术方案。

 

未上传任何附件