SmartNews基于Flink加速Hive日表生产的实践
本文介绍了 SmartNews 利用 Flink 加速 Hive 日表的生产,将 Flink 无缝地集成到以 Airflow 和 Hive 为主的批处理系统的实践。详细介绍我们遇到的技术挑战和应对方案,以供社区分享。 项目背景 SmartNews 在过去 9 年的时间,基于 Airflow, Hive, S3, EMR 等技术栈构建了大量的数据集。随着数据量的增长,这些离线表的处理时间
hive
InfoQ . 2021-08-05 826
- 1