在大数据时代,数据的价值不言而喻,谁能利用好数据,谁就掌握了整个行业的先机。面对海量的数据,如何处理数据成为了一个难题。除了海量数据外,实时性也是一个重要的课题,所以流式数据处理便登上了技术舞台,而Flink框架便是其中最耀眼的明星。
Flink最初是由德国柏林技术大学的一个研究小组开发的,最初被称为Stratosphere。在2014年,Stratosphere成为Apache的顶级项目,并更名为Flink。自此以后,Flink得到了快速的发展,逐渐成为了一个成熟的开源项目。目前,Flink已经成为了Apache软件基金会中最活跃的项目之一。
Flink是一个开源的分布式数据处理框架,它提供实时数据流和批处理数据,真正意义上实现了批流统一。Flink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确 的流处理应用程序打造的开源流处理框架”。
Flink一词表示快速和灵巧的意思,项目采用一只松鼠的彩色图案作为 logo,这也正式体现出flink框架的独特优势。
2016年3月,Flink发布了第一个稳定版本1.0开始,已经经过多次版本的迭代,目前有上万名社区成员,不断发布新的特性。众多互联网企业已经将Flink作为实时处理技术框架来支撑其业务发展,Flink的生态环境不断丰富,未来有可能成为下一代大数据处理的标准,具有非常强大的潜力。