0

0

大数据实时处理的王者-Flink

絕刀狂花

絕刀狂花

发布时间:2025-08-02 08:12:13

|

364人浏览过

|

来源于php中文网

原创

近年来,流处理技术日益受到关注。实时数据分析的价值不断提升,许多系统都依赖于连续的事件流进行数据收集和处理,不仅限于互联网领域,还包括车联网、电力系统和穿戴设备等。然而,大多数公司尚未采用流处理技术来解决实时大数据分析问题,原因可能是存储有限数据更为简单,且使用sql等分析方法更为便捷。但实际上,采用流处理方式处理这些数据更为合理,尽管这涉及到数据一致性和时间等复杂问题,甚至触及物理学领域。

大数据实时处理的王者-Flink图flink

不熟悉流处理的朋友可以阅读这两篇文章来了解更多:什么是实时流式计算?https://www.php.cn/link/af7ea05940553f46a0aec14fdaf0d2e7 以及 Streaming-大数据的未来 https://www.php.cn/link/d916d57cb76b24368db917a7f40e0484

幸运的是,我们有Flink。与Storm和Spark Streaming相比,Flink更贴近Google Dataflow的理念(详见文章实时计算大数据处理的基石-Google Dataflow https://www.php.cn/link/ca4f76fc1601927e425f9487890361a6 Streaming的微批处理,同时也支持离线批处理,因为在Flink中,批处理是流处理的一个子集,有限数据处理本质上是无限数据处理的一部分。作为一个高度创新的开源流处理器,Flink具备容错性、高吞吐和低延迟等优势。一个优秀的流处理框架不仅应具备低延迟和高吞吐,还应能实现消息的恰好一次传递,并拥有出色的容错机制。

大数据实时处理的王者-Flink图 google dataflow

Twitter开源的Storm框架曾风靡一时,在Hadoop初期,Storm弥补了Hadoop无法进行实时数据处理的缺陷,广泛应用于各大公司。Storm的延迟达到毫秒级,但难以实现高吞吐,且无法保证消息的恰好一次传递。虽然可以通过ack机制来保证,但这会带来极大的开销,导致许多使用Storm的公司面临消息积压的问题,这几乎是不可避免的。

大数据实时处理的王者-Flink图Storm

In3D
In3D

把真人变成化身,创建逼真且可自定义的虚拟角色

下载

将离线与实时处理分开的Lambda架构使用批处理技术处理全量数据,采用流式计算处理实时增量数据。同时支持流处理和批处理的计算引擎有两种选择:Apache Spark和Apache Flink。从技术和生态系统的综合考虑,Spark的技术理念是基于批处理来模拟流计算,而Flink则相反,采用基于流计算来模拟批计算。

大数据实时处理的王者-Flink图spark

从技术发展方向来看,用批处理模拟流计算存在一定的技术局限性,且这些局限性可能难以突破。而Flink基于流计算模拟批处理,在技术上具有更好的扩展性。

Flink起源于欧洲的一个大数据研究项目StratoSphere,该项目是柏林工业大学的一个研究性项目。早期,Flink主要用于批处理,但在2014年,StratoSphere的核心成员孵化出Flink,并将其捐赠给Apache,成为Apache的顶级大数据项目。Flink的计算主流方向被定位为Streaming,即用流式计算处理所有大数据,这就是Flink技术诞生的背景。

2015年,阿里开始介入Flink,负责资源调度和流式SQL的优化,成立了阿里内部版本Blink。在最近的1.9版本中,Blink开始合并入Flink。未来,Flink将支持Java、Scala、Python等更多语言,并在机器学习领域大展拳脚。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1135

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2235

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1723

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

586

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

441

2024.04.29

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
大数据(MySQL)视频教程完整版
大数据(MySQL)视频教程完整版

共200课时 | 19.4万人学习

PHP会话控制/文件上传/分页技术
PHP会话控制/文件上传/分页技术

共22课时 | 2.2万人学习

马哥初级运维视频教程
马哥初级运维视频教程

共80课时 | 21万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号