什么是Spark Streaming?特点是什么?
作者:广州电脑培训甘发布时间:2020-10-17分类:电脑培训网-热点问答浏览:776
Spark Streaming是构建在Spark上的实时计算框架,且是对Spark Core API的一个扩展,它能够实现对流数据进行实时处理,并具有很好的可扩展性、高吞吐量和容错性。Spark Streaming具有如下显著特点。
(1)易用性:Spark Streaming支持Java、Python、Scala等编程语言,可以像编写离线程序一样编写实时计算的程序求照的器。
(2)容错性:Spark Streaming在没有额外代码和配置的情况下,可以恢复丢失的数据。对于实时计算来说,容错性至关重要。首先要明确一下Spak中RDD的容错机制,即每一个RDD都是个不可变的分布式可重算的数据集,它记录着确定性的操作继承关系(lineage),所以只要输入数据是可容错的,那么任意一个RDD的分区(Partition)出错或不可用,都可以使用原始输入数据经过转换操作重新计算得到。
(3)易整合性:Spark Streaming可以在Spark上运行,并且还允许重复使用相同的代码进行批处理。也就是说,实时处理可以与离线处理相结合,实现交互式的查询操作。
Spark Streaming工作原理
Spark Streaming支持从多种数据源获取数据,包括 Kafka、Flume、Twitter、LeroMQ、Kinesis以及TCP Sockets数据源。当Spark Streaming从数据源获取数据之后,可以使用如map、 reduce、join和 window等高级函数进行复杂的计算处理,最后将处理的结果存储到分布式文件系统、数据库中,最终利用实时web仪表板进行展示。Spark Streaming支持的输入、输出源。
Spark Streaming先接收实时输入的数据流,并且将数据按照一定的时间间隔分成一批批的数据,每一段数据都转变成Spark中的RDD,接着交由Spark引擎进行处理,最后将处理结果数据输出到外部储存系统。
- 电脑培训网-热点问答排行
-
- 1汕头信息:市人力资源和社会保障局召开工作调度会|||计算机专业维修学校
- 2东莞信息:(万江)广东茂名幼儿师范专科学校到万江人社分局开展校企洽谈活动|||计算机培训学校招生
- 3东莞信息:(万江)万江人社分局组织企业赴东莞技师学院开展校园招聘活动|||计算机培训学校招生
- 4茂名信息:聚焦粤西桂东人才高地筑站引博集聚医学英才|||计算机职业技能培训班
- 5湛江信息:导师“传经”下基层,湛江这群乡村创业人有了新“法宝”|||广州学电脑培训学校
- 6韶关信息:全省社保“镇村通”工作推进会在我市召开推动社保“镇村通”工程落地见效|||电脑计算机编程培训学校
- 7江门信息:关于高温津贴,看看你能领多少?|||计算机培训机构
- 8东莞信息:(塘厦)塘厦镇举办粤港澳创业人才成果展激发创新创业活力|||广州计算机编程培训
- 92024年广州中考录取控制分数线,普高线502分
- 最近发表
- 标签列表
-