当前位置:天才代写 > tutorial > 大数据教程 > 关于Storm、Spark和MapReduce 开源分布式计算系统框架的比较

关于Storm、Spark和MapReduce 开源分布式计算系统框架的比较

2018-05-18 08:00 星期五 所属: 大数据教程 浏览:381

关于Storm、Spark和MapReduce 开源分布式计算系统框架的比较
恍惚恍惚又来到了文章的学习,想必大家又有很多问题吧!

oracle数据库教程比较项StormSpark Streaming 分布式计算在许多领域都有广泛需求,目前流行的分布式计算框架主要有Hadoop MapReduce, Spark Streaming, Storm; 这三个框架各有优势,现在都属于 Apache基金会下的**项目,下文将对三个框架的特点与适用场景进行分析,以便开发者能快速选择适合自己的框架进行开发。
Hadoop MapReduce 是三者中出现最早,知名度最大的分布式计算框架,最早由 Google Lab 开发,使用者遍布全球(Hadoop PoweredBy);主要适用于大批量的集群任务,由于是批量执行,故时效性偏低,原生支持Java 语言开发 MapReduce ,其它语言需要使用到 Hadoop Streaming 来开发。Spark Streaming 保留了 Hadoop MapReduce 的优点,而且在时效性上有了很大提高,中间结果可以保存在内存中,从而对需要迭代计算和有较高时效性要求的系统提供了很好的支持,多用于能容忍小延时的推荐与计算系统。Storm 一开始就是为实时处理设计,因此在实时分析/性能监测等需要高时效性的领域广泛采用,而且它理论上支持所有语言,只需要少量代码即可完成适配器。

云数据库(Relational Database Service,简称RDS)是一种稳定可靠、可弹性伸缩的在线数据库服务。基于飞天分布式系统和高性能存储,RDS支持MySQL、SQL Server、PostgreSQL和PPAS(高度兼容Oracle)引擎,并且提供了容灾、备份、恢复、监控、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼!

Oracle培训下面的表格是对三者部分特性的比较,描述时间为 2015-5-3,三个项目均处于快速迭代中,文中描述特性会随时产生变化,如果与官方文档产生出入以官方文档为准。
关于Storm、Spark和MapReduce 开源分布式计算系统框架的比较
oracle教程表格说明:
开源时间以 github 上最早的 commit 或者官网上最早发布版本的时间为准。
当前版本与特性描述截止 2015-5-3。
相关资料量通过比较官方文档、搜索引擎、论坛等途径得出。
部分比较数据来源于实践或相关文章(未找到出处)。
oracle教程本文会保持更新,如果数据发现有出入,欢迎指正。

更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!!

 

    关键字:

天才代写-代写联系方式