`

五个最给力的Hadoop项目

阅读更多

 

  • 1.CascadingCascading是基于Hadoop集群之上的数据处理API。它通过实现了丰富的功能化API,使你不需要接触MapReduce任务就能使用分布式计算能力,其核心概念是基于管道和流的数据处理。
  • 2.MahoutMahout是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被用来提供推荐服务。
  • 3.HiveHive由Facebook出品,它为Hadoop提供了一种类似于SQL的操作接口。
  • 4.AvroAvro是一个基于二进制数据传输高性能的中间件。Avro通过将数据进行序列化,以使得大批量数据交互过程更方便。
  • 5.StormStorm由BackType Technology出口,其口号是“实时的Hadoop系统”。


  • 原文链接:The top five most powerful Hadoop projects
分享到:
评论

相关推荐

    hadoop几个实例

    网上很难找的hadoop代码,很适合初学或想从事大数据方向的程序猿,心动者赶紧下载。

    HADOOP 相关项目简介

    Hadoop 相关项目简介,hadoop生态体系涉及到的组件的大概介绍

    Hadoop权威指南 中文版

    项目负责人tomwhite透过本书详细阐述了如何使用hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装和运行hadoop集群。  本书结合丰富的案例来展示如何用hadoop...

    【Hadoop项目】全国各省市酒店数据的分析与处理

    【Hadoop项目】全国各省市酒店数据的分析与处理

    Hadoop项目案例:电影网站用户性别预测源代码

    这个是课本上的项目,很早以前做的,数据文件(没放在代码里)得自己下载,你们得在自己电脑上做修改才能不报错,至于怎么修改,我也不知道。或许是改ip地址,版本信息,数据库配置之类的......这个主要是一个参考...

    基于Hadoop的JAVA简易网盘项目源码+数据库.zip

    基于Hadoop的JAVA简易网盘项目源码+数据库.zip基于java的简易网盘项目 hdfs为 192.168.31.10:8020/Mycould 采用mysql本地 panuser 基于Hadoop的JAVA简易网盘项目源码+数据库.zip基于java的简易网盘项目 hdfs为 192....

    【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境(复杂版的WordCount)

    【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境(复杂版的WordCount)前言环境清单创建SpringBoot项目创建包创建yml添加集群主机名映射hadoop配置文件环境变量HADOOP_HOME编写代码添加hadoop依赖jar包...

    Hadoop项目实战.ppt

    Hadoop项目实战

    Eclipse开发Hadoop相关项目本地配置插件

    Eclipse开发Hadoop相关项目本地配置插件,本地Eclipse相关配置插件和本地电脑部署Hadoop的相关插件

    基于hadoop对某网站日志分析部署实践课程设计报告参考模板.doc

    至此,我们通过Python网络爬虫手段进行数据抓取,将我们网站数据(2013-05-30,2013-05-31)保存为两个日志文件,由于文件大小超出我们一般的分析工具处理的范围,故借助Hadoop来完成本次的实践。 2. 总体设计 2.1 ...

    hadoop2.7.3 hadoop.dll

    在windows环境下开发hadoop时,需要配置HADOOP_HOME环境变量,变量值D:\hadoop-common-2.7.3-bin-master,并在Path追加%HADOOP_HOME%\bin,有可能出现如下错误: org.apache.hadoop.io.nativeio.NativeIO$Windows....

    《Hadoop系统搭建及项目实践》课程标准.pdf

    《Hadoop系统搭建及项目实践》课程标准.pdf《Hadoop系统搭建及项目实践》课程标准.pdf《Hadoop系统搭建及项目实践》课程标准.pdf《Hadoop系统搭建及项目实践》课程标准.pdf《Hadoop系统搭建及项目实践》课程标准.pdf...

    基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip

    基于Hadoop Hive健身馆可视化分析平台项目源码+数据库文件.zip启动方式 环境启动 hadoop hive2元数据库 sql导入 导入hivesql脚本,修改application.yml 启动主程序 HadoopApplication 基于Hadoop Hive健身馆可视化...

    hadoop-3.3.4 版本(最新版)

    Apache Hadoop (hadoop-3.3.4.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。官网下载速度非常缓慢,因此将hadoop-3.3.4 版本放在这里,欢迎大家来下载使用! Hadoop 架构是一个开源的、基于 Java 的编程...

    《Hadoop系统搭建及项目实践》课件05Hadoop IO操作.pdf

    《Hadoop系统搭建及项目实践》课件05Hadoop IO操作.pdf《Hadoop系统搭建及项目实践》课件05Hadoop IO操作.pdf《Hadoop系统搭建及项目实践》课件05Hadoop IO操作.pdf《Hadoop系统搭建及项目实践》课件05Hadoop IO操作...

    Hadoop下载 hadoop-3.3.3.tar.gz

    摘要 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。...Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算 软件特点 Hadoop是一个

    Hadoop简单应用案例

    Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等

    Hadoop实战大数据大作业

    一个基于Hadoop平台进行的单词统计系统,其中包含了伪分布架构,并且包含HDFS数据存储,结合Java后台利用Mapreduce架包进行单词的统计与分析。包含了完整的实践过程,内涵源代码,以及实验命令,内容丰富,实验过程...

    Hadoop大数据开发案例教程与项目实战

    Hadoop大数据开发案例教程与项目实战

    Hadoop下载 hadoop-2.9.2.tar.gz

    后来,Hadoop 被贡献给了 Apache 基金会,成为 Apache 基金会的开源项目。 Hadoop 是一种分析和处理大数据的软件平台,是一个用 Java 语言实现的 Apache 的开源软件框架,在大量计算机组成的集群中实现了对海量数据...

Global site tag (gtag.js) - Google Analytics