Hadoop

Hadoop-in-Practice第四章MapReduce-Join代码运行问题

hadoop-in-practice-joins

最近在做基于 MapReduce 的 Join 算法,搜到了《Hadoop in Practice》这本书,不得不说老外写的书就是好啊,特别是 PDF 电子版,这代码注释排版,给人的感觉很舒服,而且在 GitHub 上给出了代码: https://github.com/alexholmes/hadoop-book,并且有在更新。相比于前阵子买的一本国人写的技术书,部分代码的缩进都是有问题的,看着都累…

继续阅读

使用Eclipse编译运行MapReduce程序 Hadoop2.6.0_Ubuntu/CentOS

build-mapreduce-using-eclipse

本教程介绍的是如何在 Ubuntu/CentOS 中使用 Eclipse 来开发 MapReduce 程序,在 Hadoop 2.6.0 下验证通过。虽然我们可以使用命令行编译打包运行自己的MapReduce程序,但毕竟编写代码不方便。使用 Eclipse,我们可以直接对 HDFS 中的文件进行操作,可以直接运行代码,省去许多繁琐的命令。本教程由厦门大学数据库实验室出品,转载请注明。

继续阅读

使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0

hadoop-build-project-by-shell

网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的,大多又是 0.20 等旧版本版本的做法,即 javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar WordCount.java,但较新的 2.X 版本中,已经没有 hadoop-core*.jar 这个文件,因此编辑和打包自己的 MapReduce 程序与旧版本有所不同。

本文以 Hadoop 2.6.0 环境下的 WordCount 实例来介绍 2.x 版本中如何编辑自己的 MapReduce 程序。

继续阅读

Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS

63.install-hadoop-cluster

本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否则请先查看Hadoop安装教程_单机/伪分布式配置CentOS安装Hadoop_单机/伪分布式配置

本教程适合于原生 Hadoop 2,包括 Hadoop 2.6.0, Hadoop 2.7.1 等版本,主要参考了官方安装教程,步骤详细,辅以适当说明,保证按照步骤来,都能顺利安装并运行 Hadoop。另外有Hadoop安装配置简略版方便有基础的读者快速完成安装。本教程由给力星出品,转载请注明。

继续阅读

Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

62.install-hadoop

当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛。尽管安装其实很简单,书上有写到,官方网站也有 Hadoop 安装配置教程,但由于对 Linux 环境不熟悉,书上跟官网上简略的安装步骤新手往往 Hold 不住。加上网上不少教程也甚是坑,导致新手折腾老几天愣是没装好,很是打击学习热情。

本教程适合于原生 Hadoop 2,包括 Hadoop 2.6.0, Hadoop 2.7.1 等版本,主要参考了官方安装教程,步骤详细,辅以适当说明,相信按照步骤来,都能顺利安装并运行Hadoop。另外有Hadoop安装配置简略版方便有基础的读者快速完成安装。此外,希望读者们能多去了解一些 Linux 的知识,以后出现问题时才能自行解决。本教程由给力星出品,转载请注明。

继续阅读