当前位置:首页 > 前端设计 > 正文

hadoop安装实验报告,Hadoop搭建环境的原理

hadoop安装实验报告,Hadoop搭建环境的原理

大家好,今天小编来为大家解答hadoop安装实验报告这个问题,Hadoop搭建环境的原理很多人还不知道,现在让我们一起来看看吧!学习大数据Hadoop需要哪些基础Had...

大家好,今天小编来为大家解答hadoop安装实验报告这个问题,Hadoop搭建环境的原理很多人还不知道,现在让我们一起来看看吧!

学习大数据Hadoop需要哪些基础

Hadoop是目前被广泛使用的大数据平台,Hadoop平台主要有HadoopCommon、HDFS、HadoopYarn、HadoopMapReduce和HadoopOzone。

Hadoop平台目前被行业使用多年,有健全的生态和大量的应用案例,同时Hadoop对硬件的要求比较低,非常适合初学者自学。目前很多商用大数据平台也是基于Hadoop构建的,所以Hadoop是大数据开发的一个重要内容。

学习Hadoop开发需要有三个基础知识,下面进行分别介绍:

第一:Linux操作系统知识。通常情况下,Hadoop平台是构建在Linux系统之上的,所以学习Hadoop首先要学习Linux操作系统的使用。目前比较流行的Linux操作系统包括CentOS和Ubuntu,这两个Linux系列操作系统有广泛的应用场景。学习Linux并不复杂,通常情况下可以在虚拟机上完成,很多初学者都是在虚拟机上搭建一个伪分布式集群,然后完成Hadoop实验。

第二:编程语言。目前在Hadoop平台下多采用Java和Python来完成程序的编写,由于Hadoop本身是采用Java语言编写的,所以在Hadoop平台下采用Java语言是比较方便的选择,Hadoop的官方demo往往也是采用Java语言实现的。Python语言由于比较简单,同时Python有丰富的库可以使用,所以目前使用Python完成Hadoop平台的开发也是一个比较常见的选择。另外,在Spark平台下Scala也有广泛的应用。

第三:算法。大数据的核心就是数据价值化的过程,而算法设计则是数据价值化的基础。因此,大数据平台的开发离不开算法,要想学习Hadoop开发一定要有一个扎实的算法基础。

Hadoop平台自身有非常丰富的开发组件,所以学习Hadoop的过程还是比较漫长的,由于大数据开发有较强的场景特征,所以建议结合具体的场景来完成Hadoop平台的学习。

大数据是我的主要研究方向之一,目前我也在带大数据方向的研究生,我会陆续在头条写一些关于大数据方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。

如果有大数据方面的问题,也可以咨询我。

谢谢!

怎么在windows上搭建hadoop环境

在Eclipse的Windows->Preferences中,选择HadoopMap/Reduce,设置好Hadoop的安装目录,这里,我直接从linux的/home/hadoop/hadoop-1.0.3拷贝过来的,点击OK按钮!

Hadoop如何快速入门

简单来说下,我对hadoop的理解。

狭义上说:

Hadoop1.x版本是hdfs+mapReduce

Hadoop2.x版本是hdfs+yarn+mapReduce

广义上说:

haddop是一个生态。

建议从1.x到2.x,先看架构,了解1.x的架构以及缺点不足,2.x是如何改进的。现在推出的3.x又有什么改进呢?

生态圈,都有什么?每个模块是做什么的?工作中会有什么应用场景?

以上是学习思路,仅供参考,欢迎与我在线交流

如何在windows下安装hadoop

先说一下要准备哪些软件和信息:

VMware-workstation;

CentOS-6.0-i386-bin-DVD;

eclipse-jee-luna-SR1-win32;

hadoop-0.20.2;

jdk-6u27-linux-i586;

(由于hadoop对版本的要求较高,大家还是不要轻易更换版本,这里列出来的各种软件都是稳定发布版,网上很容易可以download到的)。

整个教程分为这样5个部分来说:1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;2)centos下设置ssh服务无密码登录;3)centos下安装jdk,并配置环境变量;4)centos下安装hadoop,并配置文件;5)windows下安装jdk和eclipse,并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要,尤其是第4)步。下面我们就详细说一下每一步该怎么做。

Step0:请大家先在windows下新建一个普通用户,用户名为hadoop,我们所有的软件全在这个下面安装,用户名最好要是hadoop,因为这个要和后面很多username相同,设为hadoop比较好记。

1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;

首先,下载VMware-workstation并安装,这步骤和一般windows下安装软件的过程是一样的,入门小白也会熟练操作,这里就节省点儿空间给后面重要的步骤了~

然后,在Vmware的主页上新建一个虚拟机

一路下一步,直到让你选择系统镜像路径,我们选择centos系统映像,如上图,点击下一步。然后,需要你输入linux的用户名,这个比较重要,最好填写hadoop,因为这个名字在后面要用到好多次!

后面还是一路的“下一步”,直到让你设置虚拟机的内存大小,建议为1024M。如上图。后面就是要选择和虚拟机的网络类型有关的设置了,建议为“使用网络地址转换NAT”,如下图。这一步我当时选择了自动桥接的功能,找了一个晚上的错误。。。时间就这样白花花的没了~~

之后还是一路的“下一步”,几乎都是使用它推荐的设置,我们就可以新建一个centos,等待个几分钟然后就可以进入centos界面了。看到那一抹科技蓝,有没有让你心动了呢~~哈哈哈,你确实走好了第一步!

2)centos下设置ssh服务无密码登录;

在桌面右击,选择openinTerminal,这个就是linux的终端了。希望读者有一些linux操作系统的基础,这样子上手更快一些。不过要是没有的话,也没有关系,我们是面向新手的教程。

2.1.先在linux命令行中输入su,提示密码,输入你自己设置的密码,这样子你后面的操作都具有了linux系统下的最高权限——root权限。

2.2.在设置ssh无密码登录之前,有一个特别重要的要先出好:关闭SELinux。这是因为centos会自动阻止你修改sshservice,我们只有关闭SELinux,重启才能生效。如何做,如下:

修改/etc/selinux/config文件

将SELINUX=enforcing改为SELINUX=disabled

重启机器即可

(note:在linux下修改文件,vi命令后会进入到文件窗口,按i进入insert,修改完毕之后再按esc推出insert,输入;:wq!保存并退出~这里要感谢泡哥,改了半天都不行,还是泡哥指点迷津了~~)

2.3.在linux命令行里输入:ssh-keygen-trsa,然后一路回车。

root@hadoopName-desktop:~$ssh-keygen-trsa

Generatingpublic/privatersakeypair.

Enterfileinwhichtosavethekey(/home/zhangtao/.ssh/id_rsa)://密钥保存位置,直接回车保持默认;

Createddirectory'/home/zhangtao/.ssh'.

Enterpassphrase(emptyfornopassphrase)://设置密钥的密码,空密码直接回车即可;

Entersamepassphraseagain://确认上一步设置的密码。

然后进入/root/.ssh/下面,会看到两个文件id_rsa.pub,id_rsa,

然后执行cpid_rsa.pubauthorized_keys

然后sshlocalhost验证是否成功,第一次要你输入yes,以后就不需要了。

如下图,由于我又验证了一次,所以还需要输入y,如果你是第一次验证是不要的。

至此,ssh服务无密码登录设置完毕!

3)centos下安装jdk,并配置环境变量;

这一步中可以分为两步:安装jdk、配置jdk环境变量。

3.1.第一步:root用户登陆,使用命令mkdir/usr/program新建目录/usr/program,下载JDK安装包jdk-6u13-linux-i586.bin,将其复制到目录/usr/program下,用cd命令进入该目录,执行命令“./jdk-6u13-linux-i586.bin”,命令运行完毕即安装完成,将在目录下生成文件夹/jdk1.6.0_13,此即为jdk被成功安装到目录:/usr/program/jdk1.6.0_13下。

3.2.root用户登陆,命令行中执行命令“vi/etc/profile”,并加入以下内容,配置环境变量(注意/etc/profile这个文件很重要,后面Hadoop的配置还会用到)。

#setjavaenvironment

exportJAVA_HOME=/usr/program/jdk1.6.0_27

exportJRE_HOME=/usr/program/jdk1.6.0_27/jre

exportCLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

在vi编辑器增加以上内容后保存退出,并执行以下命令使配置生效!

#chmod+x/etc/profile;增加执行权限

#source/etc/profile;使配置生效!

配置完毕后,在命令行中输入:java-version,就会出现安装jdk的信息。

这时,jdk的安装和配置环境变量就成功了~

在linux系统上怎么搭建hadoop开发环境

A、基础环境

1.jdk安装与配置

2.host

3.ssh

4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop,这是搭建集群的大题路径,详细的可以去看一下八斗学院的视频,第一部分是讲集群搭建的很详细

单机上跑多个虚拟机搭建hadoop集群可以提高计算能力吗

首先,跑虚拟机就要损耗性能,和资源。

然后,hadoop平台本身调度再损失一些。

最后,才是你的程序能使用的部分。

所以,还不如单机性能好。

如果,单机想尽可能使用多核优势,请使用openmp编程。

如果,你只是想体验一下mapreduce编程模型,那么推荐你几个轻量级的库。

文章分享结束,hadoop安装实验报告和Hadoop搭建环境的原理的答案你都知道了吗?欢迎再次光临本站哦!

最新文章