hadoop安装教程 hadoop简单应用实例
- 开发语言
- 2023-08-13
- 399
很多朋友对于hadoop安装教程和hadoop简单应用实例不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!阿里云自己搭建hadoop,hbase...
很多朋友对于hadoop安装教程和hadoop简单应用实例不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!
阿里云自己搭建hadoop,hbase合适吗
自己搭建完全可以,日常使用肯定没有任何问题,但是如果要做到企业级,而且还追求效率那么使用现成的完全可以,虽然价格稍高,但是阿里云内部的优化做的确实挺好的,由于本人是个程序员,对于新手程序与来讲,还是自己搭建比较容易上手,阿里云的产品自己也有用过好几款,感觉世界使用成品的话,阿里云官方的文档暂时还不是很充足
hadoop三种搭建方式
Hadoop的安装部署的模式一共有三种,本地模式,伪分布模式,全分布模式
1、独立模式(本地模式)standalone
默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。由于在本机模式下测试和调试MapReduce程序较为方便,因此,这种模式适宜用在开发阶段。使用本地文件系统,而不是分布式文件系统。
2、伪分布模式pseudodistributed
在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。
在这种模式下,Hadoop使用的是分布式文件系统,各个作业也是由JobTraker服务,来管理的独立进程。
3,完全分布模式fulldistributed,Hadoop
完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境。
如何在Windows中使用Intellij idea搭建远程Hadoop开发环境
过分依赖java会让你思维行程定式,有时候寻求简单办法莫不如一种捷径,可有的时候总是难以突破自身的变量。什么开发开发都是借口,你想真正做点什么很难有质的8提升,单这也是个办法。
如何在windows下安装hadoop
先说一下要准备哪些软件和信息:
VMware-workstation;
CentOS-6.0-i386-bin-DVD;
eclipse-jee-luna-SR1-win32;
hadoop-0.20.2;
jdk-6u27-linux-i586;
(由于hadoop对版本的要求较高,大家还是不要轻易更换版本,这里列出来的各种软件都是稳定发布版,网上很容易可以download到的)。
整个教程分为这样5个部分来说:1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;2)centos下设置ssh服务无密码登录;3)centos下安装jdk,并配置环境变量;4)centos下安装hadoop,并配置文件;5)windows下安装jdk和eclipse,并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要,尤其是第4)步。下面我们就详细说一下每一步该怎么做。
Step0:请大家先在windows下新建一个普通用户,用户名为hadoop,我们所有的软件全在这个下面安装,用户名最好要是hadoop,因为这个要和后面很多username相同,设为hadoop比较好记。
1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;
首先,下载VMware-workstation并安装,这步骤和一般windows下安装软件的过程是一样的,入门小白也会熟练操作,这里就节省点儿空间给后面重要的步骤了~
然后,在Vmware的主页上新建一个虚拟机
一路下一步,直到让你选择系统镜像路径,我们选择centos系统映像,如上图,点击下一步。然后,需要你输入linux的用户名,这个比较重要,最好填写hadoop,因为这个名字在后面要用到好多次!
后面还是一路的“下一步”,直到让你设置虚拟机的内存大小,建议为1024M。如上图。后面就是要选择和虚拟机的网络类型有关的设置了,建议为“使用网络地址转换NAT”,如下图。这一步我当时选择了自动桥接的功能,找了一个晚上的错误。。。时间就这样白花花的没了~~
之后还是一路的“下一步”,几乎都是使用它推荐的设置,我们就可以新建一个centos,等待个几分钟然后就可以进入centos界面了。看到那一抹科技蓝,有没有让你心动了呢~~哈哈哈,你确实走好了第一步!
2)centos下设置ssh服务无密码登录;
在桌面右击,选择openinTerminal,这个就是linux的终端了。希望读者有一些linux操作系统的基础,这样子上手更快一些。不过要是没有的话,也没有关系,我们是面向新手的教程。
2.1.先在linux命令行中输入su,提示密码,输入你自己设置的密码,这样子你后面的操作都具有了linux系统下的最高权限——root权限。
2.2.在设置ssh无密码登录之前,有一个特别重要的要先出好:关闭SELinux。这是因为centos会自动阻止你修改sshservice,我们只有关闭SELinux,重启才能生效。如何做,如下:
修改/etc/selinux/config文件
将SELINUX=enforcing改为SELINUX=disabled
重启机器即可
(note:在linux下修改文件,vi命令后会进入到文件窗口,按i进入insert,修改完毕之后再按esc推出insert,输入;:wq!保存并退出~这里要感谢泡哥,改了半天都不行,还是泡哥指点迷津了~~)
2.3.在linux命令行里输入:ssh-keygen-trsa,然后一路回车。
root@hadoopName-desktop:~$ssh-keygen-trsa
Generatingpublic/privatersakeypair.
Enterfileinwhichtosavethekey(/home/zhangtao/.ssh/id_rsa)://密钥保存位置,直接回车保持默认;
Createddirectory'/home/zhangtao/.ssh'.
Enterpassphrase(emptyfornopassphrase)://设置密钥的密码,空密码直接回车即可;
Entersamepassphraseagain://确认上一步设置的密码。
然后进入/root/.ssh/下面,会看到两个文件id_rsa.pub,id_rsa,
然后执行cpid_rsa.pubauthorized_keys
然后sshlocalhost验证是否成功,第一次要你输入yes,以后就不需要了。
如下图,由于我又验证了一次,所以还需要输入y,如果你是第一次验证是不要的。
至此,ssh服务无密码登录设置完毕!
3)centos下安装jdk,并配置环境变量;
这一步中可以分为两步:安装jdk、配置jdk环境变量。
3.1.第一步:root用户登陆,使用命令mkdir/usr/program新建目录/usr/program,下载JDK安装包jdk-6u13-linux-i586.bin,将其复制到目录/usr/program下,用cd命令进入该目录,执行命令“./jdk-6u13-linux-i586.bin”,命令运行完毕即安装完成,将在目录下生成文件夹/jdk1.6.0_13,此即为jdk被成功安装到目录:/usr/program/jdk1.6.0_13下。
3.2.root用户登陆,命令行中执行命令“vi/etc/profile”,并加入以下内容,配置环境变量(注意/etc/profile这个文件很重要,后面Hadoop的配置还会用到)。
#setjavaenvironment
exportJAVA_HOME=/usr/program/jdk1.6.0_27
exportJRE_HOME=/usr/program/jdk1.6.0_27/jre
exportCLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
在vi编辑器增加以上内容后保存退出,并执行以下命令使配置生效!
#chmod+x/etc/profile;增加执行权限
#source/etc/profile;使配置生效!
配置完毕后,在命令行中输入:java-version,就会出现安装jdk的信息。
这时,jdk的安装和配置环境变量就成功了~
怎么在windows上搭建hadoop环境
在Eclipse的Windows->Preferences中,选择HadoopMap/Reduce,设置好Hadoop的安装目录,这里,我直接从linux的/home/hadoop/hadoop-1.0.3拷贝过来的,点击OK按钮!
hadoop安装教程的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于hadoop简单应用实例、hadoop安装教程的信息别忘了在本站进行查找哦。
本文链接:http://www.xinin56.com/kaifa/1092.html