hadoop安装实验报告,Hadoop搭建环境的原理
- 前端设计
- 2023-08-13
- 265
大家好,今天小编来为大家解答hadoop安装实验报告这个问题,Hadoop搭建环境的原理很多人还不知道,现在让我们一起来看看吧!学习大数据Hadoop需要哪些基础Had...
大家好,今天小编来为大家解答hadoop安装实验报告这个问题,Hadoop搭建环境的原理很多人还不知道,现在让我们一起来看看吧!
学习大数据Hadoop需要哪些基础
Hadoop是目前被广泛使用的大数据平台,Hadoop平台主要有HadoopCommon、HDFS、HadoopYarn、HadoopMapReduce和HadoopOzone。
Hadoop平台目前被行业使用多年,有健全的生态和大量的应用案例,同时Hadoop对硬件的要求比较低,非常适合初学者自学。目前很多商用大数据平台也是基于Hadoop构建的,所以Hadoop是大数据开发的一个重要内容。
学习Hadoop开发需要有三个基础知识,下面进行分别介绍:
第一:Linux操作系统知识。通常情况下,Hadoop平台是构建在Linux系统之上的,所以学习Hadoop首先要学习Linux操作系统的使用。目前比较流行的Linux操作系统包括CentOS和Ubuntu,这两个Linux系列操作系统有广泛的应用场景。学习Linux并不复杂,通常情况下可以在虚拟机上完成,很多初学者都是在虚拟机上搭建一个伪分布式集群,然后完成Hadoop实验。
第二:编程语言。目前在Hadoop平台下多采用Java和Python来完成程序的编写,由于Hadoop本身是采用Java语言编写的,所以在Hadoop平台下采用Java语言是比较方便的选择,Hadoop的官方demo往往也是采用Java语言实现的。Python语言由于比较简单,同时Python有丰富的库可以使用,所以目前使用Python完成Hadoop平台的开发也是一个比较常见的选择。另外,在Spark平台下Scala也有广泛的应用。
第三:算法。大数据的核心就是数据价值化的过程,而算法设计则是数据价值化的基础。因此,大数据平台的开发离不开算法,要想学习Hadoop开发一定要有一个扎实的算法基础。
Hadoop平台自身有非常丰富的开发组件,所以学习Hadoop的过程还是比较漫长的,由于大数据开发有较强的场景特征,所以建议结合具体的场景来完成Hadoop平台的学习。
大数据是我的主要研究方向之一,目前我也在带大数据方向的研究生,我会陆续在头条写一些关于大数据方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。
如果有大数据方面的问题,也可以咨询我。
谢谢!
怎么在windows上搭建hadoop环境
在Eclipse的Windows->Preferences中,选择HadoopMap/Reduce,设置好Hadoop的安装目录,这里,我直接从linux的/home/hadoop/hadoop-1.0.3拷贝过来的,点击OK按钮!
Hadoop如何快速入门
简单来说下,我对hadoop的理解。
狭义上说:
Hadoop1.x版本是hdfs+mapReduce
Hadoop2.x版本是hdfs+yarn+mapReduce
广义上说:
haddop是一个生态。
建议从1.x到2.x,先看架构,了解1.x的架构以及缺点不足,2.x是如何改进的。现在推出的3.x又有什么改进呢?
生态圈,都有什么?每个模块是做什么的?工作中会有什么应用场景?
以上是学习思路,仅供参考,欢迎与我在线交流
如何在windows下安装hadoop
先说一下要准备哪些软件和信息:
VMware-workstation;
CentOS-6.0-i386-bin-DVD;
eclipse-jee-luna-SR1-win32;
hadoop-0.20.2;
jdk-6u27-linux-i586;
(由于hadoop对版本的要求较高,大家还是不要轻易更换版本,这里列出来的各种软件都是稳定发布版,网上很容易可以download到的)。
整个教程分为这样5个部分来说:1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;2)centos下设置ssh服务无密码登录;3)centos下安装jdk,并配置环境变量;4)centos下安装hadoop,并配置文件;5)windows下安装jdk和eclipse,并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要,尤其是第4)步。下面我们就详细说一下每一步该怎么做。
Step0:请大家先在windows下新建一个普通用户,用户名为hadoop,我们所有的软件全在这个下面安装,用户名最好要是hadoop,因为这个要和后面很多username相同,设为hadoop比较好记。
1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;
首先,下载VMware-workstation并安装,这步骤和一般windows下安装软件的过程是一样的,入门小白也会熟练操作,这里就节省点儿空间给后面重要的步骤了~
然后,在Vmware的主页上新建一个虚拟机
一路下一步,直到让你选择系统镜像路径,我们选择centos系统映像,如上图,点击下一步。然后,需要你输入linux的用户名,这个比较重要,最好填写hadoop,因为这个名字在后面要用到好多次!
后面还是一路的“下一步”,直到让你设置虚拟机的内存大小,建议为1024M。如上图。后面就是要选择和虚拟机的网络类型有关的设置了,建议为“使用网络地址转换NAT”,如下图。这一步我当时选择了自动桥接的功能,找了一个晚上的错误。。。时间就这样白花花的没了~~
之后还是一路的“下一步”,几乎都是使用它推荐的设置,我们就可以新建一个centos,等待个几分钟然后就可以进入centos界面了。看到那一抹科技蓝,有没有让你心动了呢~~哈哈哈,你确实走好了第一步!
2)centos下设置ssh服务无密码登录;
在桌面右击,选择openinTerminal,这个就是linux的终端了。希望读者有一些linux操作系统的基础,这样子上手更快一些。不过要是没有的话,也没有关系,我们是面向新手的教程。
2.1.先在linux命令行中输入su,提示密码,输入你自己设置的密码,这样子你后面的操作都具有了linux系统下的最高权限——root权限。
2.2.在设置ssh无密码登录之前,有一个特别重要的要先出好:关闭SELinux。这是因为centos会自动阻止你修改sshservice,我们只有关闭SELinux,重启才能生效。如何做,如下:
修改/etc/selinux/config文件
将SELINUX=enforcing改为SELINUX=disabled
重启机器即可
(note:在linux下修改文件,vi命令后会进入到文件窗口,按i进入insert,修改完毕之后再按esc推出insert,输入;:wq!保存并退出~这里要感谢泡哥,改了半天都不行,还是泡哥指点迷津了~~)
2.3.在linux命令行里输入:ssh-keygen-trsa,然后一路回车。
root@hadoopName-desktop:~$ssh-keygen-trsa
Generatingpublic/privatersakeypair.
Enterfileinwhichtosavethekey(/home/zhangtao/.ssh/id_rsa)://密钥保存位置,直接回车保持默认;
Createddirectory'/home/zhangtao/.ssh'.
Enterpassphrase(emptyfornopassphrase)://设置密钥的密码,空密码直接回车即可;
Entersamepassphraseagain://确认上一步设置的密码。
然后进入/root/.ssh/下面,会看到两个文件id_rsa.pub,id_rsa,
然后执行cpid_rsa.pubauthorized_keys
然后sshlocalhost验证是否成功,第一次要你输入yes,以后就不需要了。
如下图,由于我又验证了一次,所以还需要输入y,如果你是第一次验证是不要的。
至此,ssh服务无密码登录设置完毕!
3)centos下安装jdk,并配置环境变量;
这一步中可以分为两步:安装jdk、配置jdk环境变量。
3.1.第一步:root用户登陆,使用命令mkdir/usr/program新建目录/usr/program,下载JDK安装包jdk-6u13-linux-i586.bin,将其复制到目录/usr/program下,用cd命令进入该目录,执行命令“./jdk-6u13-linux-i586.bin”,命令运行完毕即安装完成,将在目录下生成文件夹/jdk1.6.0_13,此即为jdk被成功安装到目录:/usr/program/jdk1.6.0_13下。
3.2.root用户登陆,命令行中执行命令“vi/etc/profile”,并加入以下内容,配置环境变量(注意/etc/profile这个文件很重要,后面Hadoop的配置还会用到)。
#setjavaenvironment
exportJAVA_HOME=/usr/program/jdk1.6.0_27
exportJRE_HOME=/usr/program/jdk1.6.0_27/jre
exportCLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
在vi编辑器增加以上内容后保存退出,并执行以下命令使配置生效!
#chmod+x/etc/profile;增加执行权限
#source/etc/profile;使配置生效!
配置完毕后,在命令行中输入:java-version,就会出现安装jdk的信息。
这时,jdk的安装和配置环境变量就成功了~
在linux系统上怎么搭建hadoop开发环境
A、基础环境
1.jdk安装与配置
2.host
3.ssh
4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop,这是搭建集群的大题路径,详细的可以去看一下八斗学院的视频,第一部分是讲集群搭建的很详细
单机上跑多个虚拟机搭建hadoop集群可以提高计算能力吗
首先,跑虚拟机就要损耗性能,和资源。
然后,hadoop平台本身调度再损失一些。
最后,才是你的程序能使用的部分。
所以,还不如单机性能好。
如果,单机想尽可能使用多核优势,请使用openmp编程。
如果,你只是想体验一下mapreduce编程模型,那么推荐你几个轻量级的库。
文章分享结束,hadoop安装实验报告和Hadoop搭建环境的原理的答案你都知道了吗?欢迎再次光临本站哦!
本文链接:http://xinin56.com/qianduan/222.html