当前位置：首页 > 前端设计 > 正文

hadoop安装实验报告，Hadoop搭建环境的原理

夕逆IT
前端设计
2023-08-13
265

大家好，今天小编来为大家解答hadoop安装实验报告这个问题，Hadoop搭建环境的原理很多人还不知道，现在让我们一起来看看吧！学习大数据Hadoop需要哪些基础Had...

大家好，今天小编来为大家解答hadoop安装实验报告这个问题，Hadoop搭建环境的原理很多人还不知道，现在让我们一起来看看吧！

学习大数据Hadoop需要哪些基础

Hadoop是目前被广泛使用的大数据平台，Hadoop平台主要有HadoopCommon、HDFS、HadoopYarn、HadoopMapReduce和HadoopOzone。

Hadoop平台目前被行业使用多年，有健全的生态和大量的应用案例，同时Hadoop对硬件的要求比较低，非常适合初学者自学。目前很多商用大数据平台也是基于Hadoop构建的，所以Hadoop是大数据开发的一个重要内容。

学习Hadoop开发需要有三个基础知识，下面进行分别介绍：

第一：Linux操作系统知识。通常情况下，Hadoop平台是构建在Linux系统之上的，所以学习Hadoop首先要学习Linux操作系统的使用。目前比较流行的Linux操作系统包括CentOS和Ubuntu，这两个Linux系列操作系统有广泛的应用场景。学习Linux并不复杂，通常情况下可以在虚拟机上完成，很多初学者都是在虚拟机上搭建一个伪分布式集群，然后完成Hadoop实验。

第二：编程语言。目前在Hadoop平台下多采用Java和Python来完成程序的编写，由于Hadoop本身是采用Java语言编写的，所以在Hadoop平台下采用Java语言是比较方便的选择，Hadoop的官方demo往往也是采用Java语言实现的。Python语言由于比较简单，同时Python有丰富的库可以使用，所以目前使用Python完成Hadoop平台的开发也是一个比较常见的选择。另外，在Spark平台下Scala也有广泛的应用。

第三：算法。大数据的核心就是数据价值化的过程，而算法设计则是数据价值化的基础。因此，大数据平台的开发离不开算法，要想学习Hadoop开发一定要有一个扎实的算法基础。

Hadoop平台自身有非常丰富的开发组件，所以学习Hadoop的过程还是比较漫长的，由于大数据开发有较强的场景特征，所以建议结合具体的场景来完成Hadoop平台的学习。

大数据是我的主要研究方向之一，目前我也在带大数据方向的研究生，我会陆续在头条写一些关于大数据方面的文章，感兴趣的朋友可以关注我，相信一定会有所收获。

如果有大数据方面的问题，也可以咨询我。

谢谢！

怎么在windows上搭建hadoop环境

在Eclipse的Windows->Preferences中，选择HadoopMap/Reduce,设置好Hadoop的安装目录，这里，我直接从linux的/home/hadoop/hadoop-1.0.3拷贝过来的，点击OK按钮！

Hadoop如何快速入门

简单来说下，我对hadoop的理解。

狭义上说:

Hadoop1.x版本是hdfs+mapReduce

Hadoop2.x版本是hdfs+yarn+mapReduce

广义上说:

haddop是一个生态。

建议从1.x到2.x，先看架构，了解1.x的架构以及缺点不足，2.x是如何改进的。现在推出的3.x又有什么改进呢?

生态圈，都有什么?每个模块是做什么的?工作中会有什么应用场景?

以上是学习思路，仅供参考，欢迎与我在线交流

如何在windows下安装hadoop

先说一下要准备哪些软件和信息：

VMware-workstation；

CentOS-6.0-i386-bin-DVD；

eclipse-jee-luna-SR1-win32；

hadoop-0.20.2；

jdk-6u27-linux-i586；

（由于hadoop对版本的要求较高，大家还是不要轻易更换版本，这里列出来的各种软件都是稳定发布版，网上很容易可以download到的）。

整个教程分为这样5个部分来说：1）在Windows下安装虚拟机Vmware，并新建一个虚拟机装好centos系统；2）centos下设置ssh服务无密码登录；3）centos下安装jdk，并配置环境变量；4）centos下安装hadoop，并配置文件；5）windows下安装jdk和eclipse，并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要，尤其是第4）步。下面我们就详细说一下每一步该怎么做。

Step0:请大家先在windows下新建一个普通用户，用户名为hadoop，我们所有的软件全在这个下面安装，用户名最好要是hadoop，因为这个要和后面很多username相同，设为hadoop比较好记。

1）在Windows下安装虚拟机Vmware，并新建一个虚拟机装好centos系统；

首先，下载VMware-workstation并安装，这步骤和一般windows下安装软件的过程是一样的，入门小白也会熟练操作，这里就节省点儿空间给后面重要的步骤了~

然后，在Vmware的主页上新建一个虚拟机

一路下一步，直到让你选择系统镜像路径，我们选择centos系统映像，如上图，点击下一步。然后，需要你输入linux的用户名，这个比较重要，最好填写hadoop，因为这个名字在后面要用到好多次！

后面还是一路的“下一步”，直到让你设置虚拟机的内存大小，建议为1024M。如上图。后面就是要选择和虚拟机的网络类型有关的设置了，建议为“使用网络地址转换NAT”，如下图。这一步我当时选择了自动桥接的功能，找了一个晚上的错误。。。时间就这样白花花的没了~~

之后还是一路的“下一步”，几乎都是使用它推荐的设置，我们就可以新建一个centos，等待个几分钟然后就可以进入centos界面了。看到那一抹科技蓝，有没有让你心动了呢~~哈哈哈，你确实走好了第一步！

2）centos下设置ssh服务无密码登录；

在桌面右击，选择openinTerminal，这个就是linux的终端了。希望读者有一些linux操作系统的基础，这样子上手更快一些。不过要是没有的话，也没有关系，我们是面向新手的教程。

2.1.先在linux命令行中输入su，提示密码，输入你自己设置的密码，这样子你后面的操作都具有了linux系统下的最高权限——root权限。

2.2.在设置ssh无密码登录之前，有一个特别重要的要先出好：关闭SELinux。这是因为centos会自动阻止你修改sshservice，我们只有关闭SELinux，重启才能生效。如何做，如下：

修改/etc/selinux/config文件

将SELINUX=enforcing改为SELINUX=disabled

重启机器即可

（note：在linux下修改文件，vi命令后会进入到文件窗口，按i进入insert，修改完毕之后再按esc推出insert，输入；:wq!保存并退出~这里要感谢泡哥，改了半天都不行，还是泡哥指点迷津了~~）

2.3.在linux命令行里输入：ssh-keygen-trsa，然后一路回车。

root@hadoopName-desktop:~$ssh-keygen-trsa

Generatingpublic/privatersakeypair.

Enterfileinwhichtosavethekey(/home/zhangtao/.ssh/id_rsa)://密钥保存位置，直接回车保持默认；

Createddirectory'/home/zhangtao/.ssh'.

Enterpassphrase(emptyfornopassphrase)://设置密钥的密码，空密码直接回车即可；

Entersamepassphraseagain://确认上一步设置的密码。

然后进入/root/.ssh/下面，会看到两个文件id_rsa.pub，id_rsa，

然后执行cpid_rsa.pubauthorized_keys

然后sshlocalhost验证是否成功，第一次要你输入yes，以后就不需要了。

如下图，由于我又验证了一次，所以还需要输入y，如果你是第一次验证是不要的。

至此，ssh服务无密码登录设置完毕！

3）centos下安装jdk，并配置环境变量；

这一步中可以分为两步：安装jdk、配置jdk环境变量。

3.1.第一步：root用户登陆，使用命令mkdir/usr/program新建目录/usr/program,下载JDK安装包jdk-6u13-linux-i586.bin，将其复制到目录/usr/program下，用cd命令进入该目录，执行命令“./jdk-6u13-linux-i586.bin”，命令运行完毕即安装完成，将在目录下生成文件夹/jdk1.6.0_13，此即为jdk被成功安装到目录：/usr/program/jdk1.6.0_13下。

3.2.root用户登陆，命令行中执行命令“vi/etc/profile”,并加入以下内容，配置环境变量(注意/etc/profile这个文件很重要，后面Hadoop的配置还会用到)。

#setjavaenvironment

exportJAVA_HOME=/usr/program/jdk1.6.0_27

exportJRE_HOME=/usr/program/jdk1.6.0_27/jre

exportCLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

在vi编辑器增加以上内容后保存退出，并执行以下命令使配置生效！

#chmod+x/etc/profile；增加执行权限

#source/etc/profile；使配置生效！

配置完毕后，在命令行中输入：java-version，就会出现安装jdk的信息。

这时，jdk的安装和配置环境变量就成功了~

在linux系统上怎么搭建hadoop开发环境

A、基础环境

1.jdk安装与配置

2.host

3.ssh

4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop，这是搭建集群的大题路径，详细的可以去看一下八斗学院的视频，第一部分是讲集群搭建的很详细

单机上跑多个虚拟机搭建hadoop集群可以提高计算能力吗

首先，跑虚拟机就要损耗性能，和资源。

然后，hadoop平台本身调度再损失一些。

最后，才是你的程序能使用的部分。

所以，还不如单机性能好。

如果，单机想尽可能使用多核优势，请使用openmp编程。

如果，你只是想体验一下mapreduce编程模型，那么推荐你几个轻量级的库。

文章分享结束，hadoop安装实验报告和Hadoop搭建环境的原理的答案你都知道了吗？欢迎再次光临本站哦！

本文由夕逆IT于2023-08-13发表在夕逆IT，如有疑问，请联系我们。
本文链接：http://xinin56.com/qianduan/222.html

上一篇：51aspx源码，开源社区源码

下一篇：makefile shell命令执行makefile文件的命令

hadoop安装实验报告，Hadoop搭建环境的原理

学习大数据Hadoop需要哪些基础

怎么在windows上搭建hadoop环境

Hadoop如何快速入门

如何在windows下安装hadoop

在linux系统上怎么搭建hadoop开发环境

单机上跑多个虚拟机搭建hadoop集群可以提高计算能力吗

最新文章

网站分类

精彩推荐

hadoop安装实验报告，Hadoop搭建环境的原理

学习大数据Hadoop需要哪些基础

怎么在windows上搭建hadoop环境

Hadoop如何快速入门

如何在windows下安装hadoop

在linux系统上怎么搭建hadoop开发环境

单机上跑多个虚拟机搭建hadoop集群可以提高计算能力吗

相关文章

最新文章

网站分类

精彩推荐