写点什么

Mac 部署 hadoop3(伪分布式)

作者:程序员欣宸
  • 2022-11-02
    四川
  • 本文字数:2194 字

    阅读完需:约 7 分钟

Mac部署hadoop3(伪分布式)

欢迎访问我的 GitHub

这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos

环境信息

  1. 操作系统:macOS Mojave 10.14.6

  2. JDK:1.8.0_211 (安装位置:/Library/Java/JavaVirtualMachines/jdk1.8.0_211.jdk/Contents/Home)

  3. hadoop:3.2.1

开通 ssh

  • 在"系统偏好设置"->"共享",设置如下:

免密码登录

  • 执行以下命令创建秘钥:


ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
复制代码


  • 一路 next,最终会在~/.ssh 目录生成 id_rsa 和 id_rsa.pub 文件

  • 执行以下命令,将自己的秘钥放在 ssh 授权目录,这样 ssh 登录自身就不需要输入密码了:


cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
复制代码


  • ssh 登录试试,这次不需要密码了:


Last login: Sun Oct 13 21:44:17 on ttys000(base) zhaoqindeMBP:~ zhaoqin$ ssh localhostLast login: Sun Oct 13 21:48:57 2019(base) zhaoqindeMBP:~ zhaoqin$
复制代码

下载 hadoop

  • 下载 hadoop,地址是:http://hadoop.apache.org/releases.html

  • 将下载文件 hadoop-3.2.1.tar.gz 解压,我这里解压后的地址是:~/software/hadoop-3.2.1/

  • 如果只需要 hadoop 单机模式,现在就可以了,但是单机模式没有 hdfs,因此接下来要做伪分布模式的设置;

伪分布模式设置

  • 进入目录 hadoop-3.2.1/etc/hadoop,做以下设置:

  • 打开 hadoop-env.sh 文件,增加 JAVA 的路径设置:


export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_211.jdk/Contents/Home
复制代码


  • 打开 core-site.xml 文件,将 configuration 节点改为如下内容:


<configuration>  <property>    <name>fs.defaultFS</name>    <value>hdfs://localhost:9000</value>  </property></configuration>
复制代码


  • 打开 hdfs-site.xml 文件,将 configuration 节点改为如下内容:


<configuration>  <property>    <name>dfs.replication</name>    <value>1</value>  </property></configuration>
复制代码


  • 打开 mapred-site.xml 文件,将 configuration 节点改为如下内容:


<configuration>    <property>         <name>mapreduce.framework.name</name>         <value>yarn</value>     </property></configuration>
复制代码


  • 打开 yarn-site.xml 文件,将 configuration 节点改为如下内容:


<configuration>    <property>        <name>yarn.nodemanager.aux-services</name>        <value>mapreduce_shuffle</value>    </property>    <property>        <name>yarn.nodemanager.env-whitelist</name>                  <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>    </property></configuration>
复制代码


  • 在目录 hadoop-3.2.1/bin 执行以下命令,初始化 hdfs:


./hdfs namenode -format
复制代码


  • 初始化成功后,可见如下信息:


2019-10-13 22:13:32,468 INFO namenode.NNStorageRetentionManager: Going to retain 1 images with txid >= 02019-10-13 22:13:32,473 INFO namenode.FSImage: FSImageSaver clean checkpoint: txid=0 when meet shutdown.2019-10-13 22:13:32,474 INFO namenode.NameNode: SHUTDOWN_MSG:/************************************************************SHUTDOWN_MSG: Shutting down NameNode at zhaoqindeMBP/192.168.50.12************************************************************/
复制代码

启动

  • 进入目录 hadoop-3.2.1/sbin,执行 ./start-dfs.sh 启动 hdfs:


(base) zhaoqindeMBP:sbin zhaoqin$ ./start-dfs.shStarting namenodes on [localhost]Starting datanodesStarting secondary namenodes [zhaoqindeMBP]zhaoqindeMBP: Warning: Permanently added 'zhaoqindembp,192.168.50.12' (ECDSA) to the list of known hosts.2019-10-13 22:28:30,597 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
复制代码


  • 上面的警告不会影响使用;

  • 浏览器访问地址:localhost:9870 ,可见 hadoop 的 web 页面如下图:

  • 进入目录 hadoop-3.2.1/sbin,执行 ./start-yarn.sh 启动 yarn:


base) zhaoqindeMBP:sbin zhaoqin$ ./start-yarn.shStarting resourcemanagerStarting nodemanagers
复制代码


  • 浏览器访问地址:localhost:8088 ,可见 yarn 的 web 页面如下图:

  • 执行 jps 命令查看所有 java 进程,正常情况下可以见到以下进程:


(base) zhaoqindeMBP:sbin zhaoqin$ jps2161 NodeManager1825 SecondaryNameNode2065 ResourceManager1591 NameNode2234 Jps1691 DataNode
复制代码


  • 至此,hadoop3 伪分布式环境的部署、设置、启动都已经完成。

停止 hadoop 服务

  • 进入目录 hadoop-3.2.1/sbin,执行 ./stop-all.sh 即可关闭 hadoop 的所有服务:


(base) zhaoqindeMBP:sbin zhaoqin$ ./stop-all.shWARNING: Stopping all Apache Hadoop daemons as zhaoqin in 10 seconds.WARNING: Use CTRL-C to abort.Stopping namenodes on [localhost]Stopping datanodesStopping secondary namenodes [zhaoqindeMBP]2019-10-13 22:49:00,941 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableStopping nodemanagersStopping resourcemanager
复制代码


  • 以上就是 Mac 环境部署 hadoop3 的全部过程,希望能给您一些参考。

欢迎关注 InfoQ:程序员欣宸

学习路上,你不孤单,欣宸原创一路相伴...


发布于: 2022-11-02阅读数: 31
用户头像

搜索"程序员欣宸",一起畅游Java宇宙 2018-04-19 加入

前腾讯、前阿里员工,从事Java后台工作,对Docker和Kubernetes充满热爱,所有文章均为作者原创,个人Github:https://github.com/zq2599/blog_demos

评论

发布
暂无评论
Mac部署hadoop3(伪分布式)_大数据_程序员欣宸_InfoQ写作社区