您的位置：首页 > 汽车 > 新车 > 搭建hadoop+spark完全分布式集群环境

搭建hadoop+spark完全分布式集群环境

2025/1/2 22:39:10 来源：https://blog.csdn.net/weixin_46305053/article/details/140394708 浏览: 次关键词：搭建hadoop+spark完全分布式集群环境

目录

一、集群规划

二、更改主机名

三、建立主机名和ip的映射

四、关闭防火墙（master，slave1，slave2）

五、配置ssh免密码登录

六、安装JDK

七、hadoop之hdfs安装与配置

1）解压Hadoop

2）修改hadoop-env.sh

3）修改 core-site.xml

4)修改hdfs-site.xml

5) 修改slave

八、配置hadoop环境变量

九、将hadoop拷贝到其他主机、

十、格式化元数据目录

十一、下载安装spark

十二、配置文件修改

1）复制模板文件

2）配置spark-env.sh(增加环境变量)

3) 配置slaves

4) 将master配置好的spark 拷贝到slave1,slave2

5) 配置环境变量

6）启动与验证

7）提交jar 包并观察验证

一、集群规划

主机名	操作系统	地址	角色	硬件配置
master	Centos	10.1.0.248	namenode	2g 1核
slaver1	Centos	10.1.0.94	datanode	1g 1核
slaver2	Centos	10.1.0.31	datanode	1g 1核

二、更改主机名

分别修改主机名文件（重启永久生效）

sudo vi /etc/sysconfig/network

三、建立主机名和ip的映射

sudo vi /etc/hosts

拷贝到slave1和slave2中

四、关闭防火墙（master，slave1，slave2）

关闭防火墙：sudo service iptables stop

关闭防火墙自启：sudo chkconfig iptables off

五、配置ssh免密码登录

ssh-keygen -t rsa

ssh-copy-id mast

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

广东城市更新建筑职位火热招聘中 Redis配置RDB、AOF 国土空间调查、规划、用途管制用地用海分类指南 php网站添加cnzz,cnzz代码添加元素到页面从关键新闻和最新技术看AI行业发展（第三十七期2024.11.25-12.8） |【WeThinkIn老实人报】 zabbix 7.0.3 接入ldap

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989