1》基础环境准备:
jdk1.8.0_101 maven 3.3.9scala2.11.8安装好上述软件,配置好环境变量,并检查是否生效。
note:
2》maven 3.3.9 : 需要修改maven的安装目录下的conf/settings. 文件中添加如下配置,以达到jar下载加速的效果
<!-- 阿里云中央仓库 --> <mirror> <id>alimaven</id> <name>aliyun maven</name> <url>http://maven.aliyun.com/nexus/content/groups/public/</url> <mirrorOf>central</mirrorOf> </mirror> </mirrors>3》设置maven编译内存
export MAVEN_OPTS="-Xmx2g -XX:ReservedCodeCacheSize=512m"4.》
使用maven命令编译源码。
mvn -Pyarn -Phadoop-2.7 -Dhadoop.version=2.7.3 -Phive -Phive-thriftserver -DskipTests clean package5》使用spark自带打包脚本打包。:
首先修改脚本:在spark源码包根目录下执行如下命令,
vi dev/make-distribution.sh注释掉以下内容:位于文件中的120~136行。
#VERSION=$("$MVN" help:evaluate -D =project.version $@ 2>/dev/null | grep -v "INFO" | tail -n 1)#SCALA_VERSION=$("$MVN" help:evaluate -D =scala.binary.version $@ 2>/dev/null# | grep -v "INFO"# | tail -n 1)#SPARK_HADOOP_VERSION=$("$MVN" help:evaluate -D =hadoop.version $@ 2>/dev/null# | grep -v "INFO"# | tail -n 1)#SPARK_HIVE=$("$MVN" help:evaluate -D =project.activeProfiles -pl sql/hive $@ 2>/dev/null# | grep -v "INFO"# | fgrep --count "<id>hive</id>";# # Reset exit status to 0, otherwise the stops here if the last grep finds nothing# # because we use "set -o pipefail"# echo -n)添加以下内容:
VERSION=2.3.0SCALA_VERSION=2.11SPARK_HADOOP_VERSION=2.7.3SPARK_HIVE=16》修改后保存退出。在源码包根目录指定以下命令:
./dev/make-distribution.sh –name dev –tgz -Pyarn -Phadoop-2.7 -Dhadoop.version=2.7.3 -Phadoop-provided -Phive -Phive-thriftserver
Note :
如果要编译对应的cdh版本,需要在源码的根目录下的pom文件中添加如下的仓库。
添加 cdh的仓库。
<repository> <id>clouders</id> <name>clouders Repository</name> <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url></repository> 继续阅读与本文标签相同的文章
-
bootstrap-table对前台页面表格的支持
2026-05-26栏目: 教程
-
解决拦截器对ajax请求的的拦截
2026-05-26栏目: 教程
-
jQuery获取鼠标事件源(万能)
2026-05-26栏目: 教程
-
互联网健康教育品牌百诺名医汇获深圳汇投资本3000万元Pre-A轮融资
2026-05-26栏目: 教程
-
小程序服务商酷客获启浦投资5000万元A轮融资
2026-05-26栏目: 教程
