1 部署

需要软件包 Jdk Python2.7 Scala2.10.4 Spark1.0.1 Hadoop stable version 

配置依赖

org.apache.spark  spark-core_2.10 1.0.1

.org.apache.hadoop hadoop-client 

2核心概念

RDD 只读可分区的分布式数据集

 

收藏 打印