Apache Spark #
Apache Spark is a fast and general engine for large-scale data processing.
Installation (Source Code) #
- Download des komprimierten Source Code
- Entpacken der Datei
- Kompilieren:
- In der POM die folgenden Optionen der scala-maven-plugin setzen:
<arg>-Xmax-classfile-name</arg>
<arg>128</arg
- In project/SparkBuild.scala ergänzen:
scalacOptions in Compile ++= Seq("-Xmax-classfile-name", "128"),
- Maven goal generieren:
./build/mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.7.1 -Dscala-2.11 -Phive -Phive-thriftserver -DskipTests clean package
- In der POM die folgenden Optionen der scala-maven-plugin setzen: