Spark 2.3.1-2.2.1-2

Apache Spark 是一种用于大数据的快速通用群集计算系统。

欢迎使用 DC/OS Apache Spark 服务文档。有关新特性和更新特性的详细信息,请参阅 发布说明

Apache Spark 是一种用于大数据的快速通用集群计算系统。它提供 Scala、Java、Python 和 R 的高级 API,以及支持数据分析一般计算图形的优化引擎。它还支持丰富的高级工具,包括用于 SQL 和 DatAframes 的 Spark SQL、用于机器学习的 MLlib、用于图形处理的 GraphX 和用于流处理的 Spark Streaming。有关详细信息,请参阅 Apache Spark 文档

DC/OS Apache Spark 包括 Apache Spark和几个自定义提交DC/OS 特定包装

DC/OS Apache Spark 包括:

优势

 • 利用率:DC/OS Apache Spark 利用 Mesos 在与其他 DC/OS 服务相同的集群上运行 Spark
 • 提高效率
 • 简单管理
 • 多团队支持
 • 通过笔记本电脑进行交互式分析
 • UI 集成
 • 安全,包括基于文件和环境的密钥

特征

 • 多版本支持
 • 运行多个 Spark 调度器
 • 针对多个 HDFS 集群运行
 • 计划排程改进的后端端口
 • 简单安装所有 Spark 组件,包括调度器和历史服务器
 • 调度器和历史服务器的集成
 • Zeppelin 集成
 • Kerberos 和 SSL 支持

相关服务