工具 工具

当前位置: 首页» 工具» 数据分析工具

声明:本栏目意在向用户介绍部分与数据处理相关的工具,以方便用户借助这些工具处理从本网站获取的开放数据。所有工具的相关信息均来源于网络,版权归原作者或者来源机构所有,如果有涉及任何版权方面的问题,请及时与我们联系。

Spark

开发者:Apache软件基金会, 加州大学柏克莱分校AMPLab, Databricks



Apache Spark是一个开源簇运算框架,最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中,Spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。Spark在存储器内运行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍,即便是运行程序于硬盘时,Spark也能快上10倍速度。Spark允许用户将数据加载至簇存储器,并多次对其进行查询,非常适合用于机器学习算法。

Storm

开发者:Backtype, Twitter



Storm是一个分布式计算框架,主要由Clojure编程语言编写。最初是由Nathan Marz及其团队创建于BackType,该项目在被Twitter取得后开源。它使用用户创建的“管(spouts)”和“螺栓(bolts)”来定义信息源和操作来允许批量、分布式处理流式数据。

SPSS

开发者:IBM公司



SPSS是统计产品与服务解决方案(Statistical Product and Service Solutions)的简称,为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,有Windows和Mac OS X等版本。

Weka

开发者:新西兰怀卡托大学



Weka是由新西兰怀卡托大学用Java开发的数据挖掘常用软件,Weka是怀卡托智能分析系统的缩写。Weka可以执行数据预处理、分类、递归、集群、关联规则和可视化。

RapidMiner

开发者:RapidMiner公司



RapidMiner具有丰富数据挖掘分析和算法功能,常用于解决各种的商业关键问题,如营销响应率、客户细分、客户忠诚度及终身价值、资产维护、资源规划、预测性维修、质量管理、社交媒体监测和情感分析等典型商业案例。

共5条,分1页,当前第1页  最前页 上一页 下一页 最后页