常用的大数据分析软件有哪些？

2024-05-18 08:18

1. 常用的大数据分析软件有哪些？

数据分析的工具千万种，综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。

常用的大数据分析软件有哪些？

2. 做大数据分析一般用什么软件？

大数据给您分析，您手机里最常用的手机软件是什么

3. 常用的大数据分析软件有哪些？

目前市场上的数据分析工具还是比较多的，国内跟国外都有，我就介绍几款主流的给楼主。
国外：
Tableau：自身定位是一款可视化工具，与Qlikview的定位差不多，可视化功能很强大，对计算机的硬件要求较高，部署较复杂。目前移动端只支持IOS系统。
Qlikview:最大的竞争者是Tableau，同Tableau和国内众多BI一样，是属于新一代的轻量化BI产品，体现在建模、部署和使用上。只能运行在windows系统，C／S的产品架构。采用内存动态计算，数据量小时，速度很快；数据量大时，吃内存很厉害性能偏慢。
Cognos：传统BI工具中最被广泛使用的，已被IBM收购。拥有强大的数据库平台、在数据管理、数据整合以及中间件领域专业功底深厚。偏操作型，手工建模，一旦需求变化需要 重新建模，学习要求较高。
国内：
FineBI:帆软旗下的自助性BI产品，轻量化的BI工具，部署方便，走多维分析方向。后期采用jar包升级换代，维护方便，最具性价比。
永洪BI:敏捷BI软件，产品稳定性较高。利用sql处理数据，不支持程序接口，实施交由第三方外包。

常用的大数据分析软件有哪些？

4. 大数据分析用什么软件？数据分析软件有哪些？优缺点是什么

国内外比较好的数据分析软件比较多，给题主稍微介绍几个口碑不错的软件吧。

Tableau：是桌面系统中最简单的商业智能工具软件，只需要简单配置，拖拖拽拽，就可以做出数据分析。Tableau学习成本低，可以快速上手，低于不太掌握统计原理的人，也能完成非常有价值的分析。功能丰富，数据可视化独具特色，大数据处理速度非常快。
数据抓取功能很弱，数据处理能力差，需要事先准备好数据。
FineBI：在国内口碑和发展还是不错的，通过大数据引擎Fineindx，可以自动建模，傻瓜式操作，只需在dashboard中简单拖拽操作，便能制作出丰富多样的数据可视化信息。进行数据钻取，联动和过滤等操作，自由分析数据。
数据分析中规中矩，没有那么多突出亮点。
Qlikview：是一个完整的商业智能软件，可以让IT人员和业务人员构建和部署强大的数据分析应用。其主要特点是开发和使用简单，可以让自助数据分析和所有信息都有一个灵活的直观的展现。
受限于用户数和设计报表的复杂程度，只能用于少数几个管理层人员

5. 大数据分析软件有哪些？

hadoop作为一款开源分布式集群常常被用于大数据分析后台数据存储，但是并不能单独作为分析工具。国内永洪科技bi工具Yonghong
Z-Suite
可以看作是大数据分析软件，包含专业数据集市Yonghong
Z-Data
Mart
，是他们基于自己技术研发的，类似于hadoop
，然而查询和计算速度更快，适合用于大数据实时分析。

大数据分析软件有哪些？

6. 大数据是什么意思？哪些软件适合大数据分析？

"大数据(big
data)，或称巨量资料，指的是所涉及的资料量规模巨大到无法通过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
大数据分析的标配是商业智能（BI）软件，传统数据分析的繁杂之处主要体现在两个方面，一是技术人员需要花费大量时间准备数据；二是业务人员基于数据偶得的一些分析需求实现过程复杂。
FineBI的Data
Service模块，特有的分析设计模式和指标影响因素智能分析模块，能够帮助用户解决传统BI数据准备时间长，偶得数据分析过程复杂等问题，让技术人员准备数据时无需任何代码和复杂的设置过程，让非IT人员能够轻松自在得进行分析。"

7. 做大数据分析一般用什么工具呢？

一、Hadoop
Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计算元素和存储会失败，因此它维护多个工作数据副本，确保能够针对失败的节点重新分布处理。Hadoop 是高效的，因为它以并行的方式工作，通过并行处理加快处理速度。Hadoop 还是可伸缩的，能够处理 PB 级数据。此外，Hadoop 依赖于社区服务器，因此它的成本比较低，任何人都可以使用。

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点：
⒈高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。
⒉高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。
⒊高效性。Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。
⒋高容错性。Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分配。
Hadoop带有用 Java 语言编写的框架，因此运行在 Linux 生产平台上是非常理想的。
Hadoop 上的应用程序也可以使用其他语言编写，比如 C++。
二、HPCC
HPCC，High Performance Computing and Communications（高性能计算与通信）的缩写。
1993年，由美国科学、工程、技术联邦协调理事会向国会提交了“重大挑战项目：高性能计算与 通信”的报告，也就是被称为HPCC计划的报告，即美国总统科学战略项目，其目的是通过加强研究与开发解决一批重要的科学与技术挑战问题。HPCC是美国 实施信息高速公路而上实施的计划，该计划的实施将耗资百亿美元，其主要目标要达到：开发可扩展的计算系统及相关软件，以支持太位级网络传输性能，开发千兆 比特网络技术，扩展研究和教育机构及网络连接能力。

该项目主要由五部分组成：
1、高性能计算机系统（HPCS），内容包括今后几代计算机系统的研究、系统设计工具、先进的典型系统及原有系统的评价等；
2、先进软件技术与算法（ASTA），内容有巨大挑战问题的软件支撑、新算法设计、软件分支与工具、计算计算及高性能计算研究中心等；
3、国家科研与教育网格（NREN），内容有中接站及10亿位级传输的研究与开发；
4、基本研究与人类资源（BRHR），内容有基础研究、培训、教育及课程教材，被设计通过奖励调查者-开始的，长期 的调查在可升级的高性能计算中来增加创新意识流，通过提高教育和高性能的计算训练和通信来加大熟练的和训练有素的人员的联营，和来提供必需的基础架构来支 持这些调查和研究活动；
5、信息基础结构技术和应用（IITA ），目的在于保证美国在先进信息技术开发方面的领先地位。
三、Storm
Storm是自由的开源软件，一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流，用于处理Hadoop的批量数据。Storm很简单，支持许多种编程语言，使用起来非常有趣。Storm由Twitter开源而来，其它知名的应用企业包括Groupon、淘宝、支付宝、阿里巴巴、乐元素、Admaster等等。
Storm有许多应用领域：实时分析、在线机器学习、不停顿的计算、分布式RPC（远过程调用协议，一种通过网络从远程计算机程序上请求服务）、 ETL（Extraction-Transformation-Loading的缩写，即数据抽取、转换和加载）等等。Storm的处理速度惊人：经测 试，每个节点每秒钟可以处理100万个数据元组。Storm是可扩展、容错，很容易设置和操作。

四、Apache Drill
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法，Apache软件基金会近日发起了一项名为“Drill”的开源项目。Apache Drill实现了 Google‘s Dremel.
据Hadoop厂商MapR Technologies公司产品经理Tomer Shiran介绍，“Drill”已经作为Apache孵化器项目来运作，将面向全球软件工程师持续推广。
该项目将会创建出开源版本的谷歌Dremel Hadoop工具（谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速）。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
“Drill”项目其实也是从谷歌的Dremel项目中获得灵感：该项目帮助谷歌实现海量数据集的分析处理，包括分析抓取Web文档、跟踪安装在Android Market上的应用程序数据、分析垃圾邮件、分析谷歌分布式构建系统上的测试结果等等。
通过开发“Drill”Apache开源项目，组织机构将有望建立Drill所属的API接口和灵活强大的体系架构，从而帮助支持广泛的数据源、数据格式和查询语言。


五、RapidMiner
RapidMiner是世界领先的数据挖掘解决方案，在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛，包括各种数据艺术，能简化数据挖掘过程的设计和评价。
功能和特点：
免费提供数据挖掘技术和库
100%用Java代码（可运行在操作系统）
数据挖掘过程简单，强大和直观
内部XML保证了标准化的格式来表示交换数据挖掘过程
可以用简单脚本语言自动进行大规模进程
多层次的数据视图，确保有效和透明的数据
图形用户界面的互动原型
命令行（批处理模式）自动大规模应用
Java API（应用编程接口）
简单的插件和推广机制
强大的可视化引擎，许多尖端的高维数据的可视化建模
400多个数据挖掘运营商支持
耶鲁大学已成功地应用在许多不同的应用领域，包括文本挖掘，多媒体挖掘，功能设计，数据流挖掘，集成开发的方法和分布式数据挖掘。

六、 Pentaho BI
Pentaho BI平台不同于传统的BI 产品，它是一个以流程为中心的，面向解决方案（Solution）的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来，方便商务智能应用的开发。它的出现，使得一系列的面向商务智能的独立产品如Jfree、Quartz等等，能够集成在一起，构成一项项复杂的、完整的商务智能解决方案。
Pentaho BI 平台，Pentaho Open BI 套件的核心架构和基础，是以流程为中心的，因为其中枢控制器是一个工作流引擎。工作流引擎使用流程定义来定义在BI 平台上执行的商业智能流程。流程可以很容易的被定制，也可以添加新的流程。BI 平台包含组件和报表，用以分析这些流程的性能。目前，Pentaho的主要组成元素包括报表生成、分析、数据挖掘和工作流管理等等。这些组件通过 J2EE、WebService、SOAP、HTTP、Java、JavaScript、Portals等技术集成到Pentaho平台中来。 Pentaho的发行，主要以Pentaho SDK的形式进行。
Pentaho SDK共包含五个部分：Pentaho平台、Pentaho示例数据库、可独立运行的Pentaho平台、Pentaho解决方案示例和一个预先配制好的 Pentaho网络服务器。其中Pentaho平台是Pentaho平台最主要的部分，囊括了Pentaho平台源代码的主体；Pentaho数据库为 Pentaho平台的正常运行提供的数据服务，包括配置信息、Solution相关的信息等等，对于Pentaho平台来说它不是必须的，通过配置是可以用其它数据库服务取代的；可独立运行的Pentaho平台是Pentaho平台的独立运行模式的示例，它演示了如何使Pentaho平台在没有应用服务器支持的情况下独立运行；Pentaho解决方案示例是一个Eclipse工程，用来演示如何为Pentaho平台开发相关的商业智能解决方案。
Pentaho BI 平台构建于服务器，引擎和组件的基础之上。这些提供了系统的J2EE 服务器，安全，portal，工作流，规则引擎，图表，协作，内容管理，数据集成，分析和建模功能。这些组件的大部分是基于标准的，可使用其他产品替换之。
七、Splunk
Splunk的功能组件主要有Forwarder、Serch Head、Indexer三种，然后支持了查询搜索、仪表盘和报表（效果真不是吹的，很精致呀），另外还支持SaaS服务模式。其中，Splunk支持的数据源也是多种类型的，基本上还是可以满足客户的需求。
目前支持hadoop1.x（MRv1）、Hadoop2.x（MRv2）、Hadoop2.x（Yarn）三个版本的Hadoop集群的日志数据源收集，在日志管理运维方面还是处于一个国际领先的地位，目前国内有部分的数据驱动型公司也正在采用Splunk的日志管理运维服务。

八、EverString
everstring主要是通过大数据的预测分析建模为企业提供业务和客户推荐的SaaS服务，获取和积累了两个数据信息资源库，一个行业外部的资源库（公有SaaS收费形式），一个行业自己内部的资源库（私有），然后再通过机器学习和人工智能的方法对数据进行相应行业或是领域的建模，最后得到一个比较不错的结果，优化于人工可以得到的结果，而且Everstring也成为了初创大数据公司里面估值很高的公司。

做大数据分析一般用什么工具呢？

8. 大数据分析：有哪些软件适合做这方面的分析？

要看你现在要学什么，偏运营实战经验方面的话，可以看看growingio博客，里面不仅有理论，更多大牛实战干货。他们家的公开课也值得一听，在馒头商学院也有他们的课。
数据分析软件注册一个就可以用growingio自己家的了，感觉它比其他数据分析软件好用很多