一般用哪些工具做大数据分析?
首发

一般用哪些工具做大数据分析?

优质
请用语音读文章

热门回答:

谢邀~

本君自荐一下。我们的产品诸葛io(www.zhugeio.com)可能更偏向于非技术人员的业务分析。比如产品经理、市场、运营人员。

从某种意义上也具有可视化分析的特性。但区别于其他工具的是我们面向互联网产品推广运营过程中的分析需求定义了一些分析模型。比如事件、漏斗、自定义留存、粘性、用户分群等。很多工具可以任意拖拽去做分析。但很多时候客户也会因为太灵活反而有一定门槛。所以。当一些模型被标准化以后。基本可以解决互联网产品设计、推广、运营、营销过程中的绝大多数分析需求。这也大大提供了业务人员的工作效率。

附图几张:




关于一些分析模型。我们整理出了常用的八大数据分析模型。过去两个月。每周二都会更新一个模型。很多模型大家都比较了解。但可能他又增加了一些新特性。感兴趣可戳链接:

八大数据分析模型之——用户模型(一)

八大数据分析模型之——事件模型(二)

八大数据分析模型之——漏斗模型(三)

八大数据分析模型之——热图模型(四)

八大数据分析模型之——自定义留存分析模型(五)

八大数据分析模型之——粘性分析模型(六)

八大数据分析模型之——全行为路径模型(七)

……

当然。我们也面向有高级使用需求的用户。比如数据分析师或是有一定数据查询能力的人员提供了SQL查询功能。因为还有20%的分析需求无法通过标准的模型解决。需要自己去定义。

数据都是开放的。原始数据的导出。实时数据的调用在诸葛都是支持的。数据来源于客户。数据属于客户。

1、前端表格导出

2、SQL查询平台支持

3、查询API按需调用

4、直连数据仓库

5、Kafka实时订阅

6、原始数据全量导出

以上~

其他观点:

有很多开源的产品。如果有研发能力的。可以直接使用开源产品来自己搭建数据分析平台。开发自己的数据分析软件。不过这样需要较强的技术能力。付出较大的成本。

也可以使用东软平台云(https://cloud.neusoft.com/)的DataViz可视化数据分析软件。这样的专业的尅时候数据分析软件。不需要专业的分析师和技术人员。业务人员通过简单的拖拽就可以实现数据分析。还支持多种数据源。支持动态传统图表和高级可视化图表。多种科技、商务主题自由切换。支持拖拽图表组合布局。设置图表联动交互。分析结果支持适应各种分辨率的大屏展示。

其他观点:

MongoDB—— 一种流行的。跨平台的面向文档的数据库。

Elasticsearch——专为云而构建的分布式REST风格搜索引擎。

Cassandra——一个开源的分布式数据库管理系统。最初由Facebook开发。被设计用来处理横跨多个商用服务器的大量数据。提供了无单点故障的高度可用性。

Redis—— 一个开源的(BSD许可)。内存数据结构存储。作为数据库、缓存和消息代理使用。

Hazelcast——基于Java的开源内存数据网格。

EHCache——一种被广泛使用的开源Java分布式缓存。用于通用缓存、Java EE和轻量级容器。Ehcache相关介绍

Hadoop——用Java编写的一个开源软件框架。用于分布式存储和对在计算机集群上的超大型数据集的分布式处理。

Solr——一个开源的企业搜索平台。用Java编写的。来自于ApacheLucene项目。

Spark——Apache Software Foundation中最活跃的项目。一个开源的集群计算框架。

Memcached—— 一个通用的分布式内存缓存系统。

Apache Hive——提供了Hadoop之上类似于SQL的层。

Apache Kafka—— 一个高通量、分布式的发布-订阅式消息系统。最初开发在LinkedIn上。Windows上脱离Cygwin运行Apache Kafka

Akka—— 一个工具包和运行时。用于在JVM上构建高度并行的、分布式的、有弹性的消息驱动的应用程序。

HBase—— 一个开源的。非关系型的。分布式数据库。在谷歌的BigTable后建模。用Java编写。并运行在HDFS上。

Neo4j——用Java实现的开源图形数据库。

CouchBase——一个开源的、面向文档的分布式NoSQL数据库。特别为了交互式应用而优化。

Apache Storm——开源的分布式实时计算系统。

CouchDB——使用JSON来存储数据的面向文档的开源NoSQL数据库。

Oracle Coherence—— 一个内存的数据网格解决方案。通过提供快速访问常用数据的渠道。使得企业可预测地扩展关键任务应用程序。

Titan—— 一个可扩展的图形数据库。优化的目的在于存储和查询包含数千亿顶点和边的图形。分布在多机集群。

Amazon DynamoDB——一个快速、灵活、完全管理的NoSQL数据库服务。用于在任何规模需要一致的、个位数毫秒延迟的所有应用程序。

Amazon Kinesis—— 用于在AWS上的流数据的实时平台。

Datomic—— 一个用Clojure写的完全事务式的。支持云的。分布式数据库。

原文链接:https://blog.csdn.net/zhinengxuexi/article/details/90056986

以上就是由优质生活领域创作者 生活常识网 整理编辑的,如果觉得有帮助欢迎收藏转发~

分享到 :
相关推荐

有什么好看的讲高三的青春励志电影?

请用语音读文章热门回答:2017。我和高考的相识还是两年前了。《全城高考》亲情、[&...

各地名景名小吃,你晓得的有哪些?

请用语音读文章热门回答:你好。这个问题我也回答一下~第一就说陕西汉中吧。那里的[&h...

荆轲刺杀秦王失败的原因有哪些?

请用语音读文章热门回答:荆轲刺秦在中国历史上是一个让大家耳熟能详的典故。它的趣味[&...

B站点击率、评分高的动漫,可以认为是神作吗?

请用语音读文章热门回答:不请自来。对于“神作”的争论真的已经疲劳了。毕竟有的人[&h...

发表评论

您的电子邮箱地址不会被公开。

评论(2)

  • 亦久亦旧 永久VIP 2022年10月1日 20:52:34

    模型,开源,分布式,数据,大数,数据库,据分析,图表,缓存,平台

  • 眼角痣 永久VIP 2022年10月1日 20:52:34

    没想到大家都对一般用哪些工具做大数据分析?感兴趣,不过这这篇解答确实也是太好了

  • 意中人 永久VIP 2022年10月1日 20:52:34

    谢邀~本君自荐一下。我们的产品诸葛io(www.zhugeio.com)可能更偏向于非技术人员的业务分析。比如产品经理