本文将盘点最受欢迎的免费/开源大数据可视化工具!分为几类,记得收藏!
第一档:开源大数据可视化组件,主要用于大数据平台的可视化展示,也有一些分析引擎,大家可以按需索取。
第二档:开源BI数据分析工具,主打OLAP多维分析,近几年也冒出来很多。
第三档:免费BI数据分析工具,相比较开源,一些厂商有自研商业化工具,也开放免费版本,推荐给大家。
一、9个开源大数据可视化组件
1. Apache Superset
Apache Superset是一个现代化的、互动式的业务智能和数据可视化平台,具有无限延伸的用途。它支持多个数据源,包括SQLAlchemy反向代理技术、SupersQL、Pandas、Spark等。该平台的功能强大,支持各种形式的数据可视化和呈现。
2. Apache Zeppelin
Apache Zeppelin是一个多功能的数据可视化工具,并提供了大量的交互式绘图和分析的工具。它支持多种数据源,包括Hadoop、Spark、Cassandra等,同时也支持多种编程语言,如Scala、Python、R等。
3. Grafana
Grafana是一个流行的开源时间序列分析和可视化工具,特别适合于监控系统指标和度量。它可以与多种数据源(如Graphite、InfluxDB、Prometheus等)集成,同时具有交互式的仪表板和多种可视化图表。
4. Kibana
Kibana是一个基于Elasticsearch的开源分析和可视化平台,可以帮助用户自由探索、分析和可视化 Elasticsearch 索引中的数据。Kibana支持丰富的图表和可视化方式,如条形图、饼状图、地图等。
5. Redash
Redash是一个基于Web的开源可视化和数据仪表板平台,支持多种数据源和可视化形式。它具有强大的查询构建器和仪表板编排工具,而且易于扩展和自定义。
6. Apache Druid
Apache Druid是一个高性能、列式存储的实时数据存储系统,适用于数据探索和可视化工作。它支持高维度聚合、多租户查询、实时流水线处理等功能,是一个完整的数据处理流程的解决方案。
7. Apache Flink Dashboards
Apache Flink Dashboards是一个开源的数据可视化工具,可帮助用户实时监控和分析Flink流处理应用程序。它提供了丰富的可视化图表和面板,而且易于设置和部署。
8. Apache Kylin
Apache Kylin是一个开源的分布式分析引擎,支持百亿级别的数据分析、OLAP、数据挖掘等场景。它可以与多种数据源(如Hive、HBase等)链接,并提供多维度分析和可视化工具。
9. Apache Flume
Apache Flume是一个高可靠性、可扩展性的分布式日志收集和聚合系统。它可以将多种来源的日志数据收集和汇总,并将其传输到目的地,同时也提供实时波形和统计数据的可视化工具。
二、2个最经典的开源BI工具
1.Superset
Superset是一款开源的自助式BI工具,绝对是近几年使用最多好评最多的开源BI。
它可利用于探索式的日常数据分析中,它能够对接常用的大数据分析工具、能够连接主流数据库或直接上传CSV数据文件,内含多类型展示图表样式,使用者通过自定义图表或dashboard可以直观地发现、分析、预警数据中所隐藏的问题,及时应对业务中的风险或发现增长点。
Superset也可利用于数据可视化成果共享,实现团队协同,使用者可将制作好的图表或发布的dashboard可见于团队成员,并通过权限配置控制团队成员对它们的可编辑性,各成员可发挥各自的想法,实现迭代化更新。
另外,Superset具有“SQL Lab”模块,可作为一个数据库管理工具,SQL查询面板可以对已连接的数据源进行数据查询,对数据源进行配置选择后也可实现数据库表的创建、修改和删除,通过该设置可避免对重要数据源的误改、误删。
但使用上也有问题,开源嘛维护少,比如:
安装教程较为蛋疼,和装mysql一样蛋疼
看板的过滤功能非常弱,连最基本的日期过滤组件没有,通过单图中的过滤器组件实现,只能针对单个数据表做出过滤组件,然后应用到看板上,此功能也很不方便
2. Metabase
Metabase是一个简单易用的开源分析和可视化平台,旨在让非技术用户也能方便地做数据分析和探索。它可以链接到多种数据源并提供丰富的可视化工具和分析功能。
整体上,个人体验下来,亮点特色如下:
交互体验对业务人员非常友好。通过一个对看板和单图做了一个全局搜索的功能,营造一种”ask a question“的智能场景,即通过搜索框咨询,系统告诉你答案,且整个产品的界面非常简洁明。
制作单图时非常简单,以数据为中心,去选择不同的图形(不可选的图形自动打灰)。基本做到了半分钟就能完成一个单图的分析。
但是最大的不足是权限管理实在太弱,只有可修改/可见的粗粒度控制,对表是否可删除都没法单独控制。
如果说不想要安装麻烦的开源,又想功能丰富稳定无bug的工具,最后一位,也是最值得推荐的免费BI工具——FineBI。
FineBI是帆软推出的商用的BI数据分析工具,目前已经有1万多家国内企业在使用,可以说是国内的tableau。
FineBI具有spider大数据引擎,对于大数据量的分析可以很快速地响应,支持本地模式和直连模式。其实上过BI的企业都应该知道,大数据BI分析工具最重要的就是稳定性,没有稳定性,一切都是白搭。
同时在OLAP多维分析方面,FineBI做的比较全面,钻取、联动、旋转、切片、跳转都可以进行快速设置,功能非常强大。
整体上,个人体验下来,亮点特色如下:
上手使用需要适应下流程,先配置数据,处理自助数据集,再是可视化仪表板和图表,有点懵
制作可视化非常简单,交互有点类似Tableau,拖拽数据字段到维度框,立马呈现可视化,然后在基于可视化组件构建仪表板
5分钟完成数据可视化分析,零代码操作,点击和拖拽完成分析,可半小时内作出数据报表。
有联动钻取功能大,也很智能,能自动关联到共性字段
数据处理功能很强大,自助数据集,能对数据处理的功能很多,包括分组汇总、修改数据字段、表合并等等
最大的亮点,权限控制非常细且实用,能细分到原始数据源、处理后的数据集、仪表板,能对不同角色用户管理,包括职位、部门等,有管理员和用户等权限管控,有点OA的味道,算是这几个里面最强大的
最后,如何选择呢?
如果是我,此次BI选型的选项落在Metabase和FineBI,前者开源,后者商业。开源有其弊端,权限功能太弱,没有平台运维的功能,界面都是英文,我们部门几个开发用还行,但考虑到后面可能面向全公司推广BI,选型上需要工具上手度能被业务方接受,且产品稳定性,需要技术和服务的保障。
商业智能BI产品更多介绍:www.finebi.com
免费下载FineBI
立即体验Demo