1. 哪个数据可视化工具比较好
看了一下其他的回答,都是利用现有的可视化软件,这里以python为例,介绍2个比较好用的可视化包—seaborn和pyecharts,简单易学、容易上手,绘制的图形漂亮、大方、整洁,感兴趣的朋友可以尝试一下,实验环境win10+python3.6+pycharm5.0,主要内容如下:
1.seaborn:这是一个基于matplotlib的可视化包,是对matplotlib更高级的API封装,绘制的图形种类繁多,包括常见的折线图、柱状图、饼状图、箱型图、热力图等,所需的代码量更少,使用起来更方便,下面我简单介绍一下这个包的安装和使用:
程序运行截图如下:
2.pyecharts:这个是echarts提供给python的一个接口,在前端的数据可视化中,可能会用到这个echarts包,借助pyecharts,我们不仅可以绘制出漂亮的柱状图、折线图等,还可以绘制3D图形、地图、雷达图、极坐标系图等,简单好用,非常值得学习,下面我简单介绍一下这个包的安装和使用:
程序运行截图如下:
补充推荐一个Python 新数据可视化模块——Plotly Express 。
Plotly ExpressPlotly Express是一个新的高级Python数据可视化库,它是Plotly.py的高级封装,它为复杂的图表提供了一个简单的语法。只需一次导入,大多数绘图只要一个函数调用,接受一个整洁的Pandas dataframe,就可以创建丰富的交互式绘图。
Plotly Express 安装惯例,使用 pip进行安装。
Plotly Express支持构建图表类型 gapminder数据集说明我们使用gapminder数据集进行体验 Plotly Express 。
gapminder数据集显示2007年按国家/地区的人均预期寿命和人均GDP 之间的趋势:包含1952~2007年世界各国家人口、GDP发展与/地区的人均预期寿命和人均GDP 之间的趋势。
散点图scatter
常用参数说明:
使用散点图描述中国人口与GDP增长趋势图
地理散点图scatter_geo
常用参数说明
使用地理散点图描述全球人口与GDP
折线图(line)
常用参数说明
使用折线图描述1952~2007中国与美国人口增长趋势图
条形图(bar)
常用参数说明
使用条形图描述1952~2007中国与美国人口增长趋势图
等值区域图(choropleth)
常用参数说明
使用等值区域图描述各个国家人口数量
目前国内数据可视化工具或产品很多,到底那个工具或者产品是最好的?看了很多数据可视化产品,总结下来分为几大类。
下面我将一一分别进行工具介绍:
一.数据可视化库类
一个纯javascript的数据可视化库,网络的产品,常应用于软件产品开发或者 系统的图表模块,图表种类多,动态可视化效果,开源免费。
评价: 非常好的一个可视化库,图表种类多,可选的主题。Echarts中主要还是以图表为主,没有提供文本和表格方面的展现库,如果有相关需求还需要引入表格和文本方面的其他可视化库。
与echarts相似,同样是可视化库,不过是国外的产品,商用需要付费,文档详尽。
评价: 同样是非常好的一个可视化库,图表种类多。但是同样需要进行二次开发,,没有提供文本和表格方面的展现库。而且因为商用付费,所以能选择echarts肯定不会选择highcharts。
Antv是蚂蚁金服出品的一套数据可视化语法,是国内第一个才用the grammar of Graphics这套理论的可视化库。在提供可视化库同时也提供简单的数据归类分析能力。
评价: 是一个优秀的可视化库,需要进行二次开发。因为采用的是the grammar of Graphics 语法,和echarts相比各有千秋。
二.报表、BI类
由echarts衍生出来的子产品,同样继承了echarts的特点,图表种类多,没有提供文本和表格方面的展现库。Echarts接受json格式的数据,网络图说把数据格式进行了封装,可以通过表格的形式组织数据。
评价:可以把表格数据转换成图表展现形式的工具,支持excel数据导入 ,适合做静态的BI报告。因为数据偏静态,没看到与数据库结合的部分,很难和第三方系统结合展现动态变化的数据,如日报表、月报表、周报表等。
FineReport报表软件是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,它“专业、简捷、灵活”的特点和无码理念,仅需简单的拖拽操作便可以设计复杂的中国式报表,搭建数据决策分析系统。
评价: FineReport可以直连数据库,方便快捷的定制各种复杂表样,用来做出固定格式的周报、月报等。它的格式类似于excel界面,特色功能报表制作,报表权限分配,报表管理还有填报,支持多种数据库。
Tableau 是桌面系统中最简单的商业智能工具软件,Tableau 没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。
评价: 全球知名的BI工具,价格6000元/年/人左右,但是国外产品不花钱不会为你做任何定制化改动,售后很有问题。
FineBI与FineReport都是帆软的产品。首先FineReport作为一款报表工具,主要用于解决提升IT部门的常规/复杂报表开发效率问题;而FineBI是商业智能BI工具,在IT信息部门分类准备好数据业务包的前提下,给与数据,让业务人员或领导自行分析,满足即席数据分析需求,是分析型产品。
FineBI的使用感同Tableau类似,都主张可视化的 探索 性分析,有点像加强版的数据透视表。上手简单,可视化库丰富。可以充当数据报表的门户,也可以充当各业务分析的平台。
评价:FineBI做到了自助式分析,图表类型丰富,数据分析功能较强大,钻取,筛选,分组等功能都有。但是对于普通没有IT基础的人来说,要想真正熟练地掌握finebi,还是有一定的难度的,需要花上几天,但是这个难度相比Excel的VBA学习还是低不少的。
Power BI 是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即席分析。生成美观的报表并进行发布,供组织在 Web 和移动设备上使用。每个人都可创建个性化仪表板,获取针对其业务的全方位独特见解。在企业内实现扩展,内置管理和安全性。
评价: 类似于excel的桌面bi工具,功能比excel更加强大。支持多种数据源。价格便宜。但是只能作为单独的bi工具使用,没办法和现有的系统结合到一起。
三.可视化大屏类
提供丰富的模板与图形,支持多数据源,拖拉式布局,支持服务化服务方式和本地部署。整体来说是一款很好的大屏的产品。
评价: 产品不错,就是价格服务版每年5100元/年,本地部署竟然要110万,每年续费也要37万。
前文有介绍过,finereport是一个企业级的报表工具,同时也提供大屏的服务。通过布局、色彩、绑定数据等环节完成大屏的制作。拥有很多自助开发的可视化插件库。
评价: 很优秀的软件,性价比高。学习方面,掌握FineReport的dashboard制作,应该也比较简单的。
五 .专业类(地图、科学计算、机器学习)
很多工具都能实现数据地图,比如echarts,finereport,tableau等。
ggplot2是R语言最流行的第三方扩展包,是RStudio首席科学家Hadley Wickham读博期间的作品,是R相比其他语言一个独领风骚的特点。包名中“gg”是grammar of graphics的简称,是一套优雅的绘图语法。主要用于机器学习绘图。
评价: 机器学习、数学、科学计算领域专业的绘图语言。专业与技术要求都很高,不是专业搞机器学习或者科学计算的工程师,一般不会用到。
Python是一门编成语言,其周边的绘图库也比较丰富比如pandas和matplotlib ,pandas能够绘制线图、柱图、饼图、密度图、散点图等; matplotlib主要是绘制数学函数相关的图如三角函数图、概率模型图等。
评价: 机器学习、数学、科学计算领域专业的绘图语言。专业与技术要求都很高,不是专业搞机器学习或者科学计算的工程师,一般不会用到。
R-ggplot2
ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。
技术相关
1. 将数据,数据相关绘图,数据无关绘图分离
这点可以说是ggplot2最为吸引人的一点。众所周知,数据可视化就是将我们从数据中 探索 的信息与图形要素对应起来的过程。
ggplot2将数据,数据到图形要素的映射,以及和数据无关的图形要素绘制分离,有点类似java的MVC框架思想。这让ggplot2的使用者能清楚分明的感受到一张数据分析图真正的组成部分,有针对性的进行开发,调整。
2. 图层式的开发逻辑
在ggplot2中,图形的绘制是一个个图层添加上去的。举个例子来说,我们首先决定 探索 一下身高与体重之间的关系;然后画了一个简单的散点图;然后决定最好区分性别,图中点的色彩对应于不同的性别;然后决定最好区分地区,拆成东中西三幅小图;最后决定加入回归直线,直观地看出趋势。这是一个层层推进的结构过程,在每一个推进中,都有额外的信息被加入进来。在使用ggplot2的过程中,上述的每一步都是一个图层,并能够叠加到上一步并可视化展示出来。
3. 各种图形要素的自由组合
由于ggplot2的图层式开发逻辑,我们可以自由组合各种图形要素,充分自由发挥想象力
基本开发步骤
1. 初始化 – ggplot()
这一步需要设定的是图的x轴,y轴和”美学特征”。基本形式如下:
p
2. 数据可视化工具有哪些,越炫酷越好,任务比较急在一个月之内需要完成,有知道的朋友给介绍一下呗。
数据分析之大数据可视化之初级篇--零编程工具
Tableau
Tableau 是一款企业级的大数据可视化工具。Tableau 可以让你轻松创建图形,表格和地图。 它不仅提供了PC桌面版,还提供了服务器解决方案,可以在线生成可视化报告。服务器解决方案可以提供了云托管服务。
Infogram
Infogram的最大优势在于,让可视化信息图表与实时大数据相链接。只须三个简单步骤,可以选择在众多图表,地图,甚至是视频可视化模板中进行选择,支持团队账号。
ChartBlocks
ChartBlocks是一个易于使用在线工具,它无需编码,便能从电子表格,数据库中构建可视化图表。整个过程可以在图表向导的指导下完成。图表是响应式的,并且可以和任何的屏幕尺寸及设备兼容。
Datawrapper
Datawrapper是一款专注于新闻和出版的可视化工具。 Datawrapper非常容易使用,不需要任何编程基础。你只需要上传你的数据,便能轻松地创建和发布图表,甚至是地图。Datawrapper提供了 众多的自定义布局及地图模板。
Plotly
Plotly帮助你在短短几分钟内,从简单的电子表格中开始创建漂亮的图表。如果希望为JavaScript和Python等编程语言提供一个API接口的 话,Plotly是一款非常人性化的工具。
RAW
RAW弥补了很多工具在电子表格和矢量图形(SVG)之间的缺失环节。你的大数据可以来自MicrosoftExcel中,谷歌文档或是一个简单的逗号分 隔的列表。它最厉害的功能是可以很容易地导出可视化结果,因为它和Adobe Illustrator,Sketch 和Inkscape是相容的。
Visual.ly
Visual.ly是一个可视化的内容服务。它提供专门的大数据可视化的服务。如果你想完 全外包可视化文件给第三方。你可以使用非常简化的在线流程:你只需描述你的项目,服务团队将在项目的整个持续时间内和你在一起。
Leaflet
Leafleft 基于Open Street Map数据,使用HTML5 / CSS3绘制互动式可视化图。可以使用他们的扩展插件库添加热点图(heatmaps)和动画标记。 Leaflet 是开源和只有33 KB大小。
Chartist.js
Chartist.js的开发社区一直致力于打败所有其他JavaScript图表库。它使用了Sass的个性化风格,它的SVG输出是响应式的。
N3-charts
N3-charts是一种基于AngularJS框架的工具。它建立在D3.js之上,帮助您创建简单的互动图表。 N3-charts是一种小型化的图表工具,不适用于大型项目。
Sigma JS
Sigma JS 是交互式可视化工具库。由于使用了WebGL技术,可以使用鼠标和触摸的方式来更新和变换图表,同时支持JSON和GEXF两种数据格式。这为它提供了大量的可用互动式插件。Sigma JS 专注于网页格式的网络图可视化,在大数据网络可视化中非常有用。
Polymaps
Polymaps是一款地图可视化一个JavaScript工具库。 Polymaps使用SVG实现从国家到街道一级地理数据的可视化。可以使用CSS格式来修改你的样式。它是创建heatmap热点图的最好的工具之一,创建的所有地图都可以变成动态图。
Processing.js
Processing.js是一个基于可视化编程语言的JavaScript库。作为一种面向Web的JavaScript 库,Processing.js是能够有效进行网页格式图表处理。这使得它成为了一种非常好交换式可视化工具。 Processing.js需要一个兼容HTML5的浏览器来实现这一功能。
3. 5个常用的大数据可视化分析工具
1、FineReport
FineReport是一款纯Java编写的、集数据展示(报表)和数据录入(表单)功能于一身的企业级web报表工具,只需要简单的拖拽操作便可以设计复杂的中国式报表,搭建数据决策分析系统。
2、Echarts
前面说过了,Echarts是一个开源免费的javascript数据可视化库,它让我们可以轻松地绘制专业的商业数据图表。
大家都知道去年春节以及近期央视大规划报道的网络大数据产品,如网络迁徙、网络司南、网络大数据预测等等,这些产品的数据可视化均是通过ECharts来实现的。
3、FineBI
FineBI是新一代自助大数据分析的商业智能产品,提供了从数据准备、自助数据处理、数据分析与挖掘、数据可视化于一体的完整解决方案,也是我比较推崇的可视化工具之一。
FineBI的使用感同Tableau类似,都主张可视化的探索性分析,有点像加强版的数据透视表。上手简单,可视化库丰富。可以充当数据报表的门户,也可以充当各业务分析的平台。
4、pyecharts
Echarts(下面会提到)是一个开源免费的javascript数据可视化库,它让我们可以轻松地绘制专业的商业数据图表。当Python遇上了Echarts,pyecharts便诞生了,它是由chenjiandongx等一群开发者维护的Echarts Python接口,让我们可以通过Python语言绘制出各种Echarts图表。
5、Bokeh
Bokeh是一款基于Python的交互式数据可视化工具,它提供了优雅简洁的方法来绘制各种各样的图形,可以高性能的可视化大型数据集以及流数据,帮助我们制作交互式图表、可视化仪表板等。
4. 数据可视化一般用什么工具
统计数据可视化:用于对统计数据进行展示、分析,一般都是以数据库表的形式提供,常见的有 HighCharts、ECharts、G2、Chart.js 、FineBI等等。
5. 做大数据分析一般用什么工具呢
一、Hadoop
Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。
八、EverString
everstring主要是通过大数据的预测分析建模为企业提供业务和客户推荐的SaaS服务,获取和积累了两个数据信息资源库,一个行业外部的资源库(公有SaaS收费形式),一个行业自己内部的资源库(私有),然后再通过机器学习和人工智能的方法对数据进行相应行业或是领域的建模,最后得到一个比较不错的结果,优化于人工可以得到的结果,而且Everstring也成为了初创大数据公司里面估值很高的公司。
6. Python如何将上百个pyecharts生成的html转成图片格式
程序导出word文档的方法
将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob、Apache POI、Java2Word、iText等各种方式,以及使用freemarker这样的模板引擎这样的方式。php中也有一些相应的方法,但在python中将web/html内容生成world文档的方法是很少的。其中最不好解决的就是如何将使用js代码异步获取填充的数据,图片导出到word文档中。
1. unoconv
功能:
1.支持将本地html文档转换为docx格式的文档,所以需要先将网页中的html文件保存到本地,再调用unoconv进行转换。转换效果也不错,使用方法非常简单。
?
\# 安装
sudo apt-get install unoconv
\# 使用
unoconv -f pdf *.odt
unoconv -f doc *.odt
unoconv -f html *.odt
缺点:
1.只能对静态html进行转换,对于页面中有使用ajax异步获取数据的地方也不能转换(主要是要保证从web页面保存下来的html文件中有数据)。
2.只能对html进行转换,如果页面中有使用echarts,highcharts等js代码生成的图片,是无法将这些图片转换到word文档中;
3.生成的word文档内容格式不容易控制。
2. python-docx
功能:
1.python-docx是一个可以读写word文档的python库。
使用方法:
1.获取网页中的数据,使用python手动排版添加到word文档中。