1. 哪個數據可視化工具比較好
看了一下其他的回答,都是利用現有的可視化軟體,這里以python為例,介紹2個比較好用的可視化包—seaborn和pyecharts,簡單易學、容易上手,繪制的圖形漂亮、大方、整潔,感興趣的朋友可以嘗試一下,實驗環境win10+python3.6+pycharm5.0,主要內容如下:
1.seaborn:這是一個基於matplotlib的可視化包,是對matplotlib更高級的API封裝,繪制的圖形種類繁多,包括常見的折線圖、柱狀圖、餅狀圖、箱型圖、熱力圖等,所需的代碼量更少,使用起來更方便,下面我簡單介紹一下這個包的安裝和使用:
程序運行截圖如下:
2.pyecharts:這個是echarts提供給python的一個介面,在前端的數據可視化中,可能會用到這個echarts包,藉助pyecharts,我們不僅可以繪制出漂亮的柱狀圖、折線圖等,還可以繪制3D圖形、地圖、雷達圖、極坐標系圖等,簡單好用,非常值得學習,下面我簡單介紹一下這個包的安裝和使用:
程序運行截圖如下:
補充推薦一個Python 新數據可視化模塊——Plotly Express 。
Plotly ExpressPlotly Express是一個新的高級Python數據可視化庫,它是Plotly.py的高級封裝,它為復雜的圖表提供了一個簡單的語法。只需一次導入,大多數繪圖只要一個函數調用,接受一個整潔的Pandas dataframe,就可以創建豐富的互動式繪圖。
Plotly Express 安裝慣例,使用 pip進行安裝。
Plotly Express支持構建圖表類型 gapminder數據集說明我們使用gapminder數據集進行體驗 Plotly Express 。
gapminder數據集顯示2007年按國家/地區的人均預期壽命和人均GDP 之間的趨勢:包含1952~2007年世界各國家人口、GDP發展與/地區的人均預期壽命和人均GDP 之間的趨勢。
散點圖scatter
常用參數說明:
使用散點圖描述中國人口與GDP增長趨勢圖
地理散點圖scatter_geo
常用參數說明
使用地理散點圖描述全球人口與GDP
折線圖(line)
常用參數說明
使用折線圖描述1952~2007中國與美國人口增長趨勢圖
條形圖(bar)
常用參數說明
使用條形圖描述1952~2007中國與美國人口增長趨勢圖
等值區域圖(choropleth)
常用參數說明
使用等值區域圖描述各個國家人口數量
目前國內數據可視化工具或產品很多,到底那個工具或者產品是最好的?看了很多數據可視化產品,總結下來分為幾大類。
下面我將一一分別進行工具介紹:
一.數據可視化庫類
一個純javascript的數據可視化庫,網路的產品,常應用於軟體產品開發或者 系統的圖表模塊,圖表種類多,動態可視化效果,開源免費。
評價: 非常好的一個可視化庫,圖表種類多,可選的主題。Echarts中主要還是以圖表為主,沒有提供文本和表格方面的展現庫,如果有相關需求還需要引入表格和文本方面的其他可視化庫。
與echarts相似,同樣是可視化庫,不過是國外的產品,商用需要付費,文檔詳盡。
評價: 同樣是非常好的一個可視化庫,圖表種類多。但是同樣需要進行二次開發,,沒有提供文本和表格方面的展現庫。而且因為商用付費,所以能選擇echarts肯定不會選擇highcharts。
Antv是螞蟻金服出品的一套數據可視化語法,是國內第一個才用the grammar of Graphics這套理論的可視化庫。在提供可視化庫同時也提供簡單的數據歸類分析能力。
評價: 是一個優秀的可視化庫,需要進行二次開發。因為採用的是the grammar of Graphics 語法,和echarts相比各有千秋。
二.報表、BI類
由echarts衍生出來的子產品,同樣繼承了echarts的特點,圖表種類多,沒有提供文本和表格方面的展現庫。Echarts接受json格式的數據,網路圖說把數據格式進行了封裝,可以通過表格的形式組織數據。
評價:可以把表格數據轉換成圖表展現形式的工具,支持excel數據導入 ,適合做靜態的BI報告。因為數據偏靜態,沒看到與資料庫結合的部分,很難和第三方系統結合展現動態變化的數據,如日報表、月報表、周報表等。
FineReport報表軟體是一款純Java編寫的、集數據展示(報表)和數據錄入(表單)功能於一身的企業級web報表工具,它「專業、簡捷、靈活」的特點和無碼理念,僅需簡單的拖拽操作便可以設計復雜的中國式報表,搭建數據決策分析系統。
評價: FineReport可以直連資料庫,方便快捷的定製各種復雜表樣,用來做出固定格式的周報、月報等。它的格式類似於excel界面,特色功能報表製作,報表許可權分配,報表管理還有填報,支持多種資料庫。
Tableau 是桌面系統中最簡單的商業智能工具軟體,Tableau 沒有強迫用戶編寫自定義代碼,新的控制台也可完全自定義配置。在控制台上,不僅能夠監測信息,而且還提供完整的分析能力。Tableau控制台靈活,具有高度的動態性。
評價: 全球知名的BI工具,價格6000元/年/人左右,但是國外產品不花錢不會為你做任何定製化改動,售後很有問題。
FineBI與FineReport都是帆軟的產品。首先FineReport作為一款報表工具,主要用於解決提升IT部門的常規/復雜報表開發效率問題;而FineBI是商業智能BI工具,在IT信息部門分類准備好數據業務包的前提下,給與數據,讓業務人員或領導自行分析,滿足即席數據分析需求,是分析型產品。
FineBI的使用感同Tableau類似,都主張可視化的 探索 性分析,有點像加強版的數據透視表。上手簡單,可視化庫豐富。可以充當數據報表的門戶,也可以充當各業務分析的平台。
評價:FineBI做到了自助式分析,圖表類型豐富,數據分析功能較強大,鑽取,篩選,分組等功能都有。但是對於普通沒有IT基礎的人來說,要想真正熟練地掌握finebi,還是有一定的難度的,需要花上幾天,但是這個難度相比Excel的VBA學習還是低不少的。
Power BI 是一套商業分析工具,用於在組織中提供見解。可連接數百個數據源、簡化數據准備並提供即席分析。生成美觀的報表並進行發布,供組織在 Web 和移動設備上使用。每個人都可創建個性化儀錶板,獲取針對其業務的全方位獨特見解。在企業內實現擴展,內置管理和安全性。
評價: 類似於excel的桌面bi工具,功能比excel更加強大。支持多種數據源。價格便宜。但是只能作為單獨的bi工具使用,沒辦法和現有的系統結合到一起。
三.可視化大屏類
提供豐富的模板與圖形,支持多數據源,拖拉式布局,支持服務化服務方式和本地部署。整體來說是一款很好的大屏的產品。
評價: 產品不錯,就是價格服務版每年5100元/年,本地部署竟然要110萬,每年續費也要37萬。
前文有介紹過,finereport是一個企業級的報表工具,同時也提供大屏的服務。通過布局、色彩、綁定數據等環節完成大屏的製作。擁有很多自助開發的可視化插件庫。
評價: 很優秀的軟體,性價比高。學習方面,掌握FineReport的dashboard製作,應該也比較簡單的。
五 .專業類(地圖、科學計算、機器學習)
很多工具都能實現數據地圖,比如echarts,finereport,tableau等。
ggplot2是R語言最流行的第三方擴展包,是RStudio首席科學家Hadley Wickham讀博期間的作品,是R相比其他語言一個獨領風騷的特點。包名中「gg」是grammar of graphics的簡稱,是一套優雅的繪圖語法。主要用於機器學習繪圖。
評價: 機器學習、數學、科學計算領域專業的繪圖語言。專業與技術要求都很高,不是專業搞機器學習或者科學計算的工程師,一般不會用到。
Python是一門編成語言,其周邊的繪圖庫也比較豐富比如pandas和matplotlib ,pandas能夠繪制線圖、柱圖、餅圖、密度圖、散點圖等; matplotlib主要是繪制數學函數相關的圖如三角函數圖、概率模型圖等。
評價: 機器學習、數學、科學計算領域專業的繪圖語言。專業與技術要求都很高,不是專業搞機器學習或者科學計算的工程師,一般不會用到。
R-ggplot2
ggplot2是R語言最為強大的作圖軟體包,強於其自成一派的數據可視化理念。當熟悉了ggplot2的基本套路後,數據可視化工作將變得非常輕松而有條理。
技術相關
1. 將數據,數據相關繪圖,數據無關繪圖分離
這點可以說是ggplot2最為吸引人的一點。眾所周知,數據可視化就是將我們從數據中 探索 的信息與圖形要素對應起來的過程。
ggplot2將數據,數據到圖形要素的映射,以及和數據無關的圖形要素繪制分離,有點類似java的MVC框架思想。這讓ggplot2的使用者能清楚分明的感受到一張數據分析圖真正的組成部分,有針對性的進行開發,調整。
2. 圖層式的開發邏輯
在ggplot2中,圖形的繪制是一個個圖層添加上去的。舉個例子來說,我們首先決定 探索 一下身高與體重之間的關系;然後畫了一個簡單的散點圖;然後決定最好區分性別,圖中點的色彩對應於不同的性別;然後決定最好區分地區,拆成東中西三幅小圖;最後決定加入回歸直線,直觀地看出趨勢。這是一個層層推進的結構過程,在每一個推進中,都有額外的信息被加入進來。在使用ggplot2的過程中,上述的每一步都是一個圖層,並能夠疊加到上一步並可視化展示出來。
3. 各種圖形要素的自由組合
由於ggplot2的圖層式開發邏輯,我們可以自由組合各種圖形要素,充分自由發揮想像力
基本開發步驟
1. 初始化 – ggplot()
這一步需要設定的是圖的x軸,y軸和」美學特徵」。基本形式如下:
p
2. 數據可視化工具有哪些,越炫酷越好,任務比較急在一個月之內需要完成,有知道的朋友給介紹一下唄。
數據分析之大數據可視化之初級篇--零編程工具
Tableau
Tableau 是一款企業級的大數據可視化工具。Tableau 可以讓你輕松創建圖形,表格和地圖。 它不僅提供了PC桌面版,還提供了伺服器解決方案,可以在線生成可視化報告。伺服器解決方案可以提供了雲託管服務。
Infogram
Infogram的最大優勢在於,讓可視化信息圖表與實時大數據相鏈接。只須三個簡單步驟,可以選擇在眾多圖表,地圖,甚至是視頻可視化模板中進行選擇,支持團隊賬號。
ChartBlocks
ChartBlocks是一個易於使用在線工具,它無需編碼,便能從電子表格,資料庫中構建可視化圖表。整個過程可以在圖表向導的指導下完成。圖表是響應式的,並且可以和任何的屏幕尺寸及設備兼容。
Datawrapper
Datawrapper是一款專注於新聞和出版的可視化工具。 Datawrapper非常容易使用,不需要任何編程基礎。你只需要上傳你的數據,便能輕松地創建和發布圖表,甚至是地圖。Datawrapper提供了 眾多的自定義布局及地圖模板。
Plotly
Plotly幫助你在短短幾分鍾內,從簡單的電子表格中開始創建漂亮的圖表。如果希望為JavaScript和Python等編程語言提供一個API介面的 話,Plotly是一款非常人性化的工具。
RAW
RAW彌補了很多工具在電子表格和矢量圖形(SVG)之間的缺失環節。你的大數據可以來自MicrosoftExcel中,谷歌文檔或是一個簡單的逗號分 隔的列表。它最厲害的功能是可以很容易地導出可視化結果,因為它和Adobe Illustrator,Sketch 和Inkscape是相容的。
Visual.ly
Visual.ly是一個可視化的內容服務。它提供專門的大數據可視化的服務。如果你想完 全外包可視化文件給第三方。你可以使用非常簡化的在線流程:你只需描述你的項目,服務團隊將在項目的整個持續時間內和你在一起。
Leaflet
Leafleft 基於Open Street Map數據,使用HTML5 / CSS3繪制互動式可視化圖。可以使用他們的擴展插件庫添加熱點圖(heatmaps)和動畫標記。 Leaflet 是開源和只有33 KB大小。
Chartist.js
Chartist.js的開發社區一直致力於打敗所有其他JavaScript圖表庫。它使用了Sass的個性化風格,它的SVG輸出是響應式的。
N3-charts
N3-charts是一種基於AngularJS框架的工具。它建立在D3.js之上,幫助您創建簡單的互動圖表。 N3-charts是一種小型化的圖表工具,不適用於大型項目。
Sigma JS
Sigma JS 是互動式可視化工具庫。由於使用了WebGL技術,可以使用滑鼠和觸摸的方式來更新和變換圖表,同時支持JSON和GEXF兩種數據格式。這為它提供了大量的可用互動式插件。Sigma JS 專注於網頁格式的網路圖可視化,在大數據網路可視化中非常有用。
Polymaps
Polymaps是一款地圖可視化一個JavaScript工具庫。 Polymaps使用SVG實現從國家到街道一級地理數據的可視化。可以使用CSS格式來修改你的樣式。它是創建heatmap熱點圖的最好的工具之一,創建的所有地圖都可以變成動態圖。
Processing.js
Processing.js是一個基於可視化編程語言的JavaScript庫。作為一種面向Web的JavaScript 庫,Processing.js是能夠有效進行網頁格式圖表處理。這使得它成為了一種非常好交換式可視化工具。 Processing.js需要一個兼容HTML5的瀏覽器來實現這一功能。
3. 5個常用的大數據可視化分析工具
1、FineReport
FineReport是一款純Java編寫的、集數據展示(報表)和數據錄入(表單)功能於一身的企業級web報表工具,只需要簡單的拖拽操作便可以設計復雜的中國式報表,搭建數據決策分析系統。
2、Echarts
前面說過了,Echarts是一個開源免費的javascript數據可視化庫,它讓我們可以輕松地繪制專業的商業數據圖表。
大家都知道去年春節以及近期央視大規劃報道的網路大數據產品,如網路遷徙、網路司南、網路大數據預測等等,這些產品的數據可視化均是通過ECharts來實現的。
3、FineBI
FineBI是新一代自助大數據分析的商業智能產品,提供了從數據准備、自助數據處理、數據分析與挖掘、數據可視化於一體的完整解決方案,也是我比較推崇的可視化工具之一。
FineBI的使用感同Tableau類似,都主張可視化的探索性分析,有點像加強版的數據透視表。上手簡單,可視化庫豐富。可以充當數據報表的門戶,也可以充當各業務分析的平台。
4、pyecharts
Echarts(下面會提到)是一個開源免費的javascript數據可視化庫,它讓我們可以輕松地繪制專業的商業數據圖表。當Python遇上了Echarts,pyecharts便誕生了,它是由chenjiandongx等一群開發者維護的Echarts Python介面,讓我們可以通過Python語言繪制出各種Echarts圖表。
5、Bokeh
Bokeh是一款基於Python的互動式數據可視化工具,它提供了優雅簡潔的方法來繪制各種各樣的圖形,可以高性能的可視化大型數據集以及流數據,幫助我們製作互動式圖表、可視化儀錶板等。
4. 數據可視化一般用什麼工具
統計數據可視化:用於對統計數據進行展示、分析,一般都是以資料庫表的形式提供,常見的有 HighCharts、ECharts、G2、Chart.js 、FineBI等等。
5. 做大數據分析一般用什麼工具呢
一、Hadoop
Hadoop是一個能夠對大量數據進行分布式處理的軟體框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop 是高效的,因為它以並行的方式工作,通過並行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴於社區伺服器,因此它的成本比較低,任何人都可以使用。
八、EverString
everstring主要是通過大數據的預測分析建模為企業提供業務和客戶推薦的SaaS服務,獲取和積累了兩個數據信息資源庫,一個行業外部的資源庫(公有SaaS收費形式),一個行業自己內部的資源庫(私有),然後再通過機器學習和人工智慧的方法對數據進行相應行業或是領域的建模,最後得到一個比較不錯的結果,優化於人工可以得到的結果,而且Everstring也成為了初創大數據公司裡面估值很高的公司。
6. Python如何將上百個pyecharts生成的html轉成圖片格式
程序導出word文檔的方法
將web/html內容導出為world文檔,再java中有很多解決方案,比如使用Jacob、Apache POI、Java2Word、iText等各種方式,以及使用freemarker這樣的模板引擎這樣的方式。php中也有一些相應的方法,但在python中將web/html內容生成world文檔的方法是很少的。其中最不好解決的就是如何將使用js代碼非同步獲取填充的數據,圖片導出到word文檔中。
1. unoconv
功能:
1.支持將本地html文檔轉換為docx格式的文檔,所以需要先將網頁中的html文件保存到本地,再調用unoconv進行轉換。轉換效果也不錯,使用方法非常簡單。
?
\# 安裝
sudo apt-get install unoconv
\# 使用
unoconv -f pdf *.odt
unoconv -f doc *.odt
unoconv -f html *.odt
缺點:
1.只能對靜態html進行轉換,對於頁面中有使用ajax非同步獲取數據的地方也不能轉換(主要是要保證從web頁面保存下來的html文件中有數據)。
2.只能對html進行轉換,如果頁面中有使用echarts,highcharts等js代碼生成的圖片,是無法將這些圖片轉換到word文檔中;
3.生成的word文檔內容格式不容易控制。
2. python-docx
功能:
1.python-docx是一個可以讀寫word文檔的python庫。
使用方法:
1.獲取網頁中的數據,使用python手動排版添加到word文檔中。