各省人口圖繪制python_python處理圖片數據

A. python 數據可視化：分類特徵統計圖

上一課已經體驗到了 Seaborn 相對 Matplotlib 的優勢，本課將要介紹的是 Seaborn 對分類數據的統計，也是它的長項。

針對分類數據的統計圖，可以使用 sns.catplot 繪制，其完整參數如下：

本課使用演繹的方式來學習，首先理解這個函數的基本使用方法，重點是常用參數的含義。

其他的參數，根據名稱也能基本理解。

下面就依據 kind 參數的不同取值，分門別類地介紹各種不同類型的分類統計圖。

讀入數據集：

然後用這個數據集制圖，看看效果：

輸出結果：

毫無疑問，這里繪制的是散點圖。但是，該散點圖的橫坐標是分類特徵 time 中的三個值，並且用 hue='kind' 又將分類特徵插入到圖像中，即用不同顏色的的點代表又一個分類特徵 kind 的值，最終得到這些類別組合下每個記錄中的 pulse 特徵值，並以上述圖示表示出來。也可以理解為，x='time', hue='kind' 引入了圖中的兩個特徵維度。

語句 ① 中，就沒有特別聲明參數 kind 的值，此時是使用默認值 'strip'。

與 ① 等效的還有另外一個對應函數 sns.stripplot。

輸出結果：

② 與 ① 的效果一樣。

不過，在 sns.catplot 中的兩個參數 row、col，在類似 sns.stripplot 這樣的專有函數中是沒有的。因此，下面的圖，只有用 sns.catplot 才能簡潔直觀。

輸出結果：

不過，如果換一個叫角度來說，類似 sns.stripplot 這樣的專有函數，表達簡單，參數與 sns.catplot 相比，有所精簡，使用起來更方便。

仔細比較，sns.catplot 和 sns.stripplot 兩者還是稍有區別的，雖然在一般情況下兩者是通用的。

因此，不要追求某一個是萬能的，各有各的用途，存在即合理。

不過，下面的聲明請注意： 如果沒有非常的必要，比如繪制分區圖，在本課中後續都演示如何使用專有名稱的函數。

前面已經初步解釋了這個函數，為了格式完整，這里再重復一下，即 sns.catplot 中參數 kind='strip'。

如果非要將此函數翻譯為漢語，可以稱之為「條狀散點圖」。以分類特徵為一坐標軸，在另外一個坐標軸上，根據分類特徵，將該分類特徵數據所在記錄中的連續值沿坐標軸描點。

從語句 ② 的結果圖中可以看到，這些點雖然縱軸的數值有相同的，但是沒有將它們重疊。因此，我們看到的好像是「一束」散點，實際上，所有點的橫坐標都應該是相應特徵分類數據，也不要把分類特徵的值理解為一個范圍，分散開僅僅是為了圖示的視覺需要。

輸出結果：

④ 相對 ② 的圖示，在於此時同一縱軸值的都重合了——本來它們的橫軸值都是一樣的。實現此效果的參數是 jitter=0，它可以表示點的「振動」，如果默認或者 jitter=True，意味著允許描點在某個范圍振動——語句 ② 的效果；還可設置為某個 0 到 1 的浮點，表示許可振動的幅度。請對比下面的操作。

輸出結果：

語句 ② 中使用 hue='kind' 參數向圖中提供了另外一個分類特徵，但是，如果感覺圖有點亂，還可以這樣做：

輸出結果：

dodge=True 的作用就在於將 hue='kind' 所引入的特徵數據分開，相對 ② 的效果有很大差異。

並且，在 ⑤ 中還使用了 paletter='Set2' 設置了色彩方案。

sns.stripplot 函數中的其他有關參數，請讀者使用幫助文檔了解。

此函數即 sns.catplot 的參數 kind='swarm'。

輸出結果：

再繪制一張簡單的圖，一遍研究這種圖示的本質。

輸出結果：

此圖只使用了一個特徵的數據，簡化表象，才能探究 sns.swarmplot 的本質。它同樣是將該特徵中的數據，依據其他特徵的連續值在圖中描點，並且所有點在默認情況下不彼此重疊——這方面與 sns.stripplot 一樣。但是，與之不同的是，這些點不是隨機分布的，它們經過調整之後，均勻對稱分布在分類特徵數值所在直線的兩側，這樣能很好地表示數據的分布特點。但是，這種方式不適合「大數據」。

sns.swarmplot 的參數似乎也沒有什麼太特殊的。下面使用幾個，熟悉一番基本操作。

在分類維度上還可以再引入一個維度，用不同顏色的點表示另外一種類別，即使用 hue 參數來實現。

輸出結果：

這里用 hue = 'smoker' 參數又引入了一個分類特徵，在圖中用不同顏色來區分。

如果覺得會 smoker 特徵的值都混在一起有點亂，還可以使用下面方式把他們分開——老調重彈。

輸出結果：

生成此效果的參數就是 dodge=True，它的作用就是當 hue 參數設置了特徵之後，將 hue 的特徵數據進行分類。

sns.catplot 函數的參數 kind 可以有三個值，都是用於繪制分類的分布圖：

下面依次對這三個專有函數進行闡述。

B. 試述如何應用點狀和面狀符號將中國各行政區劃及其人口和人均GDP數據繪制在一張地圖上

這是個典型的經濟統計地圖，包括兩個專題要素：人口、GDP。完成這件事大概需要三個步驟：
一、數據准備
1、專題數據是各省人口數和GDP，這個數據可以從經濟統計年鑒獲取。
2、空間數據是各省的行政區邊界構成的多邊形。
二、數據關聯
每個多邊形具備兩個屬性信息：人口、GDP。再根據人口和GDP計算一個人均GDP。
三、制圖
可利用專業GIS軟體，按人口多少進行分級，人口多的給個大點的符號，人口少的給個小點的符號。再按人均GDP進行分級，數值大的給個深色，數值小的給個淺色。

C. python處理圖片數據

目錄

1.機器是如何存儲圖像的？

2.在Python中讀取圖像數據

3.從圖像數據中提取特徵的方法#1：灰度像素值特徵

4.從圖像數據中提取特徵的方法#2：通道的平均像素值

5.從圖像數據中提取特徵的方法#3：提取邊緣
是一張數字8的圖像，仔細觀察就會發現，圖像是由小方格組成的。這些小方格被稱為像素。

但是要注意，人們是以視覺的形式觀察圖像的，可以輕松區分邊緣和顏色，從而識別圖片中的內容。然而機器很難做到這一點，它們以數字的形式存儲圖像。請看下圖：

機器以數字矩陣的形式儲存圖像，矩陣大小取決於任意給定圖像的像素數。

假設圖像的尺寸為180 x 200或n x m，這些尺寸基本上是圖像中的像素數（高x寬）。

這些數字或像素值表示像素的強度或亮度，較小的數字（接近0）表示黑色，較大的數字（接近255）表示白色。通過分析下面的圖像，讀者就會弄懂到目前為止所學到的知識。

下圖的尺寸為22 x 16，讀者可以通過計算像素數來驗證：

圖片源於機器學習應用課程

剛才討論的例子是黑白圖像，如果是生活中更為普遍的彩色呢？你是否認為彩色圖像也以2D矩陣的形式存儲？

彩色圖像通常由多種顏色組成，幾乎所有顏色都可以從三原色（紅色，綠色和藍色）生成。

因此，如果是彩色圖像，則要用到三個矩陣（或通道）——紅、綠、藍。每個矩陣值介於0到255之間，表示該像素的顏色強度。觀察下圖來理解這個概念：

圖片源於機器學習應用課程

左邊有一幅彩色圖像（人類可以看到），而在右邊，紅綠藍三個顏色通道對應三個矩陣，疊加三個通道以形成彩色圖像。

請注意，由於原始矩陣非常大且可視化難度較高，因此這些不是給定圖像的原始像素值。此外，還可以用各種其他的格式來存儲圖像，RGB是最受歡迎的，所以筆者放到這里。讀者可以在此處閱讀更多關於其他流行格式的信息。

用Python讀取圖像數據

下面開始將理論知識付諸實踐。啟動Python並載入圖像以觀察矩陣：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from skimage.io import imread, imshow
image = imread('image_8_original.png', as_gray=True)
imshow(image)

#checking image shape
image.shape, image

（28，28）

矩陣有784個值，而且這只是整個矩陣的一小部分。用一個LIVE編碼窗口，不用離開本文就可以運行上述所有代碼並查看結果。

下面來深入探討本文背後的核心思想，並探索使用像素值作為特徵的各種方法。

方法#1：灰度像素值特徵

從圖像創建特徵最簡單的方法就是將原始的像素用作單獨的特徵。

考慮相同的示例，就是上面那張圖（數字『8』），圖像尺寸為28×28。

能猜出這張圖片的特徵數量嗎？答案是與像素數相同！也就是有784個。

那麼問題來了，如何安排這784個像素作為特徵呢？這樣，可以簡單地依次追加每個像素值從而生成特徵向量。如下圖所示：

下面來用Python繪制圖像，並為該圖像創建這些特徵：

image = imread('puppy.jpeg', as_gray=True)

image.shape, imshow(image)

（650，450）

該圖像尺寸為650×450，因此特徵數量應為297,000。可以使用NumPy中的reshape函數生成，在其中指定圖像尺寸：

#pixel features

features = np.reshape(image, (660*450))

features.shape, features

(297000,)
array([0.96470588, 0.96470588, 0.96470588, ..., 0.96862745, 0.96470588,
0.96470588])

這里就得到了特徵——長度為297,000的一維數組。很簡單吧？在實時編碼窗口中嘗試使用此方法提取特徵。

但結果只有一個通道或灰度圖像，對於彩色圖像是否也可以這樣呢？來看看吧！

方法#2：通道的平均像素值

在讀取上一節中的圖像時，設置了參數『as_gray = True』，因此在圖像中只有一個通道，可以輕松附加像素值。下面刪除參數並再次載入圖像：

image = imread('puppy.jpeg')
image.shape

(660, 450, 3)

這次，圖像尺寸為（660，450，3），其中3為通道數量。可以像之前一樣繼續創建特徵，此時特徵數量將是660*450*3 = 891,000。

或者，可以使用另一種方法：

生成一個新矩陣，這個矩陣具有來自三個通道的像素平均值，而不是分別使用三個通道中的像素值。

下圖可以讓讀者更清楚地了解這一思路：

這樣一來，特徵數量保持不變，並且還能考慮來自圖像全部三個通道的像素值。

image = imread('puppy.jpeg')
feature_matrix = np.zeros((660,450))
feature_matrix.shape

(660, 450)

現有一個尺寸為（660×450×3）的三維矩陣，其中660為高度，450為寬度，3是通道數。為獲取平均像素值，要使用for循環：

for i in range(0,iimage.shape[0]):
for j in range(0,image.shape[1]):
feature_matrix[i][j] = ((int(image[i,j,0]) + int(image[i,j,1]) + int(image[i,j,2]))/3)

新矩陣具有相同的高度和寬度，但只有一個通道。現在，可以按照與上一節相同的步驟進行操作。依次附加像素值以獲得一維數組：

features = np.reshape(feature_matrix, (660*450))
features.shape

(297000,)

方法#3：提取邊緣特徵

請思考，在下圖中，如何識別其中存在的對象：

識別出圖中的對象很容易——狗、汽車、還有貓，那麼在區分的時候要考慮哪些特徵呢？形狀是一個重要因素，其次是顏色，或者大小。如果機器也能像這樣識別形狀會怎麼樣？

類似的想法是提取邊緣作為特徵並將其作為模型的輸入。稍微考慮一下，要如何識別圖像中的邊緣呢？邊緣一般都是顏色急劇變化的地方，請看下圖：

筆者在這里突出了兩個邊緣。這兩處邊緣之所以可以被識別是因為在圖中，可以分別看到顏色從白色變為棕色，或者由棕色變為黑色。如你所知，圖像以數字的形式表示，因此就要尋找哪些像素值發生了劇烈變化。

假設圖像矩陣如下：

圖片源於機器學習應用課程

該像素兩側的像素值差異很大，於是可以得出結論，該像素處存在顯著的轉變，因此其為邊緣。現在問題又來了，是否一定要手動執行此步驟？

當然不！有各種可用於突出顯示圖像邊緣的內核，剛才討論的方法也可以使用Prewitt內核（在x方向上）來實現。以下是Prewitt內核：

獲取所選像素周圍的值，並將其與所選內核（Prewitt內核）相乘，然後可以添加結果值以獲得最終值。由於±1已經分別存在於兩列之中，因此添加這些值就相當於獲取差異。

還有其他各種內核，下面是四種最常用的內核：

圖片源於機器學習應用課程

現在回到筆記本，為同一圖像生成邊緣特徵：

#importing the required libraries
import numpy as np
from skimage.io import imread, imshow
from skimage.filters import prewitt_h,prewitt_v
import matplotlib.pyplot as plt
%matplotlib inline

#reading the image
image = imread('puppy.jpeg',as_gray=True)

#calculating horizontal edges using prewitt kernel
edges_prewitt_horizontal = prewitt_h(image)
#calculating vertical edges using prewitt kernel
edges_prewitt_vertical = prewitt_v(image)

imshow(edges_prewitt_vertical, cmap='gray')

D. Python實操：手把手教你用Matplotlib把數據畫出來

作者：邁克爾·貝耶勒（Michael Beyeler）

如需轉載請聯系華章科技

如果已安裝Anaconda Python版本，就已經安裝好了可以使用的 Matplotlib。否則，可能要訪問官網並從中獲取安裝說明：

http://matplotlib.org

正如使用np作為 NumPy 的縮寫，我們將使用一些標準的縮寫來表示 Matplotlib 的引入：

在本書中，plt介面會被頻繁使用。

讓我們創建第一個繪圖。

假設想要畫出正弦函數sin(x)的線性圖。得到函數在x坐標軸上0≤x＜10內所有點的值。我們將使用 NumPy 中的 linspace 函數來在x坐標軸上創建一個從0到10的線性空間，以及100個采樣點：

可以使用 NumPy 中的sin函數得到所有x點的值，並通過調用plt中的plot函數把結果畫出來：

你親自嘗試了嗎？發生了什麼嗎？有沒有什麼東西出現？

實際情況是，取決於你在哪裡運行腳本，可能無法看到任何東西。有下面幾種可能性：

1. 從.py腳本中繪圖

如果從一個腳本中運行 Matplotlib，需要加上下面的這行調用：

在腳本末尾調用這個函數，你的繪圖就會出現！

2. 從 IPython shell 中繪圖

這實際上是互動式地執行Matplotlib最方便的方式。為了讓繪圖出現，需要在啟動 IPython 後使用所謂的%matplotlib魔法命令。

接下來，無須每次調用plt.show()函數，所有的繪圖將會自動出現。

3. 從 Jupyter Notebook 中繪圖

如果你是從基於瀏覽器的 Jupyter Notebook 中看這段代碼，需要使用同樣的%matplotlib魔法命令。然而，也可以直接在notebook中嵌入圖形，這會有兩種輸出選項：

在本書中，將會使用inline選項：

現在再次嘗試一下：

上面的命令會得到下面的繪圖輸出結果：

如果想要把繪圖保存下來留作以後使用，可以直接在 IPython 或者 Jupyter Notebook 使用下面的命令保存：

僅需要確保你使用了支持的文件後綴，比如.jpg、.png、.tif、.svg、.eps或者.pdf。

作為本章最後一個測試，讓我們對外部數據集進行可視化，比如scikit-learn中的數字數據集。

為此，需要三個可視化工具：

那麼開始引入這些包吧：

第一步是載入實際數據：

如果沒記錯的話，digits應該有兩個不同的數據域：data域包含了真正的圖像數據，target域包含了圖像的標簽。相對於相信我們的記憶，我們還是應該對digits稍加探索。輸入它的名字，添加一個點號，然後按Tab鍵：digits.<TAB>，這個操作將向我們展示digits也包含了一些其他的域，比如一個名為images的域。images和data這兩個域，似乎簡單從形狀上就可以區分。

兩種情況中，第一維對應的都是數據集中的圖像數量。然而，data中所有像素都在一個大的向量中排列，而images保留了各個圖像8×8的空間排列。

因此，如果想要繪制出一副單獨的圖像，使用images將更加合適。首先，使用NumPy的數組切片從數據集中獲取一幅圖像：

這里是從1797個元素的數組中獲取了它的第一行數據，這行數據對應的是8×8=64個像素。下面就可以使用plt中的imshow函數來繪制這幅圖像：

上面的命令得到下面的輸出：

此外，這里也使用cmap參數指定了一個顏色映射。默認情況下，Matplotlib 使用MATLAB默認的顏色映射jet。然而，在灰度圖像的情況下，gray顏色映射更有效。

最後，可以使用plt的subplot函數繪制全部數字的樣例。subplot函數與MATLAB中的函數一樣，需要指定行數、列數以及當前的子繪圖索引（從1開始計算）。我們將使用for 循環在數據集中迭代出前十張圖像，每張圖像都分配到一個單獨的子繪圖中。

這會得到下面的輸出結果：

關於作者：Michael Beyeler，華盛頓大學神經工程和數據科學專業的博士後，主攻仿生視覺計算模型，用以為盲人植入人工視網膜（仿生眼睛），改善盲人的視覺體驗。他的工作屬於神經科學、計算機工程、計算機視覺和機器學習的交叉領域。同時他也是多個開源項目的積極貢獻者。

本文摘編自《機器學習：使用OpenCV和Python進行智能圖像處理》，經出版方授權發布。

E. 如何用ArcGIS在中國行政圖上添加各省的人口數據

第一，你先在acrgis 中添加行政圖，添加投影，
第二，打開行政圖的屬性，在顯示那個中選擇分類值，給各個地方賦唯一值。
第三，打開屬性表，添加各個省的人口數據。

F. 全國各省人口的數量可以用折線統計圖表示嗎

看反映什麼情況
如果想看各省人口的增長情況，就用條形統計圖
如果想看各省人口的變化趨勢，就用拆線統計圖
這里用條形統計圖比較合適

G. arcgis製作中國各省人口,面積,gdp以及產業結構分布圖

這個需要有省級面狀數據和省會點狀數據
另外需要各個專題數據
把專題數據作為關鍵欄位，進行專題制圖輸出即可

H. 怎樣用python畫圖

思路：

1. 確定好需要畫的圖。

2. 創建一個畫布，用來畫你需要的圖。

（1）畫布大小，可以使用默認大小，也可以自定義畫布大小。

（2）畫布背景色bgcolor()。

（3）確定起點位置。

3. 畫筆的設置。

（1）畫筆的大小，顏色。

（2）畫筆運行屬性。

二、定義畫布參數

importturtleast
t.screensize(width=None,heigh=None,bg=None)#以像素為單位，參數分別為畫布的寬，高，背景色
t.screensize()#返回默認大小（400，300）
t.Screen()#也是表示默認畫布大小，注意S大寫
t.setup(w=0.5,h=0.75,startx=None,starty=None)#w,h為整數是表示像素，為小數時表示占據電腦屏幕的比例
#startx，starty坐標表示矩形窗口左上角頂點的位置，默認為屏幕中心位置

三、定義畫筆

1、畫筆的狀態

在畫布上默認有一個坐標原點為畫布中心的坐標軸，坐標原點上有一隻面朝x軸正方向小烏龜。這里我們描述小烏龜時使用了兩個詞語：坐標原點(位置)，面朝x軸正方向(方向)，turtle繪圖中，就是使用位置方向描述小烏龜(畫筆)的狀態。

2、畫筆的屬性

畫筆(畫筆的屬性，顏色、畫線的寬度)

（1）turtle.pensize()：設置畫筆的寬度；

（2）turtle.pencolor()：沒有參數傳入，返回當前畫筆顏色，傳入參數設置畫筆顏色，可以是字元串如"green"，"red"，也可以是RGB 3元組；

>>>pencolor('brown')
>>>tup=(0.2,0.8,0.55)
>>>pencolor(tup)
>>>pencolor()
'#33cc8c'

（3）turtle.speed(speed)：設置畫筆移動速度，畫筆繪制的速度范圍[0,10]整數，數字越大越快。

導航:首頁 > 編程語言 > 各省人口圖繪制python

各省人口圖繪制python

與各省人口圖繪制python相關的資料