python圖像任務_Python如何圖像識別

1. python圖像處理代碼，望大神詳細解釋。越詳細越好

#初始化一個矩形np.max(marks)+1行，3列，默認值為0
colorTab=np.zeros((np.max(marks)+1,3))

#遍歷數組，給每行的3列賦值，就是RGB顏色值，8位的
foriinrange(len(colorTab)):
aa=np.random.uniform(0,255)
bb=np.random.uniform(0,255)
cc=np.random.uniform(0,255)
colorTab[i]=np.array([aa,bb,cc],np.uint8)

#初始化另一個跟img圖像形狀大小一樣的圖像，一副黑色圖像
bgrImage=np.zeros(img.shape,np.uint8)

#遍歷marks形狀的行列
foriinrange(marks.shape[0]):
forjinrange(marks.shape[1]):

index=marks[i][j]
#判斷是不是區域與區域之間的分界,如果是邊界(-1)，則使用白色顯示
ifindex==-1:
bgrImage[i][j]=np.array([255,255,255])#像素點設置位白色
else:
bgrImage[i][j]=colorTab[index]#像素點設置位上邊隨機生成的顏色值

#顯示處理後的圖像圖像
cv2.imshow('AfterColorFill',bgrImage)
#總結，先生成一個跟marks相同數量的row*col的一張顏色表，然後創建一個跟marks相同大小的一副黑色圖像
#最後對黑色圖像畫出白色邊界和內部隨機彩色像素值

2. 如何用python提取出兩幅圖像中不同的部分

簡單說，兩附圖之間對應像素相減，然後求絕對值，差異大於某個特定值的就認為是不同點。（如果你的圖片是jpg壓縮，那麼由於離散餘弦變換過程去掉了高頻信息，會導致圖像顏色變化劇烈的部分出現細微鋸齒狀差異）
使用Numpy操作，np.abs(img1-img2)>thr。即可得到

3. python處理圖片數據

目錄

1.機器是如何存儲圖像的？

2.在Python中讀取圖像數據

3.從圖像數據中提取特徵的方法#1：灰度像素值特徵

4.從圖像數據中提取特徵的方法#2：通道的平均像素值

5.從圖像數據中提取特徵的方法#3：提取邊緣
是一張數字8的圖像，仔細觀察就會發現，圖像是由小方格組成的。這些小方格被稱為像素。

但是要注意，人們是以視覺的形式觀察圖像的，可以輕松區分邊緣和顏色，從而識別圖片中的內容。然而機器很難做到這一點，它們以數字的形式存儲圖像。請看下圖：

機器以數字矩陣的形式儲存圖像，矩陣大小取決於任意給定圖像的像素數。

假設圖像的尺寸為180 x 200或n x m，這些尺寸基本上是圖像中的像素數（高x寬）。

這些數字或像素值表示像素的強度或亮度，較小的數字（接近0）表示黑色，較大的數字（接近255）表示白色。通過分析下面的圖像，讀者就會弄懂到目前為止所學到的知識。

下圖的尺寸為22 x 16，讀者可以通過計算像素數來驗證：

圖片源於機器學習應用課程

剛才討論的例子是黑白圖像，如果是生活中更為普遍的彩色呢？你是否認為彩色圖像也以2D矩陣的形式存儲？

彩色圖像通常由多種顏色組成，幾乎所有顏色都可以從三原色（紅色，綠色和藍色）生成。

因此，如果是彩色圖像，則要用到三個矩陣（或通道）——紅、綠、藍。每個矩陣值介於0到255之間，表示該像素的顏色強度。觀察下圖來理解這個概念：

圖片源於機器學習應用課程

左邊有一幅彩色圖像（人類可以看到），而在右邊，紅綠藍三個顏色通道對應三個矩陣，疊加三個通道以形成彩色圖像。

請注意，由於原始矩陣非常大且可視化難度較高，因此這些不是給定圖像的原始像素值。此外，還可以用各種其他的格式來存儲圖像，RGB是最受歡迎的，所以筆者放到這里。讀者可以在此處閱讀更多關於其他流行格式的信息。

用Python讀取圖像數據

下面開始將理論知識付諸實踐。啟動Python並載入圖像以觀察矩陣：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from skimage.io import imread, imshow
image = imread('image_8_original.png', as_gray=True)
imshow(image)

#checking image shape
image.shape, image

（28，28）

矩陣有784個值，而且這只是整個矩陣的一小部分。用一個LIVE編碼窗口，不用離開本文就可以運行上述所有代碼並查看結果。

下面來深入探討本文背後的核心思想，並探索使用像素值作為特徵的各種方法。

方法#1：灰度像素值特徵

從圖像創建特徵最簡單的方法就是將原始的像素用作單獨的特徵。

考慮相同的示例，就是上面那張圖（數字『8』），圖像尺寸為28×28。

能猜出這張圖片的特徵數量嗎？答案是與像素數相同！也就是有784個。

那麼問題來了，如何安排這784個像素作為特徵呢？這樣，可以簡單地依次追加每個像素值從而生成特徵向量。如下圖所示：

下面來用Python繪制圖像，並為該圖像創建這些特徵：

image = imread('puppy.jpeg', as_gray=True)

image.shape, imshow(image)

（650，450）

該圖像尺寸為650×450，因此特徵數量應為297,000。可以使用NumPy中的reshape函數生成，在其中指定圖像尺寸：

#pixel features

features = np.reshape(image, (660*450))

features.shape, features

(297000,)
array([0.96470588, 0.96470588, 0.96470588, ..., 0.96862745, 0.96470588,
0.96470588])

這里就得到了特徵——長度為297,000的一維數組。很簡單吧？在實時編碼窗口中嘗試使用此方法提取特徵。

但結果只有一個通道或灰度圖像，對於彩色圖像是否也可以這樣呢？來看看吧！

方法#2：通道的平均像素值

在讀取上一節中的圖像時，設置了參數『as_gray = True』，因此在圖像中只有一個通道，可以輕松附加像素值。下面刪除參數並再次載入圖像：

image = imread('puppy.jpeg')
image.shape

(660, 450, 3)

這次，圖像尺寸為（660，450，3），其中3為通道數量。可以像之前一樣繼續創建特徵，此時特徵數量將是660*450*3 = 891,000。

或者，可以使用另一種方法：

生成一個新矩陣，這個矩陣具有來自三個通道的像素平均值，而不是分別使用三個通道中的像素值。

下圖可以讓讀者更清楚地了解這一思路：

這樣一來，特徵數量保持不變，並且還能考慮來自圖像全部三個通道的像素值。

image = imread('puppy.jpeg')
feature_matrix = np.zeros((660,450))
feature_matrix.shape

(660, 450)

現有一個尺寸為（660×450×3）的三維矩陣，其中660為高度，450為寬度，3是通道數。為獲取平均像素值，要使用for循環：

for i in range(0,iimage.shape[0]):
for j in range(0,image.shape[1]):
feature_matrix[i][j] = ((int(image[i,j,0]) + int(image[i,j,1]) + int(image[i,j,2]))/3)

新矩陣具有相同的高度和寬度，但只有一個通道。現在，可以按照與上一節相同的步驟進行操作。依次附加像素值以獲得一維數組：

features = np.reshape(feature_matrix, (660*450))
features.shape

(297000,)

方法#3：提取邊緣特徵

請思考，在下圖中，如何識別其中存在的對象：

識別出圖中的對象很容易——狗、汽車、還有貓，那麼在區分的時候要考慮哪些特徵呢？形狀是一個重要因素，其次是顏色，或者大小。如果機器也能像這樣識別形狀會怎麼樣？

類似的想法是提取邊緣作為特徵並將其作為模型的輸入。稍微考慮一下，要如何識別圖像中的邊緣呢？邊緣一般都是顏色急劇變化的地方，請看下圖：

筆者在這里突出了兩個邊緣。這兩處邊緣之所以可以被識別是因為在圖中，可以分別看到顏色從白色變為棕色，或者由棕色變為黑色。如你所知，圖像以數字的形式表示，因此就要尋找哪些像素值發生了劇烈變化。

假設圖像矩陣如下：

圖片源於機器學習應用課程

該像素兩側的像素值差異很大，於是可以得出結論，該像素處存在顯著的轉變，因此其為邊緣。現在問題又來了，是否一定要手動執行此步驟？

當然不！有各種可用於突出顯示圖像邊緣的內核，剛才討論的方法也可以使用Prewitt內核（在x方向上）來實現。以下是Prewitt內核：

獲取所選像素周圍的值，並將其與所選內核（Prewitt內核）相乘，然後可以添加結果值以獲得最終值。由於±1已經分別存在於兩列之中，因此添加這些值就相當於獲取差異。

還有其他各種內核，下面是四種最常用的內核：

圖片源於機器學習應用課程

現在回到筆記本，為同一圖像生成邊緣特徵：

#importing the required libraries
import numpy as np
from skimage.io import imread, imshow
from skimage.filters import prewitt_h,prewitt_v
import matplotlib.pyplot as plt
%matplotlib inline

#reading the image
image = imread('puppy.jpeg',as_gray=True)

#calculating horizontal edges using prewitt kernel
edges_prewitt_horizontal = prewitt_h(image)
#calculating vertical edges using prewitt kernel
edges_prewitt_vertical = prewitt_v(image)

imshow(edges_prewitt_vertical, cmap='gray')

4. python matplotlib 圖像可視化

Python畫圖之總結待整理

https://morvanzhou.github.io/tutorials/data-manipulation/plt/
http://blog.sciencenet.cn/blog-1408284-850983.html
http://www.cnblogs.com/DHUtoBUAA/p/6619099.html
http://blog.csdn.net/wuguangbin1230/article/details/72858612
http://blog.sciencenet.cn/blog-251664-800766.html
http://blog.csdn.net/wuguangbin1230/article/details/72858612
http://www.jianshu.com/p/0a81b57bbb8c
https://pythonprogramming.net/

http://blog.csdn.net/haoji007/article/details/52063168

Python Data Visualizations

Seaborn 庫： https://seaborn.pydata.org/

Python Seaborn 教程： http://elitedatascience.com/python-seaborn-tutorial

matplotlib: plotting with Python
matplotlib: plotting with Python-github

python-data-visualization-course
Interactive Web Plotting for Python
Interactive Web Plotting for Python-github

https://morvanzhou.github.io/tutorials/data-manipulation/plt/3-3-contours/
https://github.com/MorvanZhou/tutorials/tree/master/matplotlibTUT

https://github.com/jiandanjinxin/tf-dev-summit-tensorboard-tutorial
https://github.com/jiandanjinxin/tensorflow-mnist-tutorial

CSDN-markdown編輯器語法——字體、字型大小與顏色

%matplotlib inline
%matplotlib notebook

Need to use either

Only one in each notebook! using inline will just sent png images to browser, using notebook will provide interactivity and allow updating old figures. With notebook you need to make sure to create a new figure before plotting, otherwise the last one will be updated!

還有簡便的 plt.close('all') 關閉所有圖,不用管 fig 號碼

Some plots from these tutorials:

調整名字和間隔

設置不同名字和位置

調整坐標軸

參數loc='upper right'
表示圖例將添加在圖中的右上角.

調整位置和名稱

最後我們得到帶有圖例信息的圖片.

移動坐標

然後我們挪動坐標軸的位置.

然後標注出點(x0, y0)的位置信息. 用plt.plot([x0, x0,], [0, y0,], 'k--', linewidth=2.5)
畫出一條垂直於x軸的虛線.

添加註釋 annotate
接下來我們就對(x0, y0)這個點進行標注.

其中參數xycoords='data'
是說基於數據的值來選位置,xytext=(+30, -30)
和textcoords='offset points'
對於標注位置的描述和 xy 偏差值,arrowprops
是對圖中箭頭類型的一些設置.

添加註釋 text

其中-3.7, 3,
是選取text的位置, 空格需要用到轉字元
,fontdict
設置文本字體.

生成圖形
當圖片中的內容較多，相互遮蓋時，我們可以通過設置相關內容的透明度來使圖片更易於觀察，也即是通過本節中的bbox
參數設置來調節圖像信息.
首先參考之前的例子, 我們先繪制圖像基本信息：

調整坐標

然後對被遮擋的圖像調節相關透明度，本例中設置 x軸和 y軸的刻度數字進行透明度設置

其中label.set_fontsize(12)重新調節字體大小，bbox設置目的內容的透明度相關參，facecolor調節 box 前景色，edgecolor 設置邊框，本處設置邊框為無，alpha設置透明度. 最終結果如下:

散點圖
首先，先引入matplotlib.pyplot簡寫作plt,再引入模塊numpy用來產生一些隨機數據。生成1024個呈標准正態分布的二維數據組 (平均數是0，方差為1) 作為一個數據集，並圖像化這個數據集。每一個點的顏色值用T來表示：

數據集生成完畢，現在來用scatterplot這個點集，滑鼠點上去，可以看到這個函數的各個parameter的描述，如下圖：
輸入X和Y作為location，size=75，顏色為T，color map用默認值，透明度alpha 為 50%。 x軸顯示範圍定位(-1.5，1.5)，並用xtick()函數來隱藏x坐標軸，y軸同理：

今天的柱狀圖分成上下兩部分，每一個柱體上都有相應的數值標注，並且取消坐標軸的顯示。
生成基本圖形
向上向下分別生成12個數據，X為 0 到 11 的整數，Y是相應的均勻分布的隨機數據。使用的函數是plt.bar
，參數為X和Y：

這樣我們就生成了下圖所示的柱狀圖基本框架：

現在的結果呈現：

接下來我們用函數plt.text分別在柱體上方（下方）加上數值，用%.2f保留兩位小數，橫向居中對齊ha='center'，縱向底部（頂部）對齊va='bottom'：

最終的結果就像開始一樣：

畫等高線
數據集即三維點 (x,y) 和對應的高度值，共有256個點。高度值使用一個 height function f(x,y) 生成。 x, y 分別是在區間 [-3,3] 中均勻分布的256個值，並用meshgrid在二維平面中將每一個x和每一個y分別對應起來，編織成柵格:

接下來進行顏色填充。使用函數plt.contourf把顏色加進去，fill, 位置參數分別為：X, Y, f(X,Y)。透明度0.75，並將 f(X,Y) 的值對應到color map的暖色組中尋找對應顏色。8代表等高線的個數。

接下來進行等高線繪制。使用plt.contour函數劃線。位置參數為：X, Y, f(X,Y)。顏色選黑色，線條寬度選0.5。現在的結果如下圖所示，只有顏色和線條，還沒有數值Label：

添加高度數字
其中，8代表等高線的密集程度，這里被分為10個部分。如果是0，則圖像被一分為二。
最後加入Label，inline控制是否將Label畫在線裡面，字體大小為10。並將坐標軸隱藏：

隨機矩陣畫圖

這一節我們講解怎樣在matplotlib中列印出圖像。這里我們列印出的是純粹的數字，而非自然圖像。我們今天用這樣 3x3 的 2D-array 來表示點的顏色，每一個點就是一個pixel。

colorbar
下面我們添加一個colorbar ，其中我們添加一個shrink參數，使colorbar的長度變短為原來的92%：

3D
首先在進行 3D Plot 時除了導入 matplotlib ，還要額外添加一個模塊，即 Axes 3D 3D 坐標軸顯示：

之後要先定義一個圖像窗口，在窗口上添加3D坐標軸，顯示成下圖：

接下來給進 X 和 Y 值，並將 X 和 Y 編織成柵格。每一個（X, Y）點對應的高度值我們用下面這個函數來計算。

其中，rstride 和 cstride 分別代表 row 和 column 的跨度。
下面兩個圖分別是跨度為1 和 5 的效果：

投影

下面添加 XY 平面的等高線：

如果 zdir 選擇了x，那麼效果將會是對於 XZ 平面的投影，效果如下

5. python圖像處理初學者求助

Pillow是Python里的圖像處理庫（PIL：Python Image Library），提供了了廣泛的文件格式支持，強大的圖像處理能力，主要包括圖像儲存、圖像顯示、格式轉換以及基本的圖像處理操作等。
1）使用 Image 類
PIL最重要的類是 Image class, 你可以通過多種方法創建這個類的實例；你可以從文件載入圖像，或者處理其他圖像, 或者從 scratch 創建。
要從文件載入圖像，可以使用open( )函數，在Image模塊中：

1
2

>>> from PIL import Image
>>> im = Image.open("E:/photoshop/1.jpg")

載入成功後，將返回一個Image對象，可以通過使用示例屬性查看文件內容：

1
2
3

>>> print(im.format, im.size, im.mode)
('JPEG', (600, 351), 'RGB')
>>>

format 這個屬性標識了圖像來源。如果圖像不是從文件讀取它的值就是None。size屬性是一個二元tuple，包含width和height（寬度和高度，單位都是px）。 mode 屬性定義了圖像bands的數量和名稱，以及像素類型和深度。常見的modes 有「L」 (luminance) 表示灰度圖像, 「RGB」表示真彩色圖像, and 「CMYK」表示出版圖像。
如果文件打開錯誤，返回 IOError 錯誤。
只要你有了 Image 類的實例，你就可以通過類的方法處理圖像。比如，下列方法可以顯示圖像：

1

im.show()

2）讀寫圖像
PIL 模塊支持大量圖片格式。使用在 Image 模塊的 open() 函數從磁碟讀取文件。你不需要知道文件格式就能打開它，這個庫能夠根據文件內容自動確定文件格式。要保存文件，使用 Image 類的 save() 方法。保存文件的時候文件名變得重要了。除非你指定格式，否則這個庫將會以文件名的擴展名作為格式保存。
載入文件，並轉化為png格式：

1
2
3
4
5
6
7
8
9
10
11
12
13

"Python Image Library Test"
from PIL import Image
import os
import sys

for infile in sys.argv[1:]:
f,e = os.path.splitext(infile)
outfile = f +".png"
if infile != outfile:
try:
Image.open(infile).save(outfile)
except IOError:
print("Cannot convert", infile)

save() 方法的第二個參數可以指定文件格式。
3）創建縮略圖
縮略圖是網路開發或圖像軟體預覽常用的一種基本技術，使用Python的Pillow圖像庫可以很方便的建立縮略圖，如下：

1
2
3
4
5
6
7

# create thumbnail
size = (128,128)
for infile in glob.glob("E:/photoshop/*.jpg"):
f, ext = os.path.splitext(infile)
img = Image.open(infile)
img.thumbnail(size,Image.ANTIALIAS)
img.save(f+".thumbnail","JPEG")

上段代碼對photoshop下的jpg圖像文件全部創建縮略圖，並保存，glob模塊是一種智能化的文件名匹配技術，在批圖像處理中經常會用到。
注意：Pillow庫不會直接解碼或者載入圖像柵格數據。當你打開一個文件，只會讀取文件頭信息用來確定格式，顏色模式，大小等等，文件的剩餘部分不會主動處理。這意味著打開一個圖像文件的操作十分快速，跟圖片大小和壓縮方式無關。
4）圖像的剪切、粘貼與合並操作
Image 類包含的方法允許你操作圖像部分選區，PIL.Image.Image.crop 方法獲取圖像的一個子矩形選區，如：

1
2
3
4

# crop, paste and merge
im = Image.open("E:/photoshop/lena.jpg")
box = (100,100,300,300)
region = im.crop(box)

矩形選區有一個4元元組定義，分別表示左、上、右、下的坐標。這個庫以左上角為坐標原點，單位是px，所以上訴代碼復制了一個 200×200 pixels 的矩形選區。這個選區現在可以被處理並且粘貼到原圖。

1
2

region = region.transpose(Image.ROTATE_180)
im.paste(region, box)

當你粘貼矩形選區的時候必須保證尺寸一致。此外，矩形選區不能在圖像外。然而你不必保證矩形選區和原圖的顏色模式一致，因為矩形選區會被自動轉換顏色。
5）分離和合並顏色通道
對於多通道圖像，有時候在處理時希望能夠分別對每個通道處理，處理完成後重新合成多通道，在Pillow中，很簡單，如下：

1
2

r,g,b = im.split()
im = Image.merge("RGB", (r,g,b))

對於split（）函數，如果是單通道的，則返回其本身，否則，返回各個通道。
6）幾何變換
對圖像進行幾何變換是一種基本處理，在Pillow中包括resize( )和rotate( )，如用法如下：

1
2

out = im.resize((128,128))
out = im.rotate(45) # degree conter-clockwise

其中，resize( )函數的參數是一個新圖像大小的元祖，而rotate( )則需要輸入順時針的旋轉角度。在Pillow中，對於一些常見的旋轉作了專門的定義：

1
2
3
4
5

out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)

7）顏色空間變換
在處理圖像時，根據需要進行顏色空間的轉換，如將彩色轉換為灰度：

1
2

cmyk = im.convert("CMYK")
gray = im.convert("L")

8）圖像濾波

6. Python深度學習之圖像識別

作者 | 周偉能

來源 | 小叮當講SAS和Python

Python在機器學習（人工智慧，AI）方面有著很大的優勢。談到人工智慧，一般也會談到其實現的語言Python。前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網路，並對未知圖像進行預測。

導入python模塊

導入圖像數據

合並列表數據

將圖片數據轉化為數組

顯示一張圖片

訓練神經網路

我們可以看到測試集的准確率達到99.67%

預測一個圖像

預測為汽車的概率為100%。（括弧內為真實標簽）

預測為美女的概率為100%。（括弧內為真實標簽）

測試集中前15個圖像預測完全正確。Nice!

最後我們來識別單張圖片。

結果預測為汽車。Nice!

最後來預測一下外部隨便下載的汽車或美女圖片

預測為汽車，不錯！

小編這里有10張圖片，前5張為汽車圖片，後五張為美女圖片。

下面進行批量預測：

結果也是完全正確。

看到這里，感覺神經網路是不是很神奇，要想讓神經網路預測得准確，我們就必須給予大量的數據進行訓練模型，優化模型，以至於達到准確識別圖像的目的，圖像識別作為人工智慧的一部分，現在已經慢慢走向成熟，雖然機器也有出錯的時候，但是進過不斷優化，錯誤率將會越來越小，相信機器智能或者人工智慧時代能夠創造出更多智能而美好的東西。為社會，為人類的自由做出更大的貢獻。

7. 怎樣使用Python圖像處理

Python圖像處理是一種簡單易學，功能強大的解釋型編程語言，它有簡潔明了的語法，高效率的高層數據結構，能夠簡單而有效地實現面向對象編程，下文進行對Python圖像處理進行說明。
當然，首先要感謝「戀花蝶」，是他的文章「用Python圖像處理」幫我堅定了用Python和PIL解決問題的想法，對於PIL的一些介紹和基本操作，可以看看這篇文章。我這里主要是介紹點我在使用過程中的經驗。
PIL可以對圖像的顏色進行轉換，並支持諸如24位彩色、8位灰度圖和二值圖等模式，簡單的轉換可以通過Image.convert(mode)函數完成，其中mode表示輸出的顏色模式。例如''L''表示灰度，''1''表示二值圖模式等。
但是利用convert函數將灰度圖轉換為二值圖時，是採用固定的閾值127來實現的，即灰度高於127的像素值為1，而灰度低於127的像素值為0。為了能夠通過自定義的閾值實現灰度圖到二值圖的轉換，就要用到 Image.point函數。
深度剖析Python語法功能
深度說明Python應用程序特點
對Python資料庫進行學習研究
Python開發人員對Python經驗之談
對Python動態類型語言解析

Image.point函數有多種形式，這里只討論Image.point(table, mode)，利用該函數可以通過查表的方式實現像素顏色的模式轉換。其中table為顏色轉換過程中的映射表，每個顏色通道應當有256個元素，而 mode表示所輸出的顏色模式，同樣的，''L''表示灰度，''1''表示二值圖模式。
可見，轉換過程的關鍵在於設計映射表，如果只是需要一個簡單的箝位值，可以將table中高於或低於箝位值的元素分別設為1與0。當然，由於這里的table並沒有什麼特殊要求，所以可以通過對元素的特殊設定實現（0, 255）范圍內，任意需要的一對一映射關系。
示例代碼如下：
import Image # load a color image im = Image.open(''fun.jpg'') # convert to grey level image Lim = im.convert(''L'') Lim.save(''fun_Level.jpg'') # setup a converting table with constant threshold threshold = 80 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) # convert to binary image by the table bim = Lim.point(table, ''1'') bim.save(''fun_binary.jpg'')

IT部分通常要完成的任務相當繁重但支撐這些工作的資源卻很少，這已經成為公開的秘密。任何承諾提高編碼效率、降低軟體總成本的IT解決方案都應該進行周到的考慮。Python圖像處理所具有的一個顯著優勢就是可以在企業的軟體創建和維護階段節約大量資金，而這兩個階段的軟體成本佔到了軟體整個生命周期中總成本的50%到95%。
Python清晰可讀的語法使得軟體代碼具有異乎尋常的易讀性，甚至對那些不是最初接觸和開發原始項目的程序員都能具有這樣的強烈感覺。雖然某些程序員反對在Python代碼中大量使用空格。
不過，幾乎人人都承認Python圖像處理的可讀性遠勝於C或者Java，後兩者都採用了專門的字元標記代碼塊結構、循環、函數以及其他編程結構的開始和結束。提倡Python的人還宣稱，採用這些字元可能會產生顯著的編程風格差異，使得那些負責維護代碼的人遭遇代碼可讀性方面的困難。轉載

8. python可以用來處理圖像嗎

可以的，
PythonWare公司提供了免費的Python圖像處理工具包PIL(Python Image Library),該軟體包提供了基本的圖像處理功能，如：

改變圖像大小，旋轉圖像，圖像格式轉換，色場空間轉換，圖像增強，直方圖處理，插值和濾波等等。雖然在這個軟體包上要實現類似MATLAB中的復雜的圖像處理演算法並不太適合，但是Python的快速開發能力以及面向對象等等諸多特點使得它非常適合用來進行原型開發。

在PIL中，任何一副圖像都是用一個Image對象表示，而這個類由和它同名的模塊導出，因此，最簡單的形式是這樣的：

import Image img = Image.open(「dip.jpg」)
注意：第一行的Image是模塊名；第二行的img是一個Image對象；
Image類是在Image模塊中定義的。關於Image模塊和Image類，切記不要混淆了。現在，我們就可以對img進行各種操作了，所有對img的
操作最終都會反映到到dip.img圖像上。

PIL提供了豐富的功能模塊：Image,ImageDraw,ImageEnhance,ImageFile等等。最常用到的模塊是
Image,ImageDraw,ImageEnhance這三個模塊。下面我對此分別做一介紹。關於其它模塊的使用請參見說明文檔.有關PIL軟體包和
相關的說明文檔可在PythonWare的站點www.Pythonware.com上獲得。

Image模塊：

Image模塊是PIL最基本的模塊，其中導出了Image類，一個Image類實例對象就對應了一副圖像。同時，Image模塊還提供了很多有用的函數。

（1）打開一文件：
import Image img = Image.open(「dip.jpg」)

這將返回一個Image類實例對象，後面的所有的操作都是在img上完成的。

（2）調整文件大小:

import Image img = Image.open("img.jpg") new_img = img.resize
((128,128),Image.BILINEAR) new_img.save("new_img.jpg")

原來的圖像大小是256x256,現在，保存的new_img.jpg的大小是128x128。

就是這么簡單，需要說明的是Image.BILINEAR指定採用雙線性法對像素點插值。

在批處理或者簡單的Python圖像處理任務中，採用Python和PIL（Python Image Library）的組合來完成圖像處理任務是一個很不錯的選擇。設想有一個需要對某個文件夾下的所有圖像將對比度提高2倍的任務。用Python來做將是十分簡單的。當然，我也不得不承認Python在圖像處理方面的功能還比較弱，顯然還不適合用來進行濾波、特徵提取等等一些更為復雜的應用。我個人的觀點是，當你要實現這些「高級」的演算法的時候，好吧，把它交給MATLAB去完成。但是，如果你面對的只是一個通常的不要求很復雜演算法的圖像處理任務，那麼，Python圖像處理應該才是你的最佳搭檔。

9. Python如何圖像識別

首先，先定位好問題是屬於圖像識別任務中的哪一類，最好上傳一張植物葉子的圖片。因為目前基於深度學習的卷積神經網路（CNN）確實在圖像識別任務中取得很好的效果，深度學習屬於機器學習，其研究的範式，或者說處理圖像的步驟大體上是一致的。

1、第一步，准備好數據集，這里是指，需要知道輸入、輸出（視任務而定，針對你這個問題，建議使用有監督模型）是什麼。你可以准備一個文件夾，裡面存放好植物葉子的圖像，而每張圖像對應一個標簽（有病/沒病，或者是多類別標簽，可能具體到哪一種病）。
具體實現中，會將數據集分為三個：訓練集（計算模型參數）、驗證集（調參，這個經常可以不需要實現劃分，在python中可以用scikit-learn中的函數解決。測試集用於驗證模型的效果，與前面兩個的區別是，模型使用訓練集和驗證集時，是同時使用了輸入數據和標簽，而在測試階段，模型是用輸入+模型參數，得到的預測與真實標簽進行對比，進而評估效果。
2、確定圖像識別的任務是什麼？

圖像識別的任務可以分為四個：圖像分類、目標檢測、語義分割、實例分割，有時候是幾個任務的結合。
圖像分類是指以圖像為輸入，輸出對該圖像內容分類的描述，可以是多分類問題，比如貓狗識別。通過足夠的訓練數據（貓和狗的照片-標簽，當然現在也有一系列的方法可以做小樣本訓練，這是細節了，這里並不敞開講），讓計算機/模型輸出這張圖片是貓或者狗，及其概率。當然，如果你的訓練數據還有其它動物，也是可以的，那就是圖像多分類問題。
目標檢測指將圖像或者視頻中的目標與不感興趣的部分區分開，判斷是否存在目標，並確定目標的具體位置。比如，想要確定這只狗所佩戴的眼睛的位置，輸入一張圖片，輸出眼睛的位置（可視化後可以講目標區域框出來）。

看到這里，應該想想植物葉子診斷疾病的問題，只需要輸入一整張植物葉子的圖片，輸出是哪種疾病，還是需要先提取葉子上某些感興趣區域（可能是病變區域），在用病變區域的特徵，對應到具體的疾病？
語義分割是當今計算機視覺領域的關鍵問題之一，宏觀上看，語義分割是一項高層次的任務。其目的是以一些原始圖像作為輸入，輸出具有突出顯示的感興趣的掩膜，其實質上是實現了像素級分類。對於輸入圖片，輸出其舌頭區域（注意可以是不規則的，甚至不連續的）。

而實例分割，可以說是在語義分割的基礎上，在像素層面給出屬於每個實例的像素。

看到這里，可以具體思考下自己的問題是對應其中的哪一類問題，或者是需要幾種任務的結合。

3、實際操作
可以先通過一個簡單的例子入手，先了解構建這一個框架需要准備什麼。手寫數字識別可以說是深度學習的入門數據集，其任務也經常作為該領域入門的案例，也可以自己在網上尋找。

導航:首頁 > 編程語言 > python圖像任務

python圖像任務

與python圖像任務相關的資料