超全python圖像處理_Python如何圖像識別

㈠怎麼用python進行簡單的圖像處理

所謂簡單的圖像處理，就是對像素數據進行點處理。
下面是具體步驟。
讀取圖片：
# -*- coding: utf-8 -*-
import cv2
import numpy as np
img = cv2.imread("C:/Users/Administrator/Desktop/ball.png")
cv2.imshow("a",img)
cv2.waitKey(0)
cv2.imshow("a",img)
打開一個圖片窗口。
python讀取圖片，實際上是讀取了離散的圖片數據：
print(img)
運行，就會給出圖片數據。
顯示反色圖片，只要進行簡單的計算：
255-img
這是2*img的效果。
分離通道，圖片的第一個通道是：
img[:,:,0]
成圖是灰度圖。
第二個通道的灰度圖：
img[:,:,1]
第三個通道的灰度圖：
img[:,:,2]

㈡ python處理圖片數據

目錄

1.機器是如何存儲圖像的？

2.在Python中讀取圖像數據

3.從圖像數據中提取特徵的方法#1：灰度像素值特徵

4.從圖像數據中提取特徵的方法#2：通道的平均像素值

5.從圖像數據中提取特徵的方法#3：提取邊緣
是一張數字8的圖像，仔細觀察就會發現，圖像是由小方格組成的。這些小方格被稱為像素。

但是要注意，人們是以視覺的形式觀察圖像的，可以輕松區分邊緣和顏色，從而識別圖片中的內容。然而機器很難做到這一點，它們以數字的形式存儲圖像。請看下圖：

機器以數字矩陣的形式儲存圖像，矩陣大小取決於任意給定圖像的像素數。

假設圖像的尺寸為180 x 200或n x m，這些尺寸基本上是圖像中的像素數（高x寬）。

這些數字或像素值表示像素的強度或亮度，較小的數字（接近0）表示黑色，較大的數字（接近255）表示白色。通過分析下面的圖像，讀者就會弄懂到目前為止所學到的知識。

下圖的尺寸為22 x 16，讀者可以通過計算像素數來驗證：

圖片源於機器學習應用課程

剛才討論的例子是黑白圖像，如果是生活中更為普遍的彩色呢？你是否認為彩色圖像也以2D矩陣的形式存儲？

彩色圖像通常由多種顏色組成，幾乎所有顏色都可以從三原色（紅色，綠色和藍色）生成。

因此，如果是彩色圖像，則要用到三個矩陣（或通道）——紅、綠、藍。每個矩陣值介於0到255之間，表示該像素的顏色強度。觀察下圖來理解這個概念：

圖片源於機器學習應用課程

左邊有一幅彩色圖像（人類可以看到），而在右邊，紅綠藍三個顏色通道對應三個矩陣，疊加三個通道以形成彩色圖像。

請注意，由於原始矩陣非常大且可視化難度較高，因此這些不是給定圖像的原始像素值。此外，還可以用各種其他的格式來存儲圖像，RGB是最受歡迎的，所以筆者放到這里。讀者可以在此處閱讀更多關於其他流行格式的信息。

用Python讀取圖像數據

下面開始將理論知識付諸實踐。啟動Python並載入圖像以觀察矩陣：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from skimage.io import imread, imshow
image = imread('image_8_original.png', as_gray=True)
imshow(image)

#checking image shape
image.shape, image

（28，28）

矩陣有784個值，而且這只是整個矩陣的一小部分。用一個LIVE編碼窗口，不用離開本文就可以運行上述所有代碼並查看結果。

下面來深入探討本文背後的核心思想，並探索使用像素值作為特徵的各種方法。

方法#1：灰度像素值特徵

從圖像創建特徵最簡單的方法就是將原始的像素用作單獨的特徵。

考慮相同的示例，就是上面那張圖（數字『8』），圖像尺寸為28×28。

能猜出這張圖片的特徵數量嗎？答案是與像素數相同！也就是有784個。

那麼問題來了，如何安排這784個像素作為特徵呢？這樣，可以簡單地依次追加每個像素值從而生成特徵向量。如下圖所示：

下面來用Python繪制圖像，並為該圖像創建這些特徵：

image = imread('puppy.jpeg', as_gray=True)

image.shape, imshow(image)

（650，450）

該圖像尺寸為650×450，因此特徵數量應為297,000。可以使用NumPy中的reshape函數生成，在其中指定圖像尺寸：

#pixel features

features = np.reshape(image, (660*450))

features.shape, features

(297000,)
array([0.96470588, 0.96470588, 0.96470588, ..., 0.96862745, 0.96470588,
0.96470588])

這里就得到了特徵——長度為297,000的一維數組。很簡單吧？在實時編碼窗口中嘗試使用此方法提取特徵。

但結果只有一個通道或灰度圖像，對於彩色圖像是否也可以這樣呢？來看看吧！

方法#2：通道的平均像素值

在讀取上一節中的圖像時，設置了參數『as_gray = True』，因此在圖像中只有一個通道，可以輕松附加像素值。下面刪除參數並再次載入圖像：

image = imread('puppy.jpeg')
image.shape

(660, 450, 3)

這次，圖像尺寸為（660，450，3），其中3為通道數量。可以像之前一樣繼續創建特徵，此時特徵數量將是660*450*3 = 891,000。

或者，可以使用另一種方法：

生成一個新矩陣，這個矩陣具有來自三個通道的像素平均值，而不是分別使用三個通道中的像素值。

下圖可以讓讀者更清楚地了解這一思路：

這樣一來，特徵數量保持不變，並且還能考慮來自圖像全部三個通道的像素值。

image = imread('puppy.jpeg')
feature_matrix = np.zeros((660,450))
feature_matrix.shape

(660, 450)

現有一個尺寸為（660×450×3）的三維矩陣，其中660為高度，450為寬度，3是通道數。為獲取平均像素值，要使用for循環：

for i in range(0,iimage.shape[0]):
for j in range(0,image.shape[1]):
feature_matrix[i][j] = ((int(image[i,j,0]) + int(image[i,j,1]) + int(image[i,j,2]))/3)

新矩陣具有相同的高度和寬度，但只有一個通道。現在，可以按照與上一節相同的步驟進行操作。依次附加像素值以獲得一維數組：

features = np.reshape(feature_matrix, (660*450))
features.shape

(297000,)

方法#3：提取邊緣特徵

請思考，在下圖中，如何識別其中存在的對象：

識別出圖中的對象很容易——狗、汽車、還有貓，那麼在區分的時候要考慮哪些特徵呢？形狀是一個重要因素，其次是顏色，或者大小。如果機器也能像這樣識別形狀會怎麼樣？

類似的想法是提取邊緣作為特徵並將其作為模型的輸入。稍微考慮一下，要如何識別圖像中的邊緣呢？邊緣一般都是顏色急劇變化的地方，請看下圖：

筆者在這里突出了兩個邊緣。這兩處邊緣之所以可以被識別是因為在圖中，可以分別看到顏色從白色變為棕色，或者由棕色變為黑色。如你所知，圖像以數字的形式表示，因此就要尋找哪些像素值發生了劇烈變化。

假設圖像矩陣如下：

圖片源於機器學習應用課程

該像素兩側的像素值差異很大，於是可以得出結論，該像素處存在顯著的轉變，因此其為邊緣。現在問題又來了，是否一定要手動執行此步驟？

當然不！有各種可用於突出顯示圖像邊緣的內核，剛才討論的方法也可以使用Prewitt內核（在x方向上）來實現。以下是Prewitt內核：

獲取所選像素周圍的值，並將其與所選內核（Prewitt內核）相乘，然後可以添加結果值以獲得最終值。由於±1已經分別存在於兩列之中，因此添加這些值就相當於獲取差異。

還有其他各種內核，下面是四種最常用的內核：

圖片源於機器學習應用課程

現在回到筆記本，為同一圖像生成邊緣特徵：

#importing the required libraries
import numpy as np
from skimage.io import imread, imshow
from skimage.filters import prewitt_h,prewitt_v
import matplotlib.pyplot as plt
%matplotlib inline

#reading the image
image = imread('puppy.jpeg',as_gray=True)

#calculating horizontal edges using prewitt kernel
edges_prewitt_horizontal = prewitt_h(image)
#calculating vertical edges using prewitt kernel
edges_prewitt_vertical = prewitt_v(image)

imshow(edges_prewitt_vertical, cmap='gray')

㈢ Python圖像處理

創建一個簡單的圖像與圖像混合
1.1 在Image模塊中，提供了創建圖像的方法。主要是通過**Image.new(mode, size, color)**實現，該方法傳入三個參數：
mode：圖像的創建模式
size：圖像的大小
color：圖像的顏色
用該方法可以創建一個簡單的圖像，之後我們可以通過save方法將圖像保存：
1.2生成圖片如下
1.3 圖像混合
透明度混合
透明度混合主要是使用**Image中的blend(im1, im2, alpha)**方法，對該方法的解釋如下：
im1：Image對象，在混合的過程中，透明度設置為（1-apha）
im2：Image對象，在混合的過程中，透明度設置為（apha）
alpha：透明度，取值是0-1。當透明度為0是，顯示im1對象；當透明度為1時，顯示im2對象
代碼實現如下
1.4原圖和混合圖的對比
1.5 遮罩混合
通過Image.composite(im1, im2, mask)方法實現遮罩混合。三個參數都是Image對象，該方法的作用就是使用mask來混合im1和im2。
1.6im1、im2和遮罩混合效果對比如下

㈣有哪些Python圖像處理方面的文章或實例

例如：
Image-Py/imagepy
首先是基礎理論，涉及到數學，概率，信號處理，機器學習等領域。基礎只能慢慢積累。至於工具，入門的有PIL，但是PIL對底層像素操作支持的不好，只適合做效果。python科學計算，Numpy是基礎，然後是Scipy，Scipy裡麵包含了很多科學計算方面的函數模塊，其中有一個ndimage，裡面實現了圖像處理的一些經典方法，然後是scikit-image，opencv等大而全的圖像處理庫，ITK等某一領域專用的類庫，可視化可以用matplotlib，三維的可以用vtk或mayavi。最後強烈推薦我個人的開源項目，ImagePy，可以對任何一個基於Numpy的函數，提供界面和交互支持，非常適合學習與研究。

㈤ python數字圖像處理去除橫紋

題主是否想詢問「python數字圖像處理能去除橫紋嗎」？能。軟體Python的數字圖像處理功能，能根據要求更改圖片橫紋度。Python由荷蘭數學和計算機科學研究學會的吉多范羅蘇姆於1990年代初設計，作為一門叫做ABC語言的替代品。

㈥常用的十大python圖像處理工具

原文標題：10 Python image manipulation tools.
作者 | Parul Pandey
翻譯 | 安其羅喬爾、JimmyHua
今天，在我們的世界裡充滿了數據，圖像成為構成這些數據的重要組成部分。但無論是用於何種用途，這些圖像都需要進行處理。圖像處理就是分析和處理數字圖像的過程，主要旨在提高其質量或從中提取一些信息，然後可以將其用於某種用途。
圖像處理中的常見任務包括顯示圖像，基本操作如裁剪、翻轉、旋轉等，圖像分割，分類和特徵提取，圖像恢復和圖像識別。Python成為這種圖像處理任務是一個恰當選擇，這是因為它作為一種科學編程語言正在日益普及，並且在其生態系統中免費提供許多最先進的圖像處理工具供大家使用。
讓我們看一下可以用於圖像處理任務中的常用 Python 庫有哪些吧。

1.scikit-image
scikit-image是一個開源的Python包，適用於numpy數組。它實現了用於研究，教育和工業應用的演算法和實用工具。即使是那些剛接觸Python生態系統的人，它也是一個相當簡單直接的庫。此代碼是由活躍的志願者社區編寫的，具有高質量和同行評審的性質。
資源
文檔里記錄了豐富的例子和實際用例，閱讀下面的文檔：
http://scikit-image.org/docs/stable/user_guide.html
用法
該包作為skimage導入，大多數功能都在子模塊中找的到。下面列舉一些skimage的例子：
圖像過濾

使用match_template函數進行模板匹配

你可以通過此處查看圖庫找到更多示例。
2. Numpy
Numpy是Python編程的核心庫之一，並為數組提供支持。圖像本質上是包含數據點像素的標准Numpy數組。因此，我們可以通過使用基本的NumPy操作，例如切片、掩膜和花式索引，來修改圖像的像素值。可以使用skimage載入圖像並使用matplotlib顯示圖像。
資源
Numpy的官方文檔頁面提供了完整的資源和文檔列表：
http://www.numpy.org/
用法
使用Numpy來掩膜圖像.

3.Scipy
scipy是Python的另一個類似Numpy的核心科學模塊，可用於基本的圖像操作和處理任務。特別是子模塊scipy.ndimage，提供了在n維NumPy數組上操作的函數。該包目前包括線性和非線性濾波，二值形態學，B樣條插值和對象測量等功能函數。
資源
有關scipy.ndimage包提供的完整功能列表，請參閱下面的鏈接：
https://docs.scipy.org/doc/scipy/reference/tutorial/ndimage.html#correlation-and-convolution
用法
使用SciPy通過高斯濾波器進行模糊：

4. PIL/ Pillow
PIL( Python圖像庫 )是Python編程語言的一個免費庫，它支持打開、操作和保存許多不同的文件格式的圖像。然而，隨著2009年的最後一次發布，它的開發停滯不前。但幸運的是還有有Pillow，一個PIL積極開發的且更容易安裝的分支，它能運行在所有主要的操作系統，並支持Python3。這個庫包含了基本的圖像處理功能，包括點運算、使用一組內置卷積核的濾波和色彩空間的轉換。
資源
文檔中有安裝說明，以及涵蓋庫的每個模塊的示例：
https://pillow.readthedocs.io/en/3.1.x/index.html
用法
在 Pillow 中使用 ImageFilter 增強圖像：

5. OpenCV-Python
OpenCV( 開源計算機視覺庫 )是計算機視覺應用中應用最廣泛的庫之一。OpenCV-Python 是OpenCV的python版API。OpenCV-Python的優點不只有高效，這源於它的內部組成是用C/C++編寫的，而且它還容易編寫和部署（因為前端是用Python包裝的）。這使得它成為執行計算密集型計算機視覺程序的一個很好的選擇。
資源
OpenCV-Python-Guide指南可以讓你使用OpenCV-Python更容易：
https://github.com/abidrahmank/OpenCV2-Python-Tutorials
用法
下面是一個例子，展示了OpenCV-Python使用金字塔方法創建一個名為「Orapple」的新水果圖像融合的功能。

6. SimpleCV
SimpleCV 也是一個用於構建計算機視覺應用程序的開源框架。有了它，你就可以訪問幾個高性能的計算機視覺庫，如OpenCV，而且不需要先學習了解位深度、文件格式、顏色空間等。
它的學習曲線大大小於OpenCV，正如它們的口號所說「計算機視覺變得簡單」。一些支持SimpleCV的觀點有：
即使是初學者也可以編寫簡單的機器視覺測試攝像機、視頻文件、圖像和視頻流都是可互操作的資源
官方文檔非常容易理解，而且有大量的例子和使用案例去學習：
https://simplecv.readthedocs.io/en/latest/
用法

7. Mahotas
Mahotas 是另一個計算機視覺和圖像處理的Python庫。它包括了傳統的圖像處理功能例如濾波和形態學操作以及更現代的計算機視覺功能用於特徵計算，包括興趣點檢測和局部描述符。該介面是Python語言，適合於快速開發，但是演算法是用C語言實現的，並根據速度進行了調優。Mahotas庫速度快，代碼簡潔，甚至具有最小的依賴性。通過原文閱讀它們的官方論文以獲得更多的了解。
資源
文檔包括安裝指導，例子，以及一些教程，可以更好的幫助你開始使用mahotas。
https://mahotas.readthedocs.io/en/latest/install.html
用法
Mahotas庫依賴於使用簡單的代碼來完成任務。關於『Finding Wally』的問題，Mahotas做的很好並且代碼量很少。下面是源碼：
https://mahotas.readthedocs.io/en/latest/wally.html

8. SimpleITK
ITK 或者 Insight Segmentation and Registration Toolkit是一個開源的跨平台系統，為開發人員提供了一套廣泛的圖像分析軟體工具。其中, SimpleITK是建立在ITK之上的簡化層，旨在促進其在快速原型設計、教育、解釋語言中的應用。SimpleITK 是一個圖像分析工具包，包含大量支持一般過濾操作、圖像分割和匹配的組件。SimpleITK本身是用C++寫的，但是對於包括Python以內的大部分編程語言都是可用的。
資源
大量的Jupyter Notebooks 表明了SimpleITK在教育和研究領域已經被使用。Notebook展示了用Python和R編程語言使用SimpleITK來進行互動式圖像分析。
http://insightsoftwareconsortium.github.io/SimpleITK-Notebooks/
用法
下面的動畫是用SimpleITK和Python創建的剛性CT/MR匹配過程的可視化。點擊此處可查看源碼！

9. pgmagick
pgmagick是GraphicsMagick庫的一個基於python的包裝。 GraphicsMagick圖像處理系統有時被稱為圖像處理的瑞士軍刀。它提供了一個具有強大且高效的工具和庫集合，支持以88種主要格式(包括重要格式，如DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF)讀取、寫入和操作圖像。
資源
有一個專門用於PgMagick的Github庫，其中包含安裝和需求說明。還有關於這個的一個詳細的用戶指導：
https://github.com/hhatto/pgmagick
用法
使用pgmagick可以進行的圖像處理活動很少，比如：
圖像縮放

邊緣提取

10. Pycairo
Pycairo是圖像處理庫cairo的一組Python捆綁。Cairo是一個用於繪制矢量圖形的2D圖形庫。矢量圖形很有趣，因為它們在調整大小或轉換時不會失去清晰度。Pycairo是cairo的一組綁定，可用於從Python調用cairo命令。
資源
Pycairo的GitHub庫是一個很好的資源，有關於安裝和使用的詳細說明。還有一個入門指南，其中有一個關於Pycairo的簡短教程。
庫：https://github.com/pygobject/pycairo指南：https://pycairo.readthedocs.io/en/latest/tutorial.html用法
使用Pycairo繪制線條、基本形狀和徑向梯度：

總結
有一些有用且免費的Python圖像處理庫可以使用，有的是眾所周知的，有的可能對你來說是新的，試著多去了解它們。

㈦ python：PIL圖像處理

PIL (Python Imaging Library)

Python圖像處理庫，該庫支持多種文件格式，提供強大的圖像處理功能。

PIL中最重要的類是Image類，該類在Image模塊中定義。

從文件載入圖像：

如果成功，這個函數返回一個Image對象。現在你可以使用該對象的屬性來探索文件的內容。

format 屬性指定了圖像文件的格式，如果圖像不是從文件中載入的則為 None 。
size 屬性是一個2個元素的元組，包含圖像寬度和高度（像素）。
mode 屬性定義了像素格式，常用的像素格式為：「L」 (luminance) - 灰度圖, 「RGB」 , 「CMYK」。

如果文件打開失敗, 將拋出IOError異常。

一旦你擁有一個Image類的實例，你就可以用該類定義的方法操作圖像。比如：顯示

( show() 的標准實現不是很有效率，因為它將圖像保存到一個臨時文件，然後調用外部工具（比如系統的默認圖片查看軟體）顯示圖像。該函數將是一個非常方便的調試和測試工具。)

接下來的部分展示了該庫提供的不同功能。

PIL支持多種圖像格式。從磁碟中讀取文件，只需使用 Image 模塊中的 open 函數。不需要提供文件的圖像格式。PIL庫將根據文件內容自動檢測。

如果要保存到文件，使用 Image 模塊中的 save 函數。當保存文件時，文件名很重要，除非指定格式，否則PIL庫將根據文件的擴展名來決定使用哪種格式保存。

** 轉換文件到JPEG **

save 函數的第二個參數可以指定使用的文件格式。如果文件名中使用了一個非標準的擴展名，則必須通過第二個參數來指定文件格式。

** 創建JPEG縮略圖 **

需要注意的是，PIL只有在需要的時候才載入像素數據。當你打開一個文件時，PIL只是讀取文件頭獲得文件格式、圖像模式、圖像大小等屬性，而像素數據只有在需要的時候才會載入。

這意味著打開一個圖像文件是一個非常快的操作，不會受文件大小和壓縮演算法類型的影響。

** 獲得圖像信息 **

Image 類提供了某些方法，可以操作圖像的子區域。提取圖像的某個子區域，使用 crop() 函數。

** 復制圖像的子區域 **

定義區域使用一個包含4個元素的元組，(left, upper, right, lower)。坐標原點位於左上角。上面的例子提取的子區域包含300x300個像素。

該區域可以做接下來的處理然後再粘貼回去。

** 處理子區域然後粘貼回去 **

當往回粘貼時，區域的大小必須和參數匹配。另外區域不能超出圖像的邊界。然而原圖像和區域的顏色模式無需匹配。區域會自動轉換。

** 滾動圖像 **

paste() 函數有個可選參數，接受一個掩碼圖像。掩碼中255表示指定位置為不透明，0表示粘貼的圖像完全透明，中間的值表示不同級別的透明度。

PIL允許分別操作多通道圖像的每個通道，比如RGB圖像。 split() 函數創建一個圖像集合，每個圖像包含一個通道。 merge() 函數接受一個顏色模式和一個圖像元組，然後將它們合並為一個新的圖像。接下來的例子交換了一個RGB圖像的三個通道。

** 分離和合並圖像通道 **

對於單通道圖像， split() 函數返回圖像本身。如果想處理各個顏色通道，你可能需要先將圖像轉為RGB模式。

resize() 函數接受一個元組，指定圖像的新大小。
rotate() 函數接受一個角度值，逆時針旋轉。

** 基本幾何變換 **

圖像旋轉90度也可以使用 transpose() 函數。 transpose() 函數也可以水平或垂直翻轉圖像。

** transpose **

transpose() 和 rotate() 函數在性能和結果上沒有區別。

更通用的圖像變換函數為 transform() 。

PIL可以轉換圖像的像素模式。

** 轉換顏色模式 **

PIL庫支持從其他模式轉為「L」或「RGB」模式，其他模式之間轉換，則需要使用一個中間圖像，通常是「RGB」圖像。

ImageFilter 模塊包含多個預定義的圖像增強過濾器用於 filter() 函數。

** 應用過濾器 **

point() 函數用於操作圖像的像素值。該函數通常需要傳入一個函數對象，用於操作圖像的每個像素：

** 應用點操作 **

使用以上技術可以快速地對圖像像素應用任何簡單的表達式。可以結合 point() 函數和 paste 函數修改圖像。

** 處理圖像的各個通道 **

注意用於創建掩碼圖像的語法：

Python計算邏輯表達式採用短路方式，即：如果and運算符左側為false，就不再計算and右側的表達式，而且返回結果是表達式的結果。比如 a and b 如果a為false則返回a，如果a為true則返回b，詳見Python語法。

對於更多高級的圖像增強功能，可以使用 ImageEnhance 模塊中的類。

可以調整圖像對比度、亮度、色彩平衡、銳度等。

** 增強圖像 **

PIL庫包含對圖像序列（動畫格式）的基本支持。支持的序列格式包括 FLI/FLC 、 GIF 和一些實驗性的格式。 TIFF 文件也可以包含多個幀。

當打開一個序列文件時，PIL庫自動載入第一幀。你可以使用 seek() 函數 tell() 函數在不同幀之間移動。

** 讀取序列 **

如例子中展示的，當序列到達結尾時，將拋出EOFError異常。

注意當前版本的庫中多數底層驅動只允許seek到下一幀。如果想回到前面的幀，只能重新打開圖像。

以下迭代器類允許在for語句中循環遍歷序列：

** 一個序列迭代器類 **

PIL庫包含一些函數用於將圖像、文本列印到Postscript列印機。以下是一個簡單的例子。

** 列印到Postscript **

如前所述，可以使用 open() 函數打開圖像文件，通常傳入一個文件名作為參數：

如果打開成功，返回一個Image對象，否則拋出IOError異常。

也可以使用一個file-like object代替文件名（暫可以理解為文件句柄）。該對象必須實現read，seek，tell函數，必須以二進制模式打開。

** 從文件句柄打開圖像 **

如果從字元串數據中讀取圖像，使用StringIO類：

** 從字元串中讀取 **

如果圖像文件內嵌在一個大文件里，比如 tar 文件中。可以使用ContainerIO或TarIO模塊來訪問。

** 從tar文檔中讀取 **

** 該小節不太理解，請參考原文 **

有些解碼器允許當讀取文件時操作圖像。通常用於在創建縮略圖時加速解碼（當速度比質量重要時）和輸出一個灰度圖到激光列印機時。

draft() 函數。

** Reading in draft mode **

輸出類似以下內容：

注意結果圖像可能不會和請求的模式和大小匹配。如果要確保圖像不大於指定的大小，請使用 thumbnail 函數。

Python2.7 教程 PIL
http://www.liaoxuefeng.com/wiki//

Python 之使用 PIL 庫做圖像處理
http://www.cnblogs.com/way_testlife/archive/2011/04/17/2019013.html

來自 http://effbot.org/imagingbook/introction.htm

㈧ Python如何圖像識別

首先，先定位好問題是屬於圖像識別任務中的哪一類，最好上傳一張植物葉子的圖片。因為目前基於深度學習的卷積神經網路（CNN）確實在圖像識別任務中取得很好的效果，深度學習屬於機器學習，其研究的範式，或者說處理圖像的步驟大體上是一致的。

1、第一步，准備好數據集，這里是指，需要知道輸入、輸出（視任務而定，針對你這個問題，建議使用有監督模型）是什麼。你可以准備一個文件夾，裡面存放好植物葉子的圖像，而每張圖像對應一個標簽（有病/沒病，或者是多類別標簽，可能具體到哪一種病）。
具體實現中，會將數據集分為三個：訓練集（計算模型參數）、驗證集（調參，這個經常可以不需要實現劃分，在python中可以用scikit-learn中的函數解決。測試集用於驗證模型的效果，與前面兩個的區別是，模型使用訓練集和驗證集時，是同時使用了輸入數據和標簽，而在測試階段，模型是用輸入+模型參數，得到的預測與真實標簽進行對比，進而評估效果。
2、確定圖像識別的任務是什麼？

圖像識別的任務可以分為四個：圖像分類、目標檢測、語義分割、實例分割，有時候是幾個任務的結合。
圖像分類是指以圖像為輸入，輸出對該圖像內容分類的描述，可以是多分類問題，比如貓狗識別。通過足夠的訓練數據（貓和狗的照片-標簽，當然現在也有一系列的方法可以做小樣本訓練，這是細節了，這里並不敞開講），讓計算機/模型輸出這張圖片是貓或者狗，及其概率。當然，如果你的訓練數據還有其它動物，也是可以的，那就是圖像多分類問題。
目標檢測指將圖像或者視頻中的目標與不感興趣的部分區分開，判斷是否存在目標，並確定目標的具體位置。比如，想要確定這只狗所佩戴的眼睛的位置，輸入一張圖片，輸出眼睛的位置（可視化後可以講目標區域框出來）。

看到這里，應該想想植物葉子診斷疾病的問題，只需要輸入一整張植物葉子的圖片，輸出是哪種疾病，還是需要先提取葉子上某些感興趣區域（可能是病變區域），在用病變區域的特徵，對應到具體的疾病？
語義分割是當今計算機視覺領域的關鍵問題之一，宏觀上看，語義分割是一項高層次的任務。其目的是以一些原始圖像作為輸入，輸出具有突出顯示的感興趣的掩膜，其實質上是實現了像素級分類。對於輸入圖片，輸出其舌頭區域（注意可以是不規則的，甚至不連續的）。

而實例分割，可以說是在語義分割的基礎上，在像素層面給出屬於每個實例的像素。

看到這里，可以具體思考下自己的問題是對應其中的哪一類問題，或者是需要幾種任務的結合。

3、實際操作
可以先通過一個簡單的例子入手，先了解構建這一個框架需要准備什麼。手寫數字識別可以說是深度學習的入門數據集，其任務也經常作為該領域入門的案例，也可以自己在網上尋找。

㈨ 10 個 Python 圖像編輯工具

以下提到的這些 Python 工具在編輯圖像、操作圖像底層數據方面都提供了簡單直接的方法。

-- Parul Pandey

當今的世界充滿了數據，而圖像數據就是其中很重要的一部分。但只有經過處理和分析，提高圖像的質量，從中提取出有效地信息，才能利用到這些圖像數據。

常見的圖像處理操作包括顯示圖像，基本的圖像操作，如裁剪、翻轉、旋轉；圖像的分割、分類、特徵提取；圖像恢復；以及圖像識別等等。Python 作為一種日益風靡的科學編程語言，是這些圖像處理操作的最佳選擇。同時，在 Python 生態當中也有很多可以免費使用的優秀的圖像處理工具。

下文將介紹 10 個可以用於圖像處理任務的 Python 庫，它們在編輯圖像、查看圖像底層數據方面都提供了簡單直接的方法。

scikit-image 是一個結合 NumPy 數組使用的開源 Python 工具，它實現了可用於研究、教育、工業應用的演算法和應用程序。即使是對於剛剛接觸 Python 生態圈的新手來說，它也是一個在使用上足夠簡單的庫。同時它的代碼質量也很高，因為它是由一個活躍的志願者社區開發的，並且通過了同行評審(peer review)。

scikit-image 的文檔非常完善，其中包含了豐富的用例。

可以通過導入 skimage 使用，大部分的功能都可以在它的子模塊中找到。

圖像濾波(image filtering)：

使用 match_template() 方法實現模板匹配(template matching)：

在展示頁面可以看到更多相關的例子。

NumPy 提供了對數組的支持，是 Python 編程的一個核心庫。圖像的本質其實也是一個包含像素數據點的標准 NumPy 數組，因此可以通過一些基本的 NumPy 操作（例如切片、掩膜(mask)、花式索引(fancy indexing)等），就可以從像素級別對圖像進行編輯。通過 NumPy 數組存儲的圖像也可以被 skimage 載入並使用 matplotlib 顯示。

在 NumPy 的官方文檔中提供了完整的代碼文檔和資源列表。

使用 NumPy 對圖像進行掩膜(mask)操作：

像 NumPy 一樣， SciPy 是 Python 的一個核心科學計算模塊，也可以用於圖像的基本操作和處理。尤其是 SciPy v1.1.0 中的 scipy.ndimage 子模塊，它提供了在 n 維 NumPy 數組上的運行的函數。SciPy 目前還提供了線性和非線性濾波(linear and non-linear filtering)、二值形態學(binary morphology)、 B 樣條插值(B-spline interpolation)、對象測量(object measurements)等方面的函數。

在官方文檔中可以查閱到 scipy.ndimage 的完整函數列表。

使用 SciPy 的高斯濾波對圖像進行模糊處理：

PIL (Python Imaging Library) 是一個免費 Python 編程庫，它提供了對多種格式圖像文件的打開、編輯、保存的支持。但在 2009 年之後 PIL 就停止發布新版本了。幸運的是，還有一個 PIL 的積極開發的分支 Pillow ，它的安裝過程比 PIL 更加簡單，支持大部分主流的操作系統，並且還支持 Python 3。Pillow 包含了圖像的基礎處理功能，包括像素點操作、使用內置卷積內核進行濾波、顏色空間轉換等等。

Pillow 的官方文檔提供了 Pillow 的安裝說明自己代碼庫中每一個模塊的示例。

使用 Pillow 中的 ImageFilter 模塊實現圖像增強：

OpenCV（Open Source Computer Vision 庫）是計算機視覺領域最廣泛使用的庫之一， OpenCV-Python 則是 OpenCV 的 Python API。OpenCV-Python 的運行速度很快，這歸功於它使用 C/C++ 編寫的後台代碼，同時由於它使用了 Python 進行封裝，因此調用和部署的難度也不大。這些優點讓 OpenCV-Python 成為了計算密集型計算機視覺應用程序的一個不錯的選擇。

入門之前最好先閱讀 OpenCV2-Python-Guide 這份文檔。

使用 OpenCV-Python 中的金字塔融合(Pyramid Blending)將蘋果和橘子融合到一起：

SimpleCV 是一個開源的計算機視覺框架。它支持包括 OpenCV 在內的一些高性能計算機視覺庫，同時不需要去了解位深度(bit depth)、文件格式、色彩空間(color space)之類的概念，因此 SimpleCV 的學習曲線要比 OpenCV 平緩得多，正如它的口號所說，「將計算機視覺變得更簡單」。SimpleCV 的優點還有：

官方文檔簡單易懂，同時也附有大量的學慣用例。

文檔包含了安裝介紹、示例以及一些 Mahotas 的入門教程。

Mahotas 力求使用少量的代碼來實現功能。例如這個 Finding Wally 游戲：

ITK （Insight Segmentation and Registration Toolkit）是一個為開發者提供普適性圖像分析功能的開源、跨平台工具套件， SimpleITK 則是基於 ITK 構建出來的一個簡化層，旨在促進 ITK 在快速原型設計、教育、解釋語言中的應用。SimpleITK 作為一個圖像分析工具包，它也帶有大量的組件，可以支持常規的濾波、圖像分割、圖像配准(registration)功能。盡管 SimpleITK 使用 C++ 編寫，但它也支持包括 Python 在內的大部分編程語言。

有很多 Jupyter Notebooks 用例可以展示 SimpleITK 在教育和科研領域中的應用，通過這些用例可以看到如何使用 Python 和 R 利用 SimpleITK 來實現互動式圖像分析。

使用 Python + SimpleITK 實現的 CT/MR 圖像配准過程：

pgmagick 是使用 Python 封裝的 GraphicsMagick 庫。 GraphicsMagick 通常被認為是圖像處理界的瑞士軍刀，因為它強大而又高效的工具包支持對多達 88 種主流格式圖像文件的讀寫操作，包括 DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM、TIFF 等等。

pgmagick 的 GitHub 倉庫中有相關的安裝說明、依賴列表，以及詳細的使用指引。

圖像縮放：

邊緣提取：

Cairo 是一個用於繪制矢量圖的二維圖形庫，而 Pycairo 是用於 Cairo 的一組 Python 綁定。矢量圖的優點在於做大小縮放的過程中不會丟失圖像的清晰度。使用 Pycairo 可以在 Python 中調用 Cairo 的相關命令。

Pycairo 的 GitHub 倉庫提供了關於安裝和使用的詳細說明，以及一份簡要介紹 Pycairo 的入門指南。

使用 Pycairo 繪制線段、基本圖形、徑向漸變(radial gradients)：

以上就是 Python 中的一些有用的圖像處理庫，無論你有沒有聽說過、有沒有使用過，都值得試用一下並了解它們。

via: https://opensource.com/article/19/3/python-image-manipulation-tools

作者： Parul Pandey 選題： lujun9972 譯者： HankChow 校對： wxy

㈩ python圖像處理初學者求助

Pillow是Python里的圖像處理庫（PIL：Python Image Library），提供了了廣泛的文件格式支持，強大的圖像處理能力，主要包括圖像儲存、圖像顯示、格式轉換以及基本的圖像處理操作等。
1）使用 Image 類
PIL最重要的類是 Image class, 你可以通過多種方法創建這個類的實例；你可以從文件載入圖像，或者處理其他圖像, 或者從 scratch 創建。
要從文件載入圖像，可以使用open( )函數，在Image模塊中：

1
2

>>> from PIL import Image
>>> im = Image.open("E:/photoshop/1.jpg")

載入成功後，將返回一個Image對象，可以通過使用示例屬性查看文件內容：

1
2
3

>>> print(im.format, im.size, im.mode)
('JPEG', (600, 351), 'RGB')
>>>

format 這個屬性標識了圖像來源。如果圖像不是從文件讀取它的值就是None。size屬性是一個二元tuple，包含width和height（寬度和高度，單位都是px）。 mode 屬性定義了圖像bands的數量和名稱，以及像素類型和深度。常見的modes 有「L」 (luminance) 表示灰度圖像, 「RGB」表示真彩色圖像, and 「CMYK」表示出版圖像。
如果文件打開錯誤，返回 IOError 錯誤。
只要你有了 Image 類的實例，你就可以通過類的方法處理圖像。比如，下列方法可以顯示圖像：

1

im.show()

2）讀寫圖像
PIL 模塊支持大量圖片格式。使用在 Image 模塊的 open() 函數從磁碟讀取文件。你不需要知道文件格式就能打開它，這個庫能夠根據文件內容自動確定文件格式。要保存文件，使用 Image 類的 save() 方法。保存文件的時候文件名變得重要了。除非你指定格式，否則這個庫將會以文件名的擴展名作為格式保存。
載入文件，並轉化為png格式：

1
2
3
4
5
6
7
8
9
10
11
12
13

"Python Image Library Test"
from PIL import Image
import os
import sys

for infile in sys.argv[1:]:
f,e = os.path.splitext(infile)
outfile = f +".png"
if infile != outfile:
try:
Image.open(infile).save(outfile)
except IOError:
print("Cannot convert", infile)

save() 方法的第二個參數可以指定文件格式。
3）創建縮略圖
縮略圖是網路開發或圖像軟體預覽常用的一種基本技術，使用Python的Pillow圖像庫可以很方便的建立縮略圖，如下：

1
2
3
4
5
6
7

# create thumbnail
size = (128,128)
for infile in glob.glob("E:/photoshop/*.jpg"):
f, ext = os.path.splitext(infile)
img = Image.open(infile)
img.thumbnail(size,Image.ANTIALIAS)
img.save(f+".thumbnail","JPEG")

上段代碼對photoshop下的jpg圖像文件全部創建縮略圖，並保存，glob模塊是一種智能化的文件名匹配技術，在批圖像處理中經常會用到。
注意：Pillow庫不會直接解碼或者載入圖像柵格數據。當你打開一個文件，只會讀取文件頭信息用來確定格式，顏色模式，大小等等，文件的剩餘部分不會主動處理。這意味著打開一個圖像文件的操作十分快速，跟圖片大小和壓縮方式無關。
4）圖像的剪切、粘貼與合並操作
Image 類包含的方法允許你操作圖像部分選區，PIL.Image.Image.crop 方法獲取圖像的一個子矩形選區，如：

1
2
3
4

# crop, paste and merge
im = Image.open("E:/photoshop/lena.jpg")
box = (100,100,300,300)
region = im.crop(box)

矩形選區有一個4元元組定義，分別表示左、上、右、下的坐標。這個庫以左上角為坐標原點，單位是px，所以上訴代碼復制了一個 200×200 pixels 的矩形選區。這個選區現在可以被處理並且粘貼到原圖。

1
2

region = region.transpose(Image.ROTATE_180)
im.paste(region, box)

當你粘貼矩形選區的時候必須保證尺寸一致。此外，矩形選區不能在圖像外。然而你不必保證矩形選區和原圖的顏色模式一致，因為矩形選區會被自動轉換顏色。
5）分離和合並顏色通道
對於多通道圖像，有時候在處理時希望能夠分別對每個通道處理，處理完成後重新合成多通道，在Pillow中，很簡單，如下：

1
2

r,g,b = im.split()
im = Image.merge("RGB", (r,g,b))

對於split（）函數，如果是單通道的，則返回其本身，否則，返回各個通道。
6）幾何變換
對圖像進行幾何變換是一種基本處理，在Pillow中包括resize( )和rotate( )，如用法如下：

1
2

out = im.resize((128,128))
out = im.rotate(45) # degree conter-clockwise

其中，resize( )函數的參數是一個新圖像大小的元祖，而rotate( )則需要輸入順時針的旋轉角度。在Pillow中，對於一些常見的旋轉作了專門的定義：

1
2
3
4
5

out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)

7）顏色空間變換
在處理圖像時，根據需要進行顏色空間的轉換，如將彩色轉換為灰度：

1
2

cmyk = im.convert("CMYK")
gray = im.convert("L")

8）圖像濾波

導航:首頁 > 編程語言 > 超全python圖像處理

超全python圖像處理

與超全python圖像處理相關的資料