Ⅰ linux caffe支持的cuda capability 最小是多少
由於最近安裝了Ubuntu16.04,苦於之前配置Caffe的教程都在版本14.04左右,無奈只能自己摸索,最終配置成功。本文教程的特點是不需要降級gcc的版本,畢竟cuda7.5不支持gcc5以上(默認不支持,實際支持),避免出現一系列亂七八糟的問題,反正之前我是碰到了。
本文是在參考caffe官網教程(http://caffe.berkeleyvision.org/installation.html)結合自己總結經驗而來,對此表示感謝。
1.所需文件下載
1.1.Ubuntu16.04在官網下載(http://www.ubuntu.org.cn/download/desktop),然後在windows下用UltraISO製作,相關文章搜索有一大片,此處不再贅述。
1.2.cuda7.5下載,下載的版本是ubuntu15.04的run文件,個人感覺比較方便。
1.3.cudnn4.0下載(https://developer.nvidia.com/cudnn),進去之後如果有注冊過nvidia的賬戶直接點擊download,否則需要注冊一個賬戶,注冊完之後有一個調查,隨便選幾個鉤就可以,然後下一步是接受條款開始就可以下載了。
1.4.caffe下載(https://github.com/BVLC/caffe)就在官方的github下載就可以了。
2.顯卡驅動安裝
2.1.第一種方法是直接在ubuntu系統設置,軟體和更新裡面,選擇中國的伺服器源刷新之後,點擊附加驅動選項,在Nvidia Corporation選擇361.42(強迫症必須安裝最新的),然後點擊應用更改,下載安裝完之後重啟。
2.2.第二種方法是去官方下載(http://www.geforce.cn/drivers)好驅動的run文件,選擇對應顯卡型號下載。然後關機把顯示器插到集成顯卡介面上,或者終端下
sudo gedit /etc/modprobe.d/blacklist.conf
輸入密碼後在最後一行編輯上
blacklist nouveau
Ctrl +C保存後終端輸入
sudo update-initramfs -u
重啟之後在界面按Ctrl+Alt+F2,輸入root以及密碼,然後
service lightdm stop
sh 你自己的驅動文件的完整路徑,默認選項就可以安裝了,安裝後重啟
3.Cuda7.5安裝
3.1.以文件名為cuda.run為例,終端下輸入
sh cuda.run --override 啟動安裝程序,此處有大量的條款,一路空格到最後 輸入accept,依次輸入y回車,然後n(不安裝顯卡驅動),然後一路y回車,有一個地方需要輸入密碼,還有兩個地方確認安裝路徑,直接回車即可,完成安裝,默認安裝路徑是/usr/local
將下載下來的cudnn-7.0-linux-x64-v4.0-prod.tgz 解壓之後,解壓後的cuda文件夾先打開裡面的include文件夾,空白右鍵在終端打開輸入:
sudo cp cudnn.h /usr/local/cuda/include/
cd ~/cuda/lib64
sudo cp lib* /usr/local/cuda/lib64/
繼續更新文件鏈接
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.4
sudo ln -s libcudnn.so.4.0.7 libcudnn.so.4
sudo ln -s libcudnn.so.4 libcudnn.so
然後設置環境變數
sudo gedit /etc/profile
在末尾加入
PATH=/usr/local/cuda/bin:$PATH
export PATH
保存之後創建鏈接文件
sudo vim /etc/ld.so.conf.d/cuda.conf
鍵盤按i進入編輯狀態,添加文字
/usr/local/cuda/lib64
然後按esc,輸入:wq保存退出。
終端下接著輸入
sudo ldconfig 使鏈接生效
4.生成Cuda Sample測試
首先在此之前先把需要的依賴包都安裝好,為接下來make caffe做准備
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
然後開始make samples ,終端下
cd /home/gomee/NVIDIA_CUDA-7.5_Samples
sudo make all -j4
我是4核電腦所以用了j4,正常情況下肯定會報錯「unsupported GNU version! gcc versions later than 4.9 are not supported!」,原因就是這個cuda不支持gcc5.0以上,終端運行
cd /usr/local/cuda-7.5/include
cp host_config.h host_config.h.bak
sudo gedit host_config.h
Ctrl+F尋找有」4.9」的地方,應該是只有一處,在其上方的
#if __GNUC__ > 4 || (__GNUC__ == 4 && __GNUC_MINOR__ > 9)將兩個4改成5,保存退出,繼續
cd /home/gomee/NVIDIA_CUDA-7.5_Samples
sudo make all -j4
這就應該開始make了,此處大約有5、6分鍾。完成之後
cd /home/gomee/NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux
./deviceQuery
會出現類似以下的信息
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "GeForce GTX 750 Ti"
CUDA Driver Version / Runtime Version 8.0 / 7.5
CUDA Capability Major/Minor version number: 5.0
Total amount of global memory: 2047 MBytes (2146762752 bytes)
( 5) Multiprocessors, (128) CUDA Cores/MP: 640 CUDA Cores
GPU Max Clock rate: 1228 MHz (1.23 GHz)
Memory Clock rate: 3004 Mhz
Memory Bus Width: 128-bit
L2 Cache Size: 2097152 bytes
Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent and kernel execution: Yes with 1 engine(s)
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): Yes
Device PCI Domain ID / Bus ID / location ID: 0 / 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 8.0, CUDA Runtime Version = 7.5, NumDevs = 1, Device0 = GeForce GTX 750 Ti
Result = PASS
這就說明成功了。
5.python配置
將之前github下載的caffe壓縮文件解壓縮到任一目錄,然後安裝python
python的版本安裝有兩種方式:
第一是直接安裝anaconda,去官網下載 ,選擇linux 64bit 2.7版本下載安裝,anaconda安裝方便但是需要在最後的make配置文件中更改python包含路徑。
第二種方法就是使用原生的python2.7版本,終端下
sudo apt-get install python-pip 安裝pip
這里我們用pip安裝一些python需要的依賴包,不過為了避免各種問題,也可以通過apt-get安裝,反正我這兩種方式都安裝了一遍(-.-)
sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose
以caffe默認解壓到/home/user(你的用戶名)/ ,文件夾名名稱caffe為例
cd /home/user/caffe/python
sudo su
for req in $(cat requirements.txt); do pip install $req; done
這里用pip安裝可能速度很慢,很可能下載好幾個小時,推薦用清華大學的pip源臨時安裝,所以命令改為如下:
for req in $(cat requirements.txt); do pip install -i https://pypi.tuna.tsinghua.e.cn/simple $req; done
這里如果第一次有很多紅字錯誤,建議再運行幾遍指導安裝成功,對於黃字提示無需理會,可能是pip版本需要更新。
6.Caffe編譯過程
接下來要進入最後的步驟了,終端中
cd /home/user/caffe
cp Makefile.config.example Makefile.config
gedit Makefile.config
將USE_CUDNN := 1 取消注釋,在
INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include後面打上一個空格 然後添加/usr/include/hdf5/serial 如果沒有這一句可能會報一個找不到hdf5.h的錯誤
PYTHON_INCLUDE := /usr/include/python2.7 \
/usr/lib/python2.7/dist-packages/numpy/core/include先不做更改。
如果是需要生成matlab的caffe wrapper 請取消注釋MATLAB_DIR然後替換為自己的目錄
說一下提前會出現的問題:
第一,make過程中出現比如 string.h 『memcy』 was not declared in this scope的錯誤是由於gcc編譯器版本太新,解決方法是打開makefile搜索並替換
NVCCFLAGS += -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)
為
NVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)
保存退出
第二,在make過程中還會報一個ld找不到libhdf5 和libhdf5_hl的鏈接問題,這個原因可能也是因為hdf5的問題,首先看/usr/lib/x86_64-linux-gnu 目錄下有沒有libhdf5.so和libhdf5_hl.so,如果有的話,查看屬性是否有正確的鏈接(正常情況下應該是沒有這兩個文件),然後右鍵在終端中打開
sudo ln libhdf5_serial.so.10.1.0 libhdf5.so
sudo ln libhdf5_serial_hl.so.10.0.2 libhdf5_hl.so
注意,10.1.0和10.0.2可能不同電腦安裝版本不同,注意看當前目錄下存在的文件然後
sudo ldconfig 生效
接下來就是直接編譯的過程
cd /home/user/caffe
make all -j4
make test -j4
make runtest
make pycaffe
make matcaffe
如果編譯沒報錯正常的話,基本就沒問題了。測試python打開
cd /home/user/caffe/python
python
import caffe
如果不報錯就說明編譯成功
測試matlab打開./caffe/matlab/+caffe/private,看有沒有生成一個caffe的mex文件,可以運行+test文件夾裡面的程序測試。
小問題:
在使用python介面的時候,可能會報一個什麼錯誤(我給忘記了–!),對了是』Mean shape incompatible with input shape.』的錯誤,處理方法是python/caffe文件夾,編輯io.py文件,將
if ms != self.inputs[in_][1:]:
raise ValueError('Mean shape incompatible with input shape.')
替換為
if ms != self.inputs[in_][1:]:
print(self.inputs[in_])
in_shape = self.inputs[in_][1:]
m_min, m_max = mean.min(), mean.max()
normal_mean = (mean - m_min) / (m_max - m_min)
mean = resize_image(normal_mean.transpose((1,2,0)),in_shape[1:]).transpose((2,0,1)) * (m_max - m_min) + m_min
然後make clean再重新make
7.總結
至此,Ubuntu16.04下編譯Caffe的教程就結束了,作者歷時三天,裝了好幾遍系統,剛開始用Ubuntu14.04,結果系統出現問題,強迫症實在受不了,就嘗試著裝16.04繼續折騰,最終折騰成功。以後可能會更新python3下的編譯教程,需要自己編譯boost版本,總之也很麻煩。
Ⅱ matlab2009和matlab2012的區別
Copyright © 1999-2020, CSDN.NET, All Rights Reserved
matlab
打開APP
liang890319
關注
Matlab各版本對比 原創
2021-11-14 09:43:52
11點贊
liang890319
碼齡13年
關注
官方文檔主頁
文檔主頁 - MathWorks 中國
各版本對比
MathWorks - Archived MathWorks Documentation - MathWorks 中國
發行說明: MATLAB- MATLAB & Simulink- MathWorks 中國
基本原則還是使用最新版的,如果硬體資源有限可參考主要變化選擇合適的版本 建議2020b以及以後版本
幾個關鍵版本變化
1,支持實時腳本和實時函數.mlx文件
MATLAB® 實時腳本和實時函數是互動式文檔,它們在一個稱為實時編輯器的環境中將 MATLAB 代碼與格式化文本、方程和圖像組合到一起。此外,實時腳本可存儲輸出,並將其顯示在創建它的代碼旁。
什麼是實時腳本或實時函數?- MATLAB & Simulink- MathWorks 中國
MATLAB R2016a - MATLAB 支持 R2016a 及更高版本中的實時腳本,以及 R2018a 及更高版本中的實時函數。
操作系統 - 從 R2019b 開始,在 MATLAB 支持的所有操作系統中,MATLAB 都支持實時編輯器。有關詳細信息,請參閱系統要求。
對於 MATLAB 版本 R2016a 至 R2019a,MATLAB 支持的操作系統中有幾個不支持實時編輯器。
不支持的操作系統包括:
Red Hat Enterprise Linux 6。
Red Hat Enterprise Linux 7。
SUSE Linux Enterprise Desktop 版本 13.0 及更早版本。
Debian 7.6 及更早版本。
此外,一些操作系統需要額外的配置才能在 MATLAB 版本 R2016a 到 R2019a 中運行實時編輯器。如果您無法在系統中運行實時編輯器,請聯系技術支持以了解有關如何配置系統的信息。
2,串口通信新的api
2019b新的串口通信api
串列埠介面有一組新的函數和屬性。現有功能仍可運行,但推薦使用新的函數名稱和屬性。新介面提高了性能。
通過使用 serialportlist 查看計算機上所有串列埠的列表,來開始使用新介面。list = serialportlist
list =
1×4 string array
"COM1" "COM3" "COM4" "COM8"
然後,創建一個 serialport 對象,將數據寫入設備,並從中讀取數據。
s = serialport("COM8",115200);
write(s,1:5,"uint32")
read(s,5,"uint32");
3,tcpip通信新的api
R2020b 優化了tcpip和串口通信
TCP/IP 客戶端介面有一組新的函數和屬性。
您仍可以使用現有函數執行以下操作:
使用 tcpclient 函數創建一個與 TCP/IP 伺服器的 TCP/IP 客戶端連接。
使用 read 函數從遠程主機讀取數據。
使用 write 函數將數據寫入遠程主機。
現在,您可以使用新函數執行以下操作:
使用 echotcpip 函數啟動 TCP/IP 回顯伺服器。
使用 readline 函數從遠程主機讀取一行 ASCII 字元串數據。
使用 writeline 函數向遠程主機寫入一行 ASCII 字元串數據。
使用 configureTerminator 函數為與遠程主機的 ASCII 字元串通信設置終止符。
使用 configureCallback 函數為與遠程主機的通信設置回調函數和觸發條件。
使用 flush 函數刷新緩沖區,以便與遠程主機通信。
通過創建一個連接到 TCP/IP 回顯伺服器的 tcpclient 對象、向其寫入數據和從中讀取數據,開始使用 TCP/IP 客戶端介面。
echotcpip("on",3030)
t = tcpclient("localhost",3030)
write(t,1:5,"uint8")
read(t,5);
有關詳細信息,請參閱 TCP/IP 通信。
串列埠介面:改進了性能
serialport 介面的性能優於 serial 介面。例如,在使用 9600 的默認波特率時,以下代碼中使用 serialport 對象寫入和讀取數據的速度大約是使用 serial 對象寫入和讀取數據速度的 1.1 倍。
% s is a serial object
function timingTest(s,bytecount)
fwrite(s,1:bytecount,"uint8");
fread(s,bytecount,"uint8");
end
% s is a serialport object
function timingTest(s,bytecount)
write(s,1:bytecount,"uint8");
read(s,bytecount,"uint8");
end
不同波特率條件下大致執行時間如下:
s.BaudRate
9600 19200 56000 115200
serial 120 毫秒 68 毫秒 31 毫秒 23 毫秒
serialport 109 毫秒 55 毫秒 21 毫秒 11 毫秒
代碼是在運行 Windows 10 的 Intel(R) Xeon(R) CPU E5-1650 v4 @ 3.60 GHz 測試系統上使用 timeit 函數進行計時的:
bytecount = 100;
timeit(@()timingTest(s,bytecount))
測試是使用串列環回連接器完成的。
有關詳細信息,請參閱串列埠設備。
4,對python的支持
2021b 支持python3.9
2021a 支持3.8 停止支持3.6
2020b停止支持3.5
2019a MATLAB 現在除支持 CPython 2.7、3.5 和 3.6 之外,還支持 CPython 3.7。
2018b Python 介面:在 MATLAB 和 Python 之間傳遞多維數值或邏輯數組
2018a Python 版本 3.4:已停止支持
支持的 Python 版本 - 3.5 或 3.6 版。
5,git的支持
2020a 工程 API:以編程方式獲取最新 Git 修訂版
2019b 比較 Git 分支:顯示差異並保存副本
2019a 源代碼管理集成:將 MATLAB Git 狀態與外部 Git 客戶端同步
2021b新功能
1,實時編輯器任務
幫助使用者自動生成代碼並用用戶界面進行參數調整
實時編輯器任務是可以添加到實時腳本中以執行一組特定操作的 App。您可以將任務添加到實時腳本中,以探查參數並自動生成代碼。使用任務可縮短開發時間、減少錯誤並縮短在繪圖上花費的時間。
任務代表一系列 MATLAB® 命令。您可以採用內嵌方式或在右側顯示其輸出。
文檔
將互動式任務添加到實時腳本中- MATLAB & Simulink- MathWorks 中國
視頻
What Are Live Editor Tasks? Video - MATLAB
2,項目和版本管理
MATLAB and Simulink Projects Video - MATLAB
3,驗證函數輸入
在 MATLAB ® 中使用函數參數驗證來聲明對函數輸入參數的特定限制。您可以約束函數輸入值的類、大小和其他方面,而無需在函數體中編寫代碼來執行這些測試。
Validating Function Inputs Video - MATLAB
新產品
RF PCB Toolbox - 對印刷電路板進行電磁分析
Signal Integrity Toolbox - 對高速串列和並行鏈路進行模擬和分析
重要更新
Lidar Toolbox - 使用激光雷達查看器,以交互方式可視化、分析和預處理激光雷達點雲
Simulink Code Inspector - 使用 Code Inspector 上下文選項卡,檢查兼容性、檢查代碼並直接在模型中查看結果
Simulink Control Design - 設計模型參考自適應控制器
Symbolic Math Toolbox - 在 MATLAB 實時編輯器中提供下一步操作建議,引導用戶完成符號工作流
Wavelet Toolbox - 使用小波分析處理和提取信號和圖像的特徵,以用於 AI 工作流
R2021b - MATLAB 和 Simulink 產品系列發布更新 - MATLAB & Simulink
Release Notes- MATLAB & Simulink- MathWorks 中國
其他
編輯器代碼:自動顯示代碼建議和完成
編輯器重構:自動將選定的代碼轉換為函數
實時編輯器控制項:設置滑塊、下拉列表、復選框和編輯欄位的默認值
實時編輯器動畫:將動畫導出為電影或動畫 GIF
實時編輯器:提高保存實時腳本或函數時的性能
比較工具:比較和合並具有改進的可用性、外觀和語法突出顯示的文本文件
sftp 功能:連接SFTP伺服器
HDF5 介面:使用新功能支持 HDF5 1.10.7
從 MATLAB 直接調用 Python 功能
除了現有的對 2.7、3.7 和 3.8 的支持之外,MATLAB 現在還支持 CPython 3.9
2021a
實時編輯器動畫播放控制項:用於控制動畫的互動式界面
實時編輯器控制項:通過將變數關聯到下拉項和滑塊值,在實時腳本中創建動態控制項
XML 文件:使用 readtable、readtimetable 和其他函數讀取、寫入和導入 XML 文件
低級文件 I/O 函數和遠程數據:對遠程存儲的文件執行讀寫操作
save 和 load 函數與遠程數據:將數據保存、載入和追加到遠程存儲的 v7.3 MAT 文件中
讀取在線數據:使用 readtable、audioread 和其他讀取函數通過 HTTP 和 HTTPS 讀取文件
數據壓縮函數:改進了 zip/unzip 和 tar/untar 的功能
jsonencode:為 JSON 文本添加縮進
創建繪圖實時編輯器任務:以交互方式創建繪圖並生成代碼
C++ 介面支持下列額外的 C++ 語言功能。
Java 引擎應用程序中使用 MATLAB 值對象
支持的 Python 版本,即 3.7 或 3.8 版
增加了對 IMU 感測器的支持
現在,MATLAB Support Package for Raspberry Pi™ Hardware 可為下列 IMU 感測器提供代碼生成和連接到 Raspberry Pi 函數的 IO 支持:
HTS221
LPS22HB
LSM303C
LSM6DSL
LSM9DS1
MPU-6050
MPU-9250
2020b
比較工具:在 MATLAB Online 中比較文本文件
readstruct 和 writestruct 函數:在 XML 文件中讀取和寫入結構化數據
readlines 函數:以字元串數組形式讀取文本文件中的行
HDF5 文件和基於 Web 的數據:使用現有 HDF5 函數讀取和寫入遠程存儲的 HDF5 文件
HDF5 文件:讀取和寫入使用 Unicode 字元編碼的文件名
音頻文件和基於 Web 的數據:使用 audioread、audiowrite 和 audioinfo 讀取和寫入遠程存儲的音頻文件
TCP/IP 客戶端介面:新的函數和屬性
TCP/IP 客戶端介面有一組新的函數和屬性。
您仍可以使用現有函數執行以下操作:
使用 tcpclient 函數創建一個與 TCP/IP 伺服器的 TCP/IP 客戶端連接。
使用 read 函數從遠程主機讀取數據。
使用 write 函數將數據寫入遠程主機。
現在,您可以使用新函數執行以下操作:
使用 echotcpip 函數啟動 TCP/IP 回顯伺服器。
使用 readline 函數從遠程主機讀取一行 ASCII 字元串數據。
使用 writeline 函數向遠程主機寫入一行 ASCII 字元串數據。
使用 configureTerminator 函數為與遠程主機的 ASCII 字元串通信設置終止符。
使用 configureCallback 函數為與遠程主機的通信設置回調函數和觸發條件。
使用 flush 函數刷新緩沖區,以便與遠程主機通信。
串列埠介面:改進了性能
serialport 介面的性能優於 serial 介面。例如,在使用 9600 的默認波特率時,以下代碼中使用 serialport 對象寫入和讀取數據的速度大約是使用 serial 對象寫入和讀取數據速度的 1.1 倍。
源代碼管理:改進了設置 Git 源代碼管理的工作流
現在,您可以將 nullptr 傳遞給 C++ 函數。
MATLAB 現在除支持 CPython 2.7、3.6 和 3.7 之外,還支持 CPython 3.8
Java 包將被刪除
實時編輯器任務:以交互方式從 USB 網路攝像頭捕獲圖像,並在實時腳本中生成 MATLAB 代碼。
2020a
文件編碼:默認情況下,將 MATLAB 代碼文件 (.m) 和其他純文本文件保存為 UTF-8 編碼文件
switch 函數:更靈活地比較對象
file 和 movefile 函數:訪問基於 Web 的存儲服務,如 Amazon Web Services 和 Azure Blob 存儲
數據存儲:使用 writeall 將數據從數據存儲寫入文件
文本文件和電子表格文件:使用 'WriteMode' 參數追加、覆蓋或替換數據
h5create 和 h5write:將字元串數據寫入 HDF5 文件
jsonencode:在 MATLAB 類中自定義編碼
導入工具不再支持導入 HDF5 文件。要以編程方式導入 HDF4 或 HDF-EOS
Ⅲ HDF文件怎樣打開
可以下載HDF Explorer v1.4.0綠色版來打開。
可以打開hdf/h5/he5/hdf5/he4/nc/cdf格式文件,免注冊不需要安搭游裝綠色版的HDFExplorer。解壓縮之後直接打開主程序HdfExp.exe即知陸銷可悉扮使用。
能夠載入並顯示數據,數據訪問速度快,支持讀取所有的HDF數據,軟體易於使用,能夠瀏覽和生成矢量圖和標量。