linuxwmb_LINUX設備驅動程序如何與硬體通信

Ⅰ 怎麼在vmware上安裝linux系統

操作系統：win7

工具包：虛擬機（VMware_Workstation_wmb） Linux版本（CentOS-6.3-i386-bin-DVD1）【網路均可免費下載】

為了省事，我就不上圖一一說明了，我會盡量的用文字把每一步都描述好 — —！

一、先裝虛擬機

1.解壓VMware的壓縮包，運行VMware Workstation。

2.等待右下角歡迎界面結束後，點擊Next。

3.選擇典型安裝（Typical），選擇自定義（Custom）也可以，推薦有經驗的人使用。

4.自定義你要安裝的軟體路徑（推薦不裝在C盤），選擇好後繼續選擇next。

5.在新彈出的頁面中，將上面的定時更新的選項的選勾去掉（更新那麼高有卵用），取消對勾後繼續next。

6.在新彈出的頁面中，將加入用戶體驗去掉（本人從來沒有加入體驗的習慣，總感覺有種被偷窺了的感覺），取消對勾後繼續next。

7.在彈出的新頁面中，兩個選項分別問你是否要給桌面添加快捷方式和是否給開始菜單添加快捷方式，默認就需要吧，直接next。

8.選擇continue，開始安裝，等著吧~~~~

9.輸入密鑰：【秘鑰：MV4YN-0L38Q-2ZK60-XUA7K-AAZ18】

10.安裝完成後選擇finish。

11.安裝完成後，進行漢化，運行「VMware Workstation 8.0.4 漢化包」，選擇64位的漢化，安裝過程中，會出現一大串的提示，直接忽略掉就好，不影響最後的漢化效果，原因就是在安裝虛擬機的過程中，提示的進程已經被啟動，所以漢化會有影響，不過沒關系，不影響最後的效果，忽略三次後，漢化完成。

--------------------------------------------------------------------------------風騷的黃金分割線-------------------------------------------------------------------------------------------------------------------------------

安裝完成後需要進行虛擬機的配置，如下：

1.運行安裝好的虛擬機，選擇新建虛擬機。

2.選擇「標准」方式，下一步。

3.選擇「我以後再安裝操作系統」，下一步。

4.選擇Linux（主題就是安裝Linux，裝其他的不是扯淡嘛），版本選擇「CentOS」【不要選了CentOS 64-bit】下一步。

5.給你的虛擬機起個名字（隨便叫什麼都行，沒講究），位置的話也隨便放，命名最好和虛擬機的名字相同，便於管理，將來不用的時候直接把目錄刪了就好了，下一步。

6.給虛擬機分配硬碟空間，系統推薦20G，默認就好，實際上練慣用的話3-4個G就完全夠用了，下一步。

7.展示一下你的虛擬機做的怎麼樣，一些信息，沒問題的話點擊「完成」！

8.你的虛擬機就建好了，就會在虛擬機這個軟體中彈出一個黑黑的窗口。（但是千萬不要以為Linux裝好了啊，這裡面空空的，還什麼都沒有呢！）

9.點擊導航欄中的「虛擬機」----->「設置」，為你的虛擬機進行更詳細的設置。

10.內存設置，根據不同的電腦運行內存會默認不同的內存給虛擬機，不過我們用的CentOS6.3最小需要628M才能啟動圖形界面，所以就設成628M吧。

11.處理器設置，CPU一般就一個，本人電腦是4核8線程，不過選擇8核也沒關系，無所謂。選8核，在此有個選項叫「虛擬化Inter VT...」的，這是問你是否要把你真實的電腦CPU映射到虛擬機中，選擇後你電腦是i7CPU，那麼你的虛擬機也是i7，如果不選，CPU是由軟體本身模擬出來的，單純只為練習Linux使用的話，推薦不選，還要留著內存打游戲呢對不？

12.光碟設置中，右上角「已連接」的勾必須打，默認是灰色的是因為虛擬機沒通電開機，如果通電開機這個勾沒打上的話，虛擬機肯定找不到；連接中選擇使用iso鏡像文件，路徑選擇到下載好的CentOS-6.3-i386-bin-DVD1上。軟碟機一樣，不過就先不設置了可以！

13.網路適配器設置中，有三個選項，1.橋接 2.NAT3.host-only，選橋接（默認虛擬機和真實機可以通信）比較簡單，缺點是虛擬機會佔用你真實機IP的一個網段。至於2,3是什麼，自己網路吧。

14.其他的選項我們就用不到了，就不設置了，點擊「確定」。

PS：虛擬機最強大的功能就是「快照」功能和「克隆」功能（兩種模式），自己網路一下吧，我就不詳細說了。

---------------------------------------------------------------------------------------優雅的黃金分割線------------------------------------------------------------------------------------------------------------------------

二、安裝Linux

接下來就要進行Linux系統的安裝了，如下：

1.打開虛擬機軟體，點擊左上角綠色小箭頭通電開機。

2.說句多餘的話（Linux的安裝界面比windows好看太多了吧，有木有？）

3.選擇第一項「Install or upgrade....」。

4.提示你是否要檢測光碟數據是否完成，這時選擇「skip」，不檢測。

5.進入安裝界面，滑鼠點進虛擬機中，按「Ctrl+Alt+Enter」全屏，按「Ctrl+Alt」切出全屏。選擇Next.

6.安裝語言，當然選擇簡體中文了，Next。

7.安裝鍵盤選擇「美國英語式」，下一步。

8.選擇基本存儲設備，下一步。

9.如果VMware鏡像有數據，會提示你是否保留數據，選擇「否，忽略所有數據」。

10.給Linux起個主機名，默認就好，下一步。

11.選擇時區，默認「亞洲/上海」，左下角的那個勾表示，如果你的Linux系統能聯網的話，會自動獲取更新時間，默認勾上就好，下一步。

12.給Linux管理員設置一個密碼，設個簡單的吧，「123456」，省的自己都記不住了，下一步（無論如何都使用，因為這個密碼太簡單了，不過我們自己練慣用，不涉及企業安全也就不講究了）。

13.選擇「創建自定義布局」，點擊創建，給掛載點「/home」分空間，給2000M，確定；給掛載點「/boot」分空間，給200M，確定；給掛載點「swap」分空間（注意不能再掛載點中選擇或者自己手動輸入了，要在文件系統類型中選擇swap），選中後，掛載點會自動變灰，顯示「<不適用>」，給1000M，確定；給掛載點「/」分空間，使用全部可用空間，確定。完成後應如圖所示：

Ⅱ Linux 之mutex 源碼分析

mutex相關的函數並不是linux kernel實現的，而是glibc實現的，源碼位於nptl目錄下。

http://ftp.gnu.org/pub/gnu/glibc/glibc-2.3.5.tar.gz

首先說數據結構：

typedef union

{

struct

{

    int __lock;

    unsigned int __count;

    int __owner;

    unsigned int __nusers;

    /* KIND must stay at this position in the structure to maintain

       binary compatibility. */

    int __kind;

    int __spins;

} __data;

char __size[__SIZEOF_PTHREAD_MUTEX_T];

long int __align;

} pthread_mutex_t;

int __lock; 資源競爭引用計數

int __kind; 鎖類型，init 函數中mutexattr 參數傳遞，該參數可以為NULL，一般為 PTHREAD_MUTEX_NORMAL

結構體其他元素暫時不了解，以後更新。

/*nptl/pthread_mutex_init.c*/

int

__pthread_mutex_init (mutex, mutexattr)

     pthread_mutex_t *mutex;

     const pthread_mutexattr_t *mutexattr;

{

const struct pthread_mutexattr *imutexattr;

assert (sizeof (pthread_mutex_t) <= __SIZEOF_PTHREAD_MUTEX_T);

imutexattr = (const struct pthread_mutexattr *) mutexattr ?: &default_attr;

/* Clear the whole variable. */

memset (mutex, '\0', __SIZEOF_PTHREAD_MUTEX_T);

/* Copy the values from the attribute. */

mutex->__data.__kind = imutexattr->mutexkind & ~0x80000000;

/* Default values: mutex not used yet. */

// mutex->__count = 0;        already done by memset

// mutex->__owner = 0;        already done by memset

// mutex->__nusers = 0;        already done by memset

// mutex->__spins = 0;        already done by memset

return 0;

}

init函數就比較簡單了，將mutex結構體清零，設置結構體中__kind屬性。

/*nptl/pthread_mutex_lock.c*/

int

__pthread_mutex_lock (mutex)

     pthread_mutex_t *mutex;

{

assert (sizeof (mutex->__size) >= sizeof (mutex->__data));

pid_t id = THREAD_GETMEM (THREAD_SELF, tid);

switch (__builtin_expect (mutex->__data.__kind, PTHREAD_MUTEX_TIMED_NP))

    {

     …

    default:

      /* Correct code cannot set any other type. */

    case PTHREAD_MUTEX_TIMED_NP:

    simple:

      /* Normal mutex. */

      LLL_MUTEX_LOCK (mutex->__data.__lock);

      break;

  …

  }

/* Record the ownership. */

assert (mutex->__data.__owner == 0);

mutex->__data.__owner = id;

#ifndef NO_INCR

++mutex->__data.__nusers;

#endif

return 0;

}

該函數主要是調用LLL_MUTEX_LOCK，省略部分為根據mutex結構體__kind屬性不同值做些處理。

宏定義函數LLL_MUTEX_LOCK最終調用，將結構體mutex的__lock屬性作為參數傳遞進來

#define __lll_mutex_lock(futex)                                                \

((void) ({                                                                \

    int *__futex = (futex);                                                \

    if (atomic_compare_and_exchange_bool_acq (__futex, 1, 0) != 0)        \

      __lll_lock_wait (__futex);                                        \

}))

atomic_compare_and_exchange_bool_acq (__futex, 1, 0)宏定義為：

#define atomic_compare_and_exchange_bool_acq(mem, newval, oldval) \

({ __typeof (mem) __gmemp = (mem);                                      \

     __typeof (*mem) __gnewval = (newval);                              \

      \

     *__gmemp == (oldval) ? (*__gmemp = __gnewval, 0) : 1; })

這個宏實現的功能是：

如果mem的值等於oldval，則把newval賦值給mem，放回0，否則不做任何處理，返回1.

由此可以看出，當mutex鎖限制的資源沒有競爭時，__lock 屬性被置為1，並返回0，不會調用__lll_lock_wait (__futex); 當存在競爭時，再次調用lock函數，該宏不做任何處理，返回1，調用__lll_lock_wait (__futex);

void

__lll_lock_wait (int *futex)

{

do

    {

      int oldval = atomic_compare_and_exchange_val_acq (futex, 2, 1);

      if (oldval != 0)

lll_futex_wait (futex, 2);

    }

while (atomic_compare_and_exchange_bool_acq (futex, 2, 0) != 0);

}

atomic_compare_and_exchange_val_acq (futex, 2, 1); 宏定義：

/* The only basic operation needed is compare and exchange. */

#define atomic_compare_and_exchange_val_acq(mem, newval, oldval) \

({ __typeof (mem) __gmemp = (mem);                                      \

     __typeof (*mem) __gret = *__gmemp;                                      \

     __typeof (*mem) __gnewval = (newval);                              \

      \

     if (__gret == (oldval))                                              \

       *__gmemp = __gnewval;                                              \

     __gret; })

這個宏實現的功能是，當mem等於oldval時，將mem置為newval，始終返回mem原始值。

此時，futex等於1，futex將被置為2，並且返回1. 進而調用

lll_futex_wait (futex, 2);

#define lll_futex_timed_wait(ftx, val, timespec)                        \

({                                                                        \

   DO_INLINE_SYSCALL(futex, 4, (long) (ftx), FUTEX_WAIT, (int) (val),        \

     (long) (timespec));                                \

   _r10 == -1 ? -_retval : _retval;                                        \

})

該宏對於不同的平台架構會用不同的實現，採用匯編語言實現系統調用。不過確定的是調用了Linux kernel的futex系統調用。

futex在linux kernel的實現位於：kernel/futex.c

SYSCALL_DEFINE6(futex, u32 __user *, uaddr, int, op, u32, val,

struct timespec __user *, utime, u32 __user *, uaddr2,

u32, val3)

{

struct timespec ts;

ktime_t t, *tp = NULL;

u32 val2 = 0;

int cmd = op & FUTEX_CMD_MASK;

if (utime && (cmd == FUTEX_WAIT || cmd == FUTEX_LOCK_PI ||

      cmd == FUTEX_WAIT_BITSET ||

      cmd == FUTEX_WAIT_REQUEUE_PI)) {

if (_from_user(&ts, utime, sizeof(ts)) != 0)

return -EFAULT;

if (!timespec_valid(&ts))

return -EINVAL;

t = timespec_to_ktime(ts);

if (cmd == FUTEX_WAIT)

t = ktime_add_safe(ktime_get(), t);

tp = &t;

}

/*

* requeue parameter in 'utime' if cmd == FUTEX_*_REQUEUE_*.

* number of waiters to wake in 'utime' if cmd == FUTEX_WAKE_OP.

*/

if (cmd == FUTEX_REQUEUE || cmd == FUTEX_CMP_REQUEUE ||

    cmd == FUTEX_CMP_REQUEUE_PI || cmd == FUTEX_WAKE_OP)

val2 = (u32) (unsigned long) utime;

return do_futex(uaddr, op, val, tp, uaddr2, val2, val3);

}

futex具有六個形參，pthread_mutex_lock最終只關注了前四個。futex函數對參數進行判斷和轉化之後，直接調用do_futex。

long do_futex(u32 __user *uaddr, int op, u32 val, ktime_t *timeout,

u32 __user *uaddr2, u32 val2, u32 val3)

{

int clockrt, ret = -ENOSYS;

int cmd = op & FUTEX_CMD_MASK;

int fshared = 0;

if (!(op & FUTEX_PRIVATE_FLAG))

fshared = 1;

clockrt = op & FUTEX_CLOCK_REALTIME;

if (clockrt && cmd != FUTEX_WAIT_BITSET && cmd != FUTEX_WAIT_REQUEUE_PI)

return -ENOSYS;

switch (cmd) {

case FUTEX_WAIT:

val3 = FUTEX_BITSET_MATCH_ANY;

case FUTEX_WAIT_BITSET:

ret = futex_wait(uaddr, fshared, val, timeout, val3, clockrt);

break;

         …

default:

ret = -ENOSYS;

}

return ret;

}

省略部分為對其他cmd的處理，pthread_mutex_lock函數最終傳入的cmd參數為FUTEX_WAIT，所以在此只關注此分之，分析futex_wait函數的實現。

static int futex_wait(u32 __user *uaddr, int fshared,

      u32 val, ktime_t *abs_time, u32 bitset, int clockrt)

{

struct hrtimer_sleeper timeout, *to = NULL;

struct restart_block *restart;

struct futex_hash_bucket *hb;

struct futex_q q;

int ret;

           … … //delete parameters check and convertion

retry:

/* Prepare to wait on uaddr. */

ret = futex_wait_setup(uaddr, val, fshared, &q, &hb);

if (ret)

goto out;

/* queue_me and wait for wakeup, timeout, or a signal. */

futex_wait_queue_me(hb, &q, to);

… … //other handlers

return ret;

}

futex_wait_setup 將線程放進休眠隊列中，

futex_wait_queue_me(hb, &q, to);將本線程休眠，等待喚醒。

喚醒後，__lll_lock_wait函數中的while (atomic_compare_and_exchange_bool_acq (futex, 2, 0) != 0); 語句將被執行，由於此時futex在pthread_mutex_unlock中置為0，所以atomic_compare_and_exchange_bool_acq (futex, 2, 0)語句將futex置為2，返回0. 退出循環，訪問用戶控制項的臨界資源。

/*nptl/pthread_mutex_unlock.c*/

int

internal_function attribute_hidden

__pthread_mutex_unlock_usercnt (mutex, decr)

     pthread_mutex_t *mutex;

     int decr;

{

switch (__builtin_expect (mutex->__data.__kind, PTHREAD_MUTEX_TIMED_NP))

    {

   … …

    default:

      /* Correct code cannot set any other type. */

    case PTHREAD_MUTEX_TIMED_NP:

    case PTHREAD_MUTEX_ADAPTIVE_NP:

      /* Normal mutex. Nothing special to do. */

      break;

    }

/* Always reset the owner field. */

mutex->__data.__owner = 0;

if (decr)

    /* One less user. */

    --mutex->__data.__nusers;

/* Unlock. */

lll_mutex_unlock (mutex->__data.__lock);

return 0;

}

省略部分是針對不同的__kind屬性值做的一些處理，最終調用 lll_mutex_unlock。

該宏函數最終的定義為：

#define __lll_mutex_unlock(futex)                        \

((void) ({                                                \

    int *__futex = (futex);                                \

    int __val = atomic_exchange_rel (__futex, 0);        \

\

    if (__builtin_expect (__val > 1, 0))                \

      lll_futex_wake (__futex, 1);                        \

}))

atomic_exchange_rel (__futex, 0);宏為：

#define atomic_exchange_rel(mem, value) \

(__sync_synchronize (), __sync_lock_test_and_set (mem, value))

實現功能為：將mem設置為value，返回原始mem值。

__builtin_expect (__val > 1, 0) 是編譯器優化語句，告訴編譯器期望值，也就是大多數情況下__val > 1 ？是0，其邏輯判斷依然為if(__val > 1)為真的話執行 lll_futex_wake。

現在分析，在資源沒有被競爭的情況下，__futex 為1，那麼返回值__val則為1，那麼 lll_futex_wake (__futex, 1);        不會被執行，不產生系統調用。當資源產生競爭的情況時，根據對pthread_mutex_lock 函數的分析，__futex為2， __val則為2，執行 lll_futex_wake (__futex, 1); 從而喚醒等在臨界資源的線程。

lll_futex_wake (__futex, 1); 最終會調動同一個系統調用，即futex, 只是傳遞的cmd參數為FUTEX_WAKE。

在linux kernel的futex實現中，調用

static int futex_wake(u32 __user *uaddr, int fshared, int nr_wake, u32 bitset)

{

struct futex_hash_bucket *hb;

struct futex_q *this, *next;

struct plist_head *head;

union futex_key key = FUTEX_KEY_INIT;

int ret;

if (!bitset)

return -EINVAL;

ret = get_futex_key(uaddr, fshared, &key);

if (unlikely(ret != 0))

goto out;

hb = hash_futex(&key);

spin_lock(&hb->lock);

head = &hb->chain;

plist_for_each_entry_safe(this, next, head, list) {

if (match_futex (&this->key, &key)) {

if (this->pi_state || this->rt_waiter) {

ret = -EINVAL;

break;

}

/* Check if one of the bits is set in both bitsets */

if (!(this->bitset & bitset))

continue;

wake_futex(this);

if (++ret >= nr_wake)

break;

}

}

spin_unlock(&hb->lock);

put_futex_key(fshared, &key);

out:

return ret;

}

該函數遍歷在該mutex上休眠的所有線程，調用wake_futex進行喚醒，

static void wake_futex(struct futex_q *q)

{

struct task_struct *p = q->task;

/*

* We set q->lock_ptr = NULL _before_ we wake up the task. If

* a non futex wake up happens on another CPU then the task

* might exit and p would dereference a non existing task

* struct. Prevent this by holding a reference on p across the

* wake up.

*/

get_task_struct(p);

plist_del(&q->list, &q->list.plist);

/*

* The waiting task can free the futex_q as soon as

* q->lock_ptr = NULL is written, without taking any locks. A

* memory barrier is required here to prevent the following

* store to lock_ptr from getting ahead of the plist_del.

*/

smp_wmb();

q->lock_ptr = NULL;

wake_up_state(p, TASK_NORMAL);

put_task_struct(p);

}

wake_up_state(p, TASK_NORMAL); 的實現位於kernel/sched.c中，屬於linux進程調度的技術。

Ⅲ LINUX設備驅動程序如何與硬體通信

LINUX設備驅動程序是怎麼樣和硬體通信的?下面將由我帶大家來解答這個疑問吧，希望對大家有所收獲!

LINUX設備驅動程序與硬體設備之間的通信

設備驅動程序是軟體概念和硬體電路之間的一個抽象層，因此兩方面都要討論。到目前為止，我們已經討論詳細討論了軟體概念上的一些細節，現在討論另一方面，介紹驅動程序在Linux上如何在保持可移植性的前提下訪問I/O埠和I/O內存。

我們在需要示例的場合會使用簡單的數字I/O埠來講解I/O指令，並使用普通的幀緩沖區顯存來講解內存映射I/O。

I/O埠和I/O內存

計算機對每種外設都是通過讀寫它的寄存器進行控制的。大部分外設都有幾個寄存器，不管是在內存地址空間還是在I/O地址空間，這些寄存器的訪問地址都是連續的。

I/O埠就是I/O埠，設備會把寄存器映射到I/O埠，不管處理器是否具有獨立的I/O埠地址空間。即使沒有在訪問外設時也要模擬成讀寫I/O埠。

I/O內存是設備把寄存器映射到某個內存地址區段(如PCI設備)。這種I/O內存通常是首先方案，它不需要特殊的處理器指令，而且CPU核心訪問內存更有效率。

I/O寄存器和常規內存

盡管硬體寄存器和內存非常相似，但程序員在訪問I/O寄存器的時候必須注意避免由於CPU或編譯器不恰當的優化而改變預期的I/O動作。

I/O寄存器和RAM最主要的區別就是I/O操作具有邊際效應，而內存操作則沒有：由於內存沒有邊際效應，所以可以用多種方法進行優化，如使用高速緩存保存數值、重新排序讀/寫指令等。

編譯器能夠將數值緩存在CPU寄存器中而不寫入內存，即使儲存數據，讀寫操作也都能在高速緩存中進行而不用訪問物理RAM。無論是在編譯器一級或是硬體一級，指令的重新排序都有可能發生：一個指令序列如果以不同於程序文本中的次序運行常常能執行得更快。

在對常規內存進行這些優化的時候，優化過程是透明的，而且效果良好，但是對I/O操作來說這些優化很可能造成致命的錯誤，這是因為受到邊際效應的干擾，而這卻是驅動程序訪問I/O寄存器的主要目的。處理器無法預料某些其它進程(在另一個處理器上運行，或在在某個I/O控制器中發生的操作)是否會依賴於內存訪問的順序。編譯器或CPU可能會自作聰明地重新排序所要求的操作，結果會發生奇怪的錯誤，並且很難調度。因此，驅動程序必須確保不使用高速緩沖，並且在訪問寄存器時不發生讀或寫指令的重新排序。

由硬體自身引起的問題很解決：只要把底層硬體配置成(可以是自動的或是由Linux初始化代碼完成)在訪問I/O區域(不管是內存還是埠)時禁止硬體緩存即可。

由編譯器優化和硬體重新排序引起的問題的解決辦法是：對硬體(或其他處理器)必須以特定順序的操作之間設置內存屏障(memory barrier)。Linux提供了4個宏來解決所有可能的排序問題：

#include <linux/kernel.h>

void barrier(void)

這個函數通知編譯器插入一個內存屏障，但對硬體沒有影響。編譯後的代碼會把當前CPU寄存器中的所有修改過的數值保存到內存中，需要這些數據的時候再重新讀出來。對barrier的調用可避免在屏障前後的編譯器優化，但硬體完成自己的重新排序。

#include <asm/system.h>

void rmb(void);

void read_barrier_depends(void);

void wmb(void);

void mb(void);

這些函數在已編譯的指令流中插入硬體內存屏障;具體實現方法是平台相關的。rmb(讀內存屏障)保證了屏障之前的讀操作一定會在後來的讀操作之前完成。wmb保證寫操作不會亂序，mb指令保證了兩者都不會。這些函數都是barrier的超集。

void smp_rmb(void);

void smp_read_barrier_depends(void);

void smp_wmb(void);

void smp_mb(void);

上述屏障宏版本也插入硬體屏障，但僅僅在內核針對SMP系統編譯時有效;在單處理器系統上，它們均會被擴展為上面那些簡單的屏障調用。

設備驅動程序中使用內存屏障的典型形式如下：

writel(dev->registers.addr, io_destination_address);

writel(dev->registers.size, io_size);

writel(dev->registers.operation, DEV_READ);

wmb();

writel(dev->registers.control, DEV_GO);

在這個例子中，最重要的是要確保控制某種特定操作的所有設備寄存器一定要在操作開始之前已被正確設置。其中的內存屏障會強制寫操作以要求的順序完成。

因為內存屏障會影響系統性能，所以應該只用於真正需要的地方。不同類型的內存屏障對性能的影響也不盡相同，所以最好盡可能使用最符合需要的特定類型。

值得注意的是，大多數處理同步的內核原語，如自旋鎖和atomic_t操作，也能作為內存屏障使用。同時還需要注意，某些外設匯流排(比如PCI匯流排)存在自身的高速緩存問題，我們將在後面的章節中討論相關問題。

在某些體系架構上，允許把賦值語句和內存屏障進行合並以提高效率。內核提供了幾個執行這種合並的宏，在默認情況下，這些宏的定義如下：

#define set_mb(var, value) do {var = value; mb();} while 0

#define set_wmb(var, value) do {var = value; wmb();} while 0

#define set_rmb(var, value) do {var = value; rmb();} while 0

在適當的地方，<asm/system.h>中定義的這些宏可以利用體系架構特有的指令更快的完成任務。注意只有小部分體系架構定義了set_rmb宏。

使用I/O埠

I/O埠是驅動程序與許多設備之間的通信方式——至少在部分時間是這樣。本節講解了使用I/O埠的不同函數，另外也涉及到一些可移植性問題。

I/O埠分配

下面我們提供了一個注冊的介面，它允允許驅動程序聲明自己需要操作的埠：

#include <linux/ioport.h>

struct resource *request_region(unsigned long first, unsigned long n, const char *name);

它告訴內核，我們要使用起始於first的n個埠。name是設備的名稱。如果分配成功返回非NULL，如果失敗返回NULL。

所有分配的埠可從/proc/ioports中找到。如果我們無法分配到我們要的埠集合，則可以查看這個文件哪個驅動程序已經分配了這些埠。

如果不再使用這些埠，則用下面函數返回這些埠給系統：

void release_region(unsigned long start, unsigned long n);

下面函數允許驅動程序檢查給定的I/O埠是否可用：

int check_region(unsigned long first, unsigned long n);//不可用返回負的錯誤代碼

我們不贊成用這個函數，因為它返回成功並不能確保分配能夠成功，因為檢查和其後的分配並不是原子操作。我們應該始終使用request_region，因為這個函數執行了必要的鎖定，以確保分配過程以安全原子的方式完成。

操作I/O埠

當驅動程序請求了需要使用的I/O埠范圍後，必須讀取和/或寫入這些埠。為此，大多數硬體都會把8位、16位、32位區分開來。它們不能像訪問系統內存那樣混淆使用。

因此，C語言程序必須調用不同的函數訪問大小不同的埠。那些只支持映射的I/O寄存器的計算機體系架構通過把I/O埠地址重新映射到內存地址來偽裝埠I/O，並且為了易於移植，內核對驅動程序隱藏了這些細節。Linux內核頭文件中(在與體系架構相關的頭文件<asm/io.h>中)定義了如下一些訪問I/O埠的內聯函數：

unsigned inb(unsigned port);

void outb(unsigned char byte, unsigned port);

位元組讀寫埠。

unsigned inw(unsigned port);

void outw(unsigned short word, unsigned port);

訪問16位埠

unsigned inl(unsigned port);

void outl(unsigned longword, unsigned port);

訪問32位埠

在用戶空間訪問I/O埠

上面這些函數主要是提供給設備驅動程序使用的，但它們也可以用戶空間使用，至少在PC類計算機上可以使用。GNU的C庫在<sys/io.h>中定義了這些函數。如果要要用戶空間使用inb及相關函數，則必須滿足正下面這些條件：

編譯程序時必須帶有-O選項來強制內聯函數的展開。

必須用ioperm(獲取單個埠的許可權)或iopl(獲取整個I/O空間)系統調用來獲取對埠進行I/O操作的許可權。這兩個函數都是x86平台特有的。

必須以root身份運行該程序才能調用ioperm或iopl。或者進程的祖先進程之一已經以root身份獲取對埠的訪問。

如果宿主平台沒有以上兩個系統調用，則用戶空間程序仍然可以使用/dev/port設備文件訪問I/O埠。不過要注意，該設備文件的含義與平台密切相關，並且除PC平台以處，它幾乎沒有什麼用處。

串操作

以上的I/O操作都是一次傳輸一個數據，作為補充，有些處理器實現了一次傳輸一個數據序列的特殊指令，序列中的數據單位可以是位元組、字、雙字。這些指令稱為串操作指令，它們執行這些任務時比一個C語言編寫的循環語句快得多。下面列出的宏實現了串I/O：

void insb(unsigned port, void *addr, unsigned long count);

void outsb(unsigned port, void *addr, unsigned long count);從內存addr開始連續讀/寫count數目的位元組。只對單一埠port讀取或寫入數據

void insw(unsigned port, void *addr, unsigned long count);

void outsw(unsigned port, void *addr, unsigned long count);對一個16位埠讀寫16位數據

void insl(unsigned port, void *addr, unsigned long count);

void outsl(unsigned port, void *addr, unsigned long count);對一個32位埠讀寫32位數據

在使用串I/O操作函數時，需要銘記的是：它們直接將位元組流從埠中讀取或寫入。因此，當埠和主機系統具有不同的位元組序時，將導致不可預期的結果。使用inw讀取埠將在必要時交換位元組，以便確保讀入的值匹配於主機的位元組序。然而，串函數不會完成這種交換。

暫停式I/O

在處理器試圖從匯流排上快速傳輸數據時，某些平台(特別是i386)就會出現問題。當處理器時鍾比外設時鍾(如ISA)快時就會出現問題，並且在設備板上特別慢時表現出來。為了防止出現丟失數據的情況，可以使用暫停式的I/O函數來取代通常的I/O函數，這些暫停式的I/O函數很像前面介紹的那些I/O函數，不同之處是它們的名字用_p結尾，如inb_p、outb_p等等。在linux支持的大多數平台上都定義了這些函數，不過它們常常擴展為非暫停式I/O同樣的代碼，因為如果不使用過時的外設匯流排就不需要額外的暫停。

平台相關性

I/O指令是與處理器密切相關的。因為它們的工作涉及到處理器移入移出數據的細節，所以隱藏平台間的差異非常困難。因此，大部分與I/O埠相關的源代碼都與平台相關。

回顧前面函數列表可以看到有一處不兼容的地方，即數據類型。函數的參數根據各平台體系架構上的不同要相應地使用不同的數據類型。例如，port參數在x86平台上(處理器只支持64KB的I/O空間)上定義為unsigned short，但在其他平台上定義為unsigned long，在這些平台上，埠是與內存在同一地址空間內的一些特定區域。

感興趣的讀者可以從io.h文件獲得更多信息，除了本章介紹的函數，一些與體系架構相關的函數有時也由該文件定義。

值得注意的是，x86家族之外的處理器都不為埠提供獨立的地址空間。

I/O操作在各個平台上執行的細節在對應平台的編程手冊中有詳細的敘述;也可以從web上下載這些手冊的PDF文件。

I/O埠示例

演示設備驅動程序的埠I/O的示例代碼運行於通用的數字I/O埠上，這種埠在大多數計算機平台上都能找到。

數字I/O埠最常見的一種形式是一個位元組寬度的I/O區域，它或者映射到內存，或者映射到埠。當把數字寫入到輸出區域時，輸出引腳上的電平信號隨著寫入的各位而發生相應變化。從輸入區域讀取到的數據則是輸入引腳各位當前的邏輯電平值。

這類I/O埠的具體實現和軟體介面是因系統而異的。大多數情況下，I/O引腳由兩個I/O區域控制的：一個區域中可以選擇用於輸入和輸出的引腳，另一個區域中可以讀寫實際的邏輯電平。不過有時情況簡單些，每個位不是輸入就是輸出(不過這種情況下就不能稱為“通用I/O"了);在所有個人計算機上都能找到的並口就是這樣的非通用的I/O埠。

並口簡介

並口的最小配置由3個8位埠組成。第一個埠是一個雙向的數據寄存器，它直接連接到物理連接器的2~9號引腳上。第二個埠是一個只讀的狀態寄存器;當並口連接列印機時，該寄存器報告列印機狀態，如是否是線、缺紙、正忙等等。第三個埠是一個只用於輸出的控制寄存器，它的作用之一是控制是否啟用中斷。

如下所示：並口的引腳

示例驅動程序

while(count--) {

outb(*(ptr++), port);

wmb();

}

使用I/O內存

除了x86上普遍使的I/O埠之外，和設備通信的另一種主要機制是通過使用映射到內存的寄存器或設備內存，這兩種都稱為I/O內存，因為寄存器和內存的差別對軟體是透明的。

I/O內存僅僅是類似RAM的一個區域，在那裡處理器可以通過匯流排訪問設備。這種內存有很多用途，比如存放視頻數據或乙太網數據包，也可以用來實現類似I/O埠的設備寄存器(也就是說，對它們的讀寫也存在邊際效應)。

根據計算機平台和所使用匯流排的不同，i/o內存可能是，也可能不是通過頁表訪問的。如果訪問是經由頁表進行的，內核必須首先安排物理地址使其對設備驅動程序可見(這通常意味著在進行任何I/O之前必須先調用ioremap)。如果訪問無需頁表，那麼I/O內存區域就非常類似於I/O埠，可以使用適當形式的函數讀取它們。

不管訪問I/O內存是否需要調用ioremap，都不鼓勵直接使用指向I/O內存的指針。相反使用包裝函數訪問I/O內存，這一方面在所有平台上都是安全的，另一方面，在可以直接對指針指向的內存區域執行操作的時候，這些函數是經過優化的。並且直接使用指針會影響程序的可移植性。

I/O內存分配和映射

在使用之前，必須首先分配I/O區域。分配內存區域的介面如下(在<linux/ioport.h>中定義)：

struct resource *request_mem_region(unsigned long start, unsigned long len, char *name);

該函數從start開始分配len位元組長的內存區域。如果成功返回非NULL，否則返回NULL值。所有的I/O內存分配情況可從/proc/iomem得到。

不再使用已分配的內存區域時，使用如下介面釋放：

void release_mem_region(unsigned long start, unsigned long len);

下面函數用來檢查給定的I/O內存區域是否可用的老函數：

int check_mem_region(unsigned long start, unsigned long len);//這個函數和check_region一樣不安全，應避免使用

分配內存之後我們還必須確保該I/O內存對內存而言是可訪問的。獲取I/O內存並不意味著可引用對應的指針;在許多系統上，I/O內存根本不能通過這種方式直接訪問。因此，我們必須由ioremap函數建立映射，ioremap專用於為I/O內存區域分配虛擬地址。

我們根據以下定義來調用ioremap函數：

#include <asm/io.h>

void *ioremap(unsigned long phys_addr, unsigned long size);

void *ioremap_nocache(unsigned long phys_addr, unsigned long size);在大多數計算機平台上，該函數和ioremap相同：當所有I/O內存已屬於非緩存地址時，就沒有必要實現ioremap的獨立的，非緩沖版本。

void iounmap(void *addr);

記住，由ioremap返回的地址不應該直接引用，而應該使用內核提供的accessor函數。

訪問I/O內存

在某些平台上我們可以將ioremap的返回值直接當作指針使用。但是，這種使用不具有可移植性，訪問I/O內存的正確方法是通過一組專用於些目的的函數(在<asm/io.h>中定義)。

從I/O內存中讀取，可使用以下函數之一：

unsigned int ioread8(void *addr);

unsigned int ioread16(void *addr);

unsigned int ioread32(void *addr);

其中，addr是從ioremap獲得的地址(可能包含一個整數偏移量);返回值是從給定I/O內存讀取到的值。

寫入I/O內存的函數如下：

void iowrite8(u8 value, void *addr);

void iowrite16(u16 value, void *addr);

void iowrite32(u32 value, void *addr);

如果必須在給定的I/O內存地址處讀/寫一系列值，則可使用上述函數的重復版本：

void ioread8_rep(void *addr, void *buf, unsigned long count);

void ioread16_rep(void *addr, void *buf, unsigned long count);

void ioread32_rep(void *addr, void *buf, unsigned long count);

void iowrite8_rep(void *addr, const void *buf, unsigned long count);

void iowrite16_rep(void *addr, const void *buf, unsigned long count);

void iowrite32_rep(void *addr, const void *buf, unsigned long count);

上述函數從給定的buf向給定的addr讀取或寫入count個值。count以被寫入數據的大小為單位。

上面函數均在給定的addr處執行所有的I/O操作，如果我們要在一塊I/O內存上執行操作，則可以使用下面的函數：

void memset_io(void *addr, u8 value, unsigned int count);

void memcpy_fromio(void *dest, void *source, unsigned int count);

void memcpy_toio(void *dest, void *source, unsigned int count);

上述函數和C函數庫的對應函數功能一致。

像I/O內存一樣使用I/O埠

某些硬體具有一種有趣的特性：某些版本使用I/O埠，而其他版本則使用I/O內存。導出給處理器的寄存器在兩種情況下都是一樣的，但訪問方法卻不同。為了讓處理這類硬體的驅動程序更加易於編寫，也為了最小化I/O埠和I/O內存訪問這間的表面區別，2.6內核引入了ioport_map函數：

void *ioport_map(unsigned long port, unsigned int count);

該函數重新映射count個I/O埠，使其看起來像I/O內存。此後，驅動程序可在該函數返回的地址上使用ioread8及其相關函數，這樣就不必理會I/O埠和I/O內存之間的區別了。

當不需要這種映射時使用下面函數一撤消：

void ioport_unmap(void *addr);

這些函數使得I/O埠看起來像內存。但需要注意的是，在重新映射之前，我們必須通過request_region來分配這些I/O埠。

為I/O內存重用short

前面介紹的short示例模塊訪問的是I/O埠，它也可以訪問I/O內存。為此必須在載入時通知它使用I/O內存，另外還要修改base地址以使其指向I/O區域。

下例是在MIPS開發板上點亮調試用的LED：

mips.root# ./short_load use_mem=1 base = 0xb7ffffc0

mips.root# echo -n 7 > /dev/short0

下面代碼是short寫入內存區域時使用的循環：

while(count--) {

iowrite8(*ptr++, address);

wmb();

}

1MB地址空間之下的ISA內存

最廣為人知的I/O內存區之一就是個人計算機上的ISA內存段。它的內存范圍在64KB(0xA0000)到1MB(0x100000)之間，因此它正好出現在常規系統RAM的中間。這種地址看上去有點奇怪，因為這個設計決策是20世紀80年代早期作出的，在當時看來沒有人會用到640KB以上的內存。

導航:首頁 > 操作系統 > linuxwmb

linuxwmb

與linuxwmb相關的資料