程序員的文件碎片_程序員如何清理電腦垃圾

1. 內存碎片的減少內存碎片

內存碎片是因為在分配一個內存塊後，使之空閑，但不將空閑內存歸還給最大內存塊而產生的。最後這一步很關鍵。如果內存分配程序是有效的，就不能阻止系統分配內存塊並使之空閑。即使一個內存分配程序不能保證返回的內存能與最大內存塊相連接（這種方法可以徹底避免內存碎片問題），但你可以設法控制並限制內存碎片。所有這些作法涉及到內存塊的分割。每當系統減少被分割內存塊的數量，確保被分割內存塊盡可能大時，你就會有所改進。
這樣做的目的是盡可能多次反復使用內存塊，而不要每次都對內存塊進行分割，以正好符合請求的存儲量。分割內存塊會產生大量的小內存碎片，猶如一堆散沙。以後很難把這些散沙與其餘內存結合起來。比較好的辦法是讓每個內存塊中都留有一些未用的位元組。留有多少位元組應看系統要在多大程度上避免內存碎片。對小型系統來說，增加幾個位元組的內部碎片是朝正確方向邁出的一步。當系統請求1位元組內存時，你分配的存儲量取決於系統的工作狀態。
如果系統分配的內存存儲量的主要部分是 1 ～ 16 位元組，則為小內存也分配 16 位元組是明智的。只要限制可以分配的最大內存塊，你就能夠獲得較大的節約效果。但是，這種方法的缺點是，系統會不斷地嘗試分配大於極限的內存塊，這使系統可能會停止工作。減少最大和最小內存塊存儲量之間內存存儲量的數量也是有用的。採用按對數增大的內存塊存儲量可以避免大量的碎片。例如，每個存儲量可能都比前一個存儲量大 20%。在嵌入式系統中採用「一種存儲量符合所有需要」對於嵌入式系統中的內存分配程序來說可能是不切實際的。這種方法從內部碎片來看是代價極高的，但系統可以徹底避免外部碎片，達到支持的最大存儲量。
將相鄰空閑內存塊連接起來是一種可以顯著減少內存碎片的技術。如果沒有這一方法，某些分配演算法（如最先適合演算法）將根本無法工作。然而，效果是有限的，將鄰近內存塊連接起來只能緩解由於分配演算法引起的問題，而無法解決根本問題。而且，當內存塊存儲量有限時，相鄰內存塊連接可能很難實現。
有些內存分配器很先進，可以在運行時收集有關某個系統的分配習慣的統計數據，然後，按存儲量將所有的內存分配進行分類，例如分為小、中和大三類。系統將每次分配指向被管理內存的一個區域，因為該區域包括這樣的內存塊存儲量。較小存儲量是根據較大存儲量分配的。這種方案是最先適合演算法和一組有限的固定存儲量演算法的一種有趣的混合，但不是實時的。
有效地利用暫時的局限性通常是很困難的，但值得一提的是，在內存中暫時擴展共處一地的分配程序更容易產生內存碎片。盡管其它技術可以減輕這一問題，但限制不同存儲量內存塊的數目仍是減少內存碎片的主要方法。
現代軟體環境業已實現各種避免內存碎片的工具。例如，專為分布式高可用性容錯系統開發的 OSE 實時操作系統可提供三種運行時內存分配程序：內核 alloc()，它根據系統或內存塊池來分配；堆 malloc()，根據程序堆來分配； OSE 內存管理程序 alloc_region，它根據內存管理程序內存來分配。
從許多方面來看，Alloc就是終極內存分配程序。它產生的內存碎片很少，速度很快，並有判定功能。你可以調整甚至去掉內存碎片。只是在分配一個存儲量後，使之空閑，但不再分配時，才會產生外部碎片。內部碎片會不斷產生，但對某個給定的系統和八種存儲量來說是恆定不變的。
Alloc 是一種有八個自由表的固定存儲量內存分配程序的實現方法。系統程序員可以對每一種存儲量進行配置，並可決定採用更少的存儲量來進一步減少碎片。除開始時以外，分配內存塊和使內存塊空閑都是恆定時間操作。首先，系統必須對請求的存儲量四捨五入到下一個可用存儲量。就八種存儲量而言，這一目標可用三個如果語句來實現。其次，系統總是在八個自由表的表頭插入或刪除內存塊。開始時，分配未使用的內存要多花幾個周期的時間，但速度仍然極快，而且所花時間恆定不變。
堆 malloc() 的內存開銷（8 ～ 16 位元組/分配）比 alloc小，所以你可以停用內存的專用權。malloc() 分配程序平均來講是相當快的。它的內部碎片比alloc()少，但外部碎片則比alloc()多。它有一個最大分配存儲量，但對大多數系統來說，這一極限值足夠大。可選的共享所有權與低開銷使 malloc() 適用於有許多小型對象和共享對象的 C++ 應用程序。堆是一種具有內部堆數據結構的夥伴系統的實現方法。在 OSE 中，有 28 個不同的存儲量可供使用，每種存儲量都是前兩種存儲量之和，於是形成一個斐波那契（Fibonacci）序列。實際內存塊存儲量為序列數乘以 16 位元組，其中包括分配程序開銷或者 8 位元組/分配（在文件和行信息啟用的情況下為 16 位元組）。
當你很少需要大塊內存時，則OSE內存管理程序最適用。典型的系統要把存儲空間分配給整個系統、堆或庫。在有 MMU 的系統中，有些實現方法使用 MMU 的轉換功能來顯著降低甚至消除內存碎片。在其他情況下，OSE 內存管理程序會產生非常多的碎片。它沒有最大分配存儲量，而且是一種最先適合內存分配程序的實現方法。內存分配被四捨五入到頁面的偶數——典型值是 4 k 位元組。

2. [編程知識]如何分配內存內存碎片處理技術

內存碎片是一個很棘手的問題。如何分配內存決定著內存碎片是否會、何時會、如何會成為一個問題。即使在系統中事實上仍然有許多空閑內存時，內存碎片還會最終導致出現內存用完的情況。一個不斷產生內存碎片的系統，不管產生的內存碎片多麼小，只要時間足夠長，就會將內存用完。這種情況在許多嵌入式系統中，特別是在高可用性系統中是不可接受的。有些軟體環境，如 OSE 實時操作系統已經備有避免內存碎片的良好工具，但個別程序員做出的選擇仍然會對最終結果形成影響。「碎片的內存」描述一個系統中所有不可用的空閑內存。這些資源之所以仍然未被使用，是因為負責分配內存的分配器使這些內存無法使用。這一問題通常都會發生，原因在於空閑內存以小而不連續方式出現在不同的位置。由於分配方法決定內存碎片是否是一個問題，因此內存分配器在保證空閑資源可用性方面扮演著重要的角色。編譯時間與運行時間在許多情況下都會出現內存分配問題。程序員可以通過編譯程序和鏈接程序，為結構、並集、數組和標量（用作局部變數、靜態變數或全局變數）方面的數據分配內存，程序員還可以在運行時間使用諸如 malloc()調用命令動態地分配內存。當用編譯程序和鏈接程序完成內存分配功能時，就不會出現內存碎片，因為編譯程序了解數據壽命。掌握可供使用的數據壽命，好處在於可以使數據以後進先出的方式疊加起來。這樣就可以使內存分配程序工作效率更高，而不會出現內存碎片。一般來說，運行時間內的內存分配是不可疊加的。內存分配在時間上是獨立的，從而使得碎片問題難以解決。圖1，內存碎片的幾種形式。內存分配程序浪費內存的基本方式有三種：即額外開銷、內部碎片以及外部碎片（圖 1）。內存分配程序需要存儲一些描述其分配狀態的數據。這些存儲的信息包括任何一個空閑內存塊的位置、大小和所有權，以及其它內部狀態詳情。一般來說，一個運行時間分配程序存放這些額外信息最好的地方是它管理的內存。內存分配程序需要遵循一些基本的內存分配規則。例如，所有的內存分配必須起始於可被 4、8 或 16 整除（視處理器體系結構而定）的地址。內存分配程序把僅僅預定大小的內存塊分配給客戶，可能還有其它原因。當某個客戶請求一個 43 位元組的內存塊時，它可能會獲得 44位元組、48位元組甚至更多的位元組。由所需大小四捨五入而產生的多餘空間就叫內部碎片。外部碎片的產生是當已分配內存塊之間出現未被使用的差額時，就會產生外部碎片。例如，一個應用程序分配三個連續的內存塊，然後使中間的一個內存塊空閑。內存分配程序可以重新使用中間內存塊供將來進行分配，但不太可能分配的塊正好與全部空閑內存一樣大。倘若在運行期間，內存分配程序不改變其實現法與四捨五入策略，則額外開銷和內部碎片在整個系統壽命期間保持不變。雖然額外開銷和內部碎片會浪費內存，因此是不可取的，但外部碎片才是嵌入系統開發人員真正的敵人，造成系統失效的正是分配問題。定義內存碎片的方法有幾種，其中最常用的是：這一方法適用於外部碎片，但可以修改這一公式使之包括內部碎片，辦法是把內部碎片加入到分母中。內存碎片是一個介於 0 和 1 之間的分數。一個碎片為 1(100%)的系統就是把內存全用完了。如果所有空閑內存都在一個內存塊（最大內存塊）中，碎片為 0%。當所有空閑內存的四分之一在最大內存塊中時，碎片為 75%。例子如下：一個系統有 5M 位元組的空閑內存，當它可用來分配的最大內存塊為 50 k 位元組時，其內存碎片為99%。這個 99%內存碎片實例來自開發嵌入式軟實時系統期間出現的一種真實情況。當這種碎片程度發生一秒後，系統就崩潰了。該系統在碎片率達到 99% 之前，已經進行了約兩周的連續現場測試。這種情況是如何發生的？為什麼會發現得如此晚？當然，系統都經過測試，但測試很少超過兩個小時。交付前的最後壓力測試持續了一個周末。在這樣短的測試周期內未必會產生內存碎片的後果，所以就發生了內存碎片需要多長時間才會達到臨界值，這一問題很難回答。對某些應用來說，在某些情況下，系統會在用完內存前達到一種穩定狀態。而對於另一些應用來說，系統則不會及時達到穩定狀態（圖 2）。只要消除不確定性因素和風險因素，不產生碎片的內存分配程序（圖 3）就能快速達到一種穩定狀態，從而有助於開發人員夜晚安穩睡覺。在開發數月甚至數年不再重新啟動的長期運行系統時，快速收斂到穩定狀態是一個重要因素。在比系統連續運行周期短的時間內，對系統進行適當的測試，這是必不可少的。圖2，這一案例研究把最先適合內存分配程序用於一個嵌入系統項目。系統在現場測試中連續運行了兩周，然後碎片率達到 99%。圖3，一個不產生碎片的內存分配程序一旦試驗應用程序的全部，它就能達到穩定狀態。很難確定哪種內存分配演算法更勝一籌，因為每種演算法在不同的應用中各有所長（表 1）。最先適合內存分配演算法是最常用的一種。它使用了四個指針：MSTART 指向被管理內存的始端；MEND 指向被管理內存的末尾；MBREAK 指向 MSTART 和 MEND 之間已用內存的末端； PFREE 則指向第一個空閑內存塊（如果有的話）。在系統開始運行時，PFREE 為 NULL，MBREAK 指向 MSTART。當一個分配請求來到時，分配程序首先檢查 PFREE有無空閑內存塊。由於 PFREE 為 NULL，一個具有所請求存儲量加上管理標題的內存塊就脫離 MBREAK ，然後MBREAK就更新。這一過程反復進行，直至系統使一個內存塊空閑，管理標題包含有該存儲塊的存儲量為止。此時，PFREE 通過頭上的鏈接表插入項被更新為指向該內存塊，而塊本身則用一個指向舊 PFREE 內容的指針進行更新，以建立一個鏈接表。下一次出現分配請求時，系統就會搜索空閑內存塊鏈接表，尋找適合請求存儲量的第一個空閑內存塊。一旦找到合適的內存塊，它將此內存塊分成兩部分，一部分返還給系統，另一部分則送回給自由表。最先適合內存分配演算法實現起來簡單，而且開始時很好用。但是，經過一段時間後，會出現如下的情況：當系統將內存交給自由表時，它會從自由表的開頭部分去掉大內存塊，插入剩餘的小內存塊。最先適合演算法實際上成了一個排序演算法，即把所有小內存碎片放在自由表的開頭部分。因此，自由表會變得很長，有幾百甚至幾千個元素。因此，內存分配變得時間很長又無法預測，大內存塊分配所花時間要比小內存塊分配來得長。另外，內存塊的無限制拆分使內存碎片程度很高。有些實現方法在使內存空閑時會將鄰近的空閑內存塊連接起來。這種方法多少有些作用，而最先適合演算法與時間共處演算法(time co-location)和空間共處演算法(spatial co-location)不同，它在使內存塊空閑時，無法提高相鄰內存塊同時空閑的概率。最佳適合與最差適合分配程序最佳適合演算法在功能上與最先適合演算法類似，不同之處是，系統在分配一個內存塊時，要搜索整個自由表，尋找最接近請求存儲量的內存塊。這種搜索所花的時間要比最先適合演算法長得多，但不存在分配大小內存塊所需時間的差異。最佳適合演算法產生的內存碎片要比最先適合演算法多，因為將小而不能使用的碎片放在自由表開頭部分的排序趨勢更為強烈。由於這一消極因素，最佳適合演算法幾乎從來沒有人採用過。最差適合演算法也很少採用。最差適合演算法的功能與最佳適合演算法相同，不同之處是，當分配一個內存塊時，系統在整個自由表中搜索與請求存儲量不匹配的內存快。這種方法比最佳適合演算法速度快，因為它產生微小而又不能使用的內存碎片的傾向較弱。始終選擇最大空閑內存塊，再將其分為小內存塊，這樣就能提高剩餘部分大得足以供系統使用的概率。夥伴(buddy)分配程序與本文描述的其它分配程序不同，它不能根據需要從被管理內存的開頭部分創建新內存。它有明確的共性，就是各個內存塊可分可合，但不是任意的分與合。每個塊都有個朋友，或叫「夥伴」，既可與之分開，又可與之結合。夥伴分配程序把內存塊存放在比鏈接表更先進的數據結構中。這些結構常常是桶型、樹型和堆型的組合或變種。一般來說，夥伴分配程序的工作方式是難以描述的，因為這種技術隨所選數據結構的不同而各異。由於有各種各樣的具有已知特性的數據結構可供使用，所以夥伴分配程序得到廣泛應用。有些夥伴分配程序甚至用在源碼中。夥伴分配程序編寫起來常常很復雜，其性能可能各不相同。夥伴分配程序通常在某種程度上限制內存碎片。固定存儲量分配程序有點像最先空閑演算法。通常有一個以上的自由表，而且更重要的是，同一自由表中的所有內存塊的存儲量都相同。至少有四個指針：MSTART 指向被管理內存的起點，MEND 指向被管理內存的末端，MBREAK 指向 MSTART 與 MEND 之間已用內存的末端，而 PFREE[n] 則是指向任何空閑內存塊的一排指針。在開始時，PFREE[*] 為 NULL，MBREAK 指針為 MSTART。當一個分配請求到來時，系統將請求的存儲量增加到可用存儲量之一。然後，系統檢查 PFREE[ 增大後的存儲量 ] 空閑內存塊。因為 PFREE[ 增大後的存儲量 ] 為 NULL，一個具有該存儲量加上一個管理標題的內存塊就脫離 MBREAK，MBREAK 被更新。這些步驟反復進行，直至系統使一個內存塊空閑為止，此時管理標題包含有該內存塊的存儲量。當有一內存塊空閑時，PFREE[ 相應存儲量 ] 通過標題的鏈接表插入項更新為指向該內存塊，而該內存塊本身則用一個指向 PFREE[ 相應存儲量 ] 以前內容的指針來更新，以建立一個鏈接表。下一次分配請求到來時，系統將 PFREE[ 增大的請求存儲量 ] 鏈接表的第一個內存塊送給系統。沒有理由搜索鏈接表，因為所有鏈接的內存塊的存儲量都是相同的。固定存儲量分配程序很容易實現，而且便於計算內存碎片，至少在塊存儲量的數量較少時是這樣。但這種分配程序的局限性在於要有一個它可以分配的最大存儲量。固定存儲量分配程序速度快，並可在任何狀況下保持速度。這些分配程序可能會產生大量的內部內存碎片，但對某些系統而言，它們的優點會超過缺點。減少內存碎片內存碎片是因為在分配一個內存塊後，使之空閑，但不將空閑內存歸還給最大內存塊而產生的。最後這一步很關鍵。如果內存分配程序是有效的，就不能阻止系統分配內存塊並使之空閑。即使一個內存分配程序不能保證返回的內存能與最大內存塊相連接（這種方法可以徹底避免內存碎片問題），但你可以設法控制並限制內存碎片。所有這些作法涉及到內存塊的分割。每當系統減少被分割內存塊的數量，確保被分割內存塊盡可能大時，你就會有所改進。這樣做的目的是盡可能多次反復使用內存塊，而不要每次都對內存塊進行分割，以正好符合請求的存儲量。分割內存塊會產生大量的小內存碎片，猶如一堆散沙。以後很難把這些散沙與其餘內存結合起來。比較好的辦法是讓每個內存塊中都留有一些未用的位元組。留有多少位元組應看系統要在多大程度上避免內存碎片。對小型系統來說，增加幾個位元組的內部碎片是朝正確方向邁出的一步。當系統請求1位元組內存時，你分配的存儲量取決於系統的工作狀態。如果系統分配的內存存儲量的主要部分是 1 ～ 16 位元組，則為小內存也分配 16 位元組是明智的。只要限制可以分配的最大內存塊，你就能夠獲得較大的節約效果。但是，這種方法的缺點是，系統會不斷地嘗試分配大於極限的內存塊，這使系統可能會停止工作。減少最大和最小內存塊存儲量之間內存存儲量的數量也是有用的。採用按對數增大的內存塊存儲量可以避免大量的碎片。例如，每個存儲量可能都比前一個存儲量大 20%。在嵌入式系統中採用「一種存儲量符合所有需要」對於嵌入式系統中的內存分配程序來說可能是不切實際的。這種方法從內部碎片來看是代價極高的，但系統可以徹底避免外部碎片，達到支持的最大存儲量。將相鄰空閑內存塊連接起來是一種可以顯著減少內存碎片的技術。如果沒有這一方法，某些分配演算法（如最先適合演算法）將根本無法工作。然而，效果是有限的，將鄰近內存塊連接起來只能緩解由於分配演算法引起的問題，而無法解決根本問題。而且，當內存塊存儲量有限時，相鄰內存塊連接可能很難實現。有些內存分配器很先進，可以在運行時收集有關某個系統的分配習慣的統計數據，然後，按存儲量將所有的內存分配進行分類，例如分為小、中和大三類。系統將每次分配指向被管理內存的一個區域，因為該區域包括這樣的內存塊存儲量。較小存儲量是根據較大存儲量分配的。這種方案是最先適合演算法和一組有限的固定存儲量演算法的一種有趣的混合，但不是實時的。有效地利用暫時的局限性通常是很困難的，但值得一提的是，在內存中暫時擴展共處一地的分配程序更容易產生內存碎片。盡管其它技術可以減輕這一問題，但限制不同存儲量內存塊的數目仍是減少內存碎片的主要方法。現代軟體環境業已實現各種避免內存碎片的工具。例如，專為分布式高可用性容錯系統開發的 OSE 實時操作系統可提供三種運行時內存分配程序：內核 alloc()，它根據系統或內存塊池來分配；堆 malloc()，根據程序堆來分配； OSE 內存管理程序 alloc_region，它根據內存管理程序內存來分配。從許多方面來看，Alloc就是終極內存分配程序。它產生的內存碎片很少，速度很快，並有判定功能。你可以調整甚至去掉內存碎片。只是在分配一個存儲量後，使之空閑，但不再分配時，才會產生外部碎片。內部碎片會不斷產生，但對某個給定的系統和八種存儲量來說是恆定不變的。 Alloc 是一種有八個自由表的固定存儲量內存分配程序的實現方法。系統程序員可以對每一種存儲量進行配置，並可決定採用更少的存儲量來進一步減少碎片。除開始時以外，分配內存塊和使內存塊空閑都是恆定時間操作。首先，系統必須對請求的存儲量四捨五入到下一個可用存儲量。就八種存儲量而言，這一目標可用三個如果語句來實現。其次，系統總是在八個自由表的表頭插入或刪除內存塊。開始時，分配未使用的內存要多花幾個周期的時間，但速度仍然極快，而且所花時間恆定不變。堆malloc() 的內存開銷（8 ～ 16 位元組/分配）比 alloc小，所以你可以停用內存的專用權。malloc() 分配程序平均來講是相當快的。它的內部碎片比alloc()少，但外部碎片則比alloc()多。它有一個最大分配存儲量，但對大多數系統來說，這一極限值足夠大。可選的共享所有權與低開銷使 malloc() 適用於有許多小型對象和共享對象的 C++ 應用程序。堆是一種具有內部堆數據結構的夥伴系統的實現方法。在 OSE 中，有 28 個不同的存儲量可供使用，每種存儲量都是前兩種存儲量之和，於是形成一個斐波那契（Fibonacci）序列。實際內存塊存儲量為序列數乘以 16 位元組，其中包括分配程序開銷或者 8 位元組/分配（在文件和行信息啟用的情況下為 16 位元組）。當你很少需要大塊內存時，則OSE內存管理程序最適用。典型的系統要把存儲空間分配給整個系統、堆或庫。在有 MMU 的系統中，有些實現方法使用 MMU 的轉換功能來顯著降低甚至消除內存碎片。在其他情況下，OSE 內存管理程序會產生非常多的碎片。它沒有最大分配存儲量，而且是一種最先適合內存分配程序的實現方法。內存分配被四捨五入到頁面的偶數——典型值是 4 k 位元組。（T111）

3. TIFF、JPEG、CGM、EMF、PNG分別是什麼格式的文件

常見的擴展名】我就略說些經常遇到的，但並不是人人都認識的擴展名：
〔*.exe‖可執行文件；直接打開〕
〔*.rar‖一種壓縮包；用WinRAR打開〕
〔*.zip‖一種壓縮包；用WinRAR打開，或者WinXP也可以直接打開〕
〔*.iso‖虛擬光碟機；用WinRAR打開，也可用其他虛擬光碟機軟體〕
〔*.doc‖word文檔；用Office Word打開〕
〔*.ppt‖幻燈片；用Office PowerPiont打開〕
〔*.xls‖電子表格；用Office Excel打開〕
〔*.wps‖WPS文檔；用金山WPS打開〕
〔*.txt‖文本文檔；默認用記事本打開〕
〔*.lrc‖動態歌詞；可以用記事本打開〕
〔*.rm，*.rmvb‖高清視頻；可以用RealOnePlayer打開〕
〔*.mp3，*.wma，*.wav‖一些音樂〕
〔*.jpg，*.bmp，*.gif‖一些圖片,其中gif可以是動態的〕
〔*.wfs‖Flash文件；可以用IE打開，也可用FlashPlayer打開〕
〔*.torrent‖BT文件；可以用BitComet打開〕

A
ACE：Ace壓縮檔案格式
ACT：Microsoft office助手文件
AIF，AIFF：音頻互交換文件，Silicon Graphic and Macintosh應用程序的聲音格式
ANI：Windows系統中的動畫游標
ARC：LH ARC的壓縮檔案文件
ARJ：Robert Jung ARJ壓縮包文件
ASD：Microsoft Word的自動保存文件；Microsoft高級流媒體格式（microsoft advanced streaming
format，ASF）的描述文件；可用NSREX打開 Velvet Studio例子文件
ASF：Microsoft高級流媒體格式文件
ASM：匯編語言源文件，Pro/E裝配文件
ASP：動態網頁文件；ProComm Plus安裝與連接腳本文件；Astound介紹文件
AST：Astound多媒體文件；ClarisWorks「助手」文件
Axx：ARJ壓縮文件的分包序號文件，用於將一個大文件壓至幾個小的壓縮包中（xx取01-99的數字）
A3L：Authorware 3.x庫文件
A4L：Authorware 4.x庫文件
A5L：Authorware 5.x庫文件
A3M，A4M：Authorware Macintosh未打包文件
A3W，A4W，A5W：未打包的Authorware Windows文件
B
BAK：備份文件
BAS：BASIC源文件
BAT：批處理文件
BIN：二進制文件
BINHex：蘋果的一種編碼格式
BMP：Windows或OS/2點陣圖文件
BOOK：Adobe FrameMaker Book文件
BOX：Lotus Notes的郵箱文件
BPL：Borlard Delph 4打包庫
BSP：Quake圖形文件
BUN：CakeWalk 聲音捆綁文件(一種MIDI程序)
C
C0l：台風波形文件
CAB：Microsoft壓縮檔案文件
CAD：Softdek的Drafix CAD文件
CAM：Casio照相機格式
CAP：壓縮音樂文件格式
CAS：逗號分開的ASCⅡ文件
CCB：Visual Basic動態按鈕配置文件
CCH：Corel圖表文件
CCO：CyberChat數據文件
CCT：Macromedia Director Shockwave投影
CDA：CD音頻軌道
CDF：Microsoft頻道定義格式文件
CDI：Philip的高密盤交互格式
CDM：Visual dBASE自定義數據模塊文件
CDR：CorelDRAW繪圖文件；原始音頻CD數據文件
CDT：CorelDRAW模板
CDX：CorelDRAW壓縮繪圖文件；Microsoft Visual FoxPro索引文件
CFG：配置文件
CGI：公共網關介面腳本文件
CGM：計算機圖形元文件
CH：OS/2配置文件
CHK：由Windows磁碟碎片整理器或磁碟掃描保存的文件碎片
CHM：編譯過的HTML文件
CHP：Ventura Publisher章節文件
CHR：字元集（字體文件）
CHT：ChartViem文件；Harvard Graphics矢量文件
CIF：Adaptec CD 創建器 CD映像文件
CIL：Clip Gallery下載包
CIM：SimCity 2000文件
CIN：OS/2改變控制文件用於跟蹤INI文件中的變化
CLASS：Java類文件
CLP：Windows 剪貼板文件
CLL：Crick Software Clicker文件
CLS：Visual Basic類文件
CMD：Windows NT，OS/2的命令文件；DOS CD/M命令文件；dBASEⅡ程序文件
CPI：Microsoft MS-DOS代碼頁信息文件
CPL：控制面板擴展名，Corel顏色板
CPP：C++代碼文件
CPR：Corel提供說明書文件
CPT：Corel 照片-繪畫圖像
CST：Macromedia Director Cast文件
CUR：Windows游標文件
D
DBF：dBASE文件，一種由Ashton-Tate創建的格式，可以被ACT！、Lipper、FoxPro、Arago、Wordtech、Xbase和類似資料庫或與資料庫有關產品識別；可用數據文件（能被Excel
97打開）；Oracle 8.1.x表格空間文件
DBX：DataBearn圖像；Microsoft Visual FoxPro表格文件
DCT：Microsoft Visual FoxPro資料庫容器
DCU：Delphi編譯單元文件
DCX：Microsoft Visual FoxPro資料庫容器；基於PCX的傳真圖像；宏
DIR：MacromediaDirector文件
DLL：動態鏈接庫
DOC：FrameMaker或FrameBuilder文檔；Word Star文檔、Word
Perfect文檔、Microsoft：Word文檔；DisplayWrite文檔
DOT：Microsoft Word文檔模板
DPL：Borland Delph 3壓縮庫
DRV：驅動程序
DRW：Micrografx Designer/Draw；Pro/E繪畫文件
DSF：Micrografx Designer VFX文件
DSG：DOOM保存的文件
DSM：Dynamic Studio音樂模塊（MOD）文件
DSP：Microsoft Developer Studio工程文件
DSQ：Corel QUERY（查詢）文件
DST：刺綉機圖形文件
DSW：Microsoft Developer Studio工作區文件
DTA：World Bank（世界銀行）的STARS數據文件
DTD：SGML文檔類型定義（DTD）文件
DTED：地面高度數字數據（圖形的數據格式）文件
DTF：Symantec Q&A相關的資料庫數據文件
DTM：DigiTrakker模塊文件
DUN：Microsoft拔號網路導出文件
DV：數字視頻文件（MIME）
DWG：AutoCAD工程圖文件；AutoCAD或Generic CADD老版本的繪圖格式
DXR：Macromedia Director受保護（不可編輯）電影文件
E
EDA：Ensoniq ASR磁碟映像
EDD：元素定義文檔（FrameMaker+SGML文檔）
EDE：Ensoniq EPS磁碟映像
EDK：Ensoniq KT磁碟映像
EDQ：Ensoniq SQ1/SQ2/Ks32磁碟映像
EDS：Ensoniq SQ80磁碟映像
EDV：Ensoniq VFX-SD磁碟映像
EFA：Ensoniq ASR文件
EFE：Ensoniq EPS文件
EFK：Ensoniq KT文件
EFQ：Ensoniq SQ1/SQ2/Ks32文件
EFS：Ensoniq SQ80文件
EFV：Ensoniq VFX-SD文件
EMD：ABT擴展模塊
EMF：Windows增強元文件
EML：Microsoft Outlook Express郵件消息（MIME RTC822）文件
EXE：可執行文件（程序）
F
FAV：Microsoft Outlook導航條
FAX：傳真類型圖像
FCD：虛擬CD-ROM
FDF：Adobe Acrobat表單文檔文件
FLA：Macromedia Flash電影
FND：Microsoft Explorer保存的搜索文件（Find applet）
FON：系統字體
FRT：Microsoft FoxPro報表文件
FRX：Visual Basic表單文本；Microsoft FoxPro報表文件
FXP：經Microsoft FoxPro編譯的源文件
G
GDM：鈴聲、口哨聲和聲音板模塊格式
GetRight：GetRight未完成的下載文件
GHO：Norton 克隆磁碟映像
GID：Windows 95全局索引文件（包括幫助狀態）
GIF：CompuServe點陣圖文件
GL：動畫格式
GRP：程序管理組
H
HEX：Macintosh BinHex2.0文件
HLP：幫助文件；Date CAD Windows幫助文件
HPP：C++程序頭文件
HQX：Macintosh BinHex 4.0文件
HT：HyperTerminal（超級終端）
HTM，HTML：超文本文檔
HTT：Microsoft超文本模板
HTX：擴展HTML模板
I
ICO：Windows圖標
IDX：Microsoft FoxPro相關資料庫索引文件；Symantec Q&A相關資料庫索引文件；Microsoft Outlook
Express文件
IMG：GEM映像
INF：信息文件
INI：初始化文件；Mwave DSP Synth的「nwsynth.ini」 GMS安裝；Cravis Ultrasound bank安裝
INP：Oracle 3.0版或早期版本的表單源代碼
INRS：INRS遠程通信聲頻
INS：InstallShield安裝腳本；X-Internet簽字文件；Ensoniq EPS字簇設備；Cell/ⅡMAC/PC抽樣設備
INT：中間代碼，當一個源程序經過語法檢查後編譯產生一個可執行代碼
IOF：Findit文檔
IQY：Microsoft Internet查詢文件
ISO：根據ISD 9660有關CD-ROM文件系統標准列出CD-ROM上的文件
ISP：X-Internet簽字文件
IST：數字跟蹤設備文件
ISU：InstallShield卸裝腳本
IT：脈沖跟蹤系統音樂模塊(MOD)文件
ITI：脈沖跟蹤系統設備
ITS：脈沖跟蹤系統抽樣，Internet文檔位置
IV：Open Inventor中使用的文件格式
IVD：超過20/20微觀數據維數或變數等級文件
IVP：超過20/20的用戶子集配置文件
IVT：超過20/20表或集合數據文件
IVX：超過20/20微數據目錄文件
IW：Idlewild屏幕保護程序
IWC：Install Watch文檔
J
J62：Ricoh照相機格式
JAR：Java檔案文件（一種用於applet和相關文件的壓縮文件）
JAVA：Java源文件
JAR：Java檔案文件（一種用於applet和相關文件的壓縮文件）
JAVA：Java源文件
JFF，JFIF，JIF：JPEG文件
JPE，JPEG，JPG：JPEG圖形文件
JS：JavaScript源文件
JSP：HTML網頁，其中包含有對一個Java servlet的參考
K
KAR：卡拉OK MIDI文件（文本+MIDI）
L
LAB：Visual dBASE標簽文件
LBT，LBX：Microsoft FoxPro標簽文件
LDB：Microsoft Access加鎖文件
LHA：LZH更換文件後綴
LOG：日誌文件
LZH：LH ARC壓縮檔案
M
M1V：MPEG相關文件(MIME"mpeg"類型)
M3D：Corel Motion 3D動畫文件
M3U：MPEG URL（MIME聲音文件）
MAM：Microsoft Access宏
MAQ：Microsoft Access查詢文件
MAR：Microsoft Access報表文件
MBX：Microsoft Outlook保存email格式；Eudora郵箱
MCW：Microsoft Word的Macintosh文檔
MDB：Microsoft Access資料庫
MDN：Microsoft Access空資料庫模板
MDW：Microsoft Access工作組文件
MID：MIDI音樂
MMM：Microsoft多媒體電影
MOV：QuickTime for Windows電影
MP2：第二層MPEG音頻文件
MP3：第三層MPEG音頻文件
MPA：MPEG相關文件，MIME「mpeg類型」
MPE，MPEG，MPG：MPEG動畫文件
MPP：Microsoft工程文件；CAD繪圖文件格式
MPR：Microsoft FoxPro菜單（已編譯）
MSI：Windows 安裝器包
MSN：Microsoft 網路文檔；Descent Mission文件
O
OBD：Microsoft Office活頁夾
OBJ：對象文件
OBZ：Microsoft Office活頁夾向導
OCX：Microsoft對象鏈接與嵌入定製控制項
ODS：Microsoft Outlook Express郵箱文件
OFT：Microsoft Outlook模板
OPX：OPL擴展DLL（動態鏈接庫）
OSS：Microsoft Office查找文件
OST：Microsoft Exchange / Outlook 離線文件
P
PAL：壓縮文件
PART：Go！Zilla部分下載文件
PAS：Pascal源代碼
PCS：PICS動畫文件
PDF：Adobe Acrobat
可導出文檔格式文件（可用Web瀏覽器顯示）；Microsoft系統管理伺服器包定義文件；NetWare列印機定義文件
PHP，PHP3：包含有PHP腳本的HTML網頁
PHTML：包含有PHP腳本的HTML網頁；由Perl分析解釋的HTML
PM5：Pagemaker 5.0文件
PM6：Pagemaker 6.0文件
PPS：Microsoft Powerpoint幻燈片放映
PPT：Microsoft Powerpoint演示文稿
PRF：Windows系統文件，Macromedia導演設置文件
PSD：Adobe photoshop點陣圖文件
PSM：Protracker Studio模型格式；Epic游戲的源數據文件
PST：Microsoft Outlook個人文件夾文件
PWL：Windows 95口令列表文件
Q
QIF：QuickTime相關圖像（MIME）；Quicken導入文件
QT，QTM：QuickTime電影
QTI，QTIF：QuickTime相關圖像
QTP：QuickTime優先文件
QTS：Mac PICT圖像文件；QuickTime相關圖像
QTX：QuickTime相關圖像
R
RA：RealAudio聲音文件
RAM：RealAudio元文件
RAR：RAR壓縮檔案（Eugene Roshall格式）
REC：錄音機宏；RapidComm聲音文件
REG：注冊表文件
REP：Visual dBASE報表文件
RES：Microsoft Visual C++資源文件
RM：RealAudio視頻文件
RMF：Rich Map格式（3D游戲編輯器使用它來保存圖）
ROM：基於盒式磁帶的家庭游戲模擬器文件（來自Atari
2600、Colecovision、Sega、Nintendo等盒式磁帶里的ROM完全拷貝，在兩個模擬器之間不可互修改）
Rxx：多卷檔案上的RAR壓縮文件（xx=1～99間的一個數字）
S
SAV：游戲保存文件
SB：原始帶符號位元組（8位）數據
SBK：Creative Labs的Soundfont 1.0 Bank文件；(Soundb laster)/EMU SonndFont v1.x
Bank文件
SBL：Shockwave Flash對象文件
SCF：Windows Explorer命令文件
SCH：Microsoft Schele+1
SCP：撥號網路腳本文件
SCR：Windows屏幕保護；傳真圖像；腳本文件
SFX：RAR自解壓檔案
SHTML：含有伺服器端包括（SSI）的HTML文件
SPL：Shockwave Flash對象；DigiTrakker抽樣
SQL：Informix SQL查詢；通常被資料庫產品用於SQL查詢（腳本、文本、二進制）的文件擴展名
STM：.shtml的短後綴形式，含有一個服務端包括（SSI）的HTML文件；Scream Tracker V2音樂模塊（MOD）文件
STR：屏幕保護文件
SWA：在Macromedia導演文件（MP3文件）中的Shockwave聲音文件
SWF：Shockwave Flash對象
SYS：系統文件
T
T64：Commodore 64模擬器磁帶映像文件
THEME：Windows 95桌面主題文件
TIF，TIFF：標簽圖像文件格式（TIFF）點陣圖
TMP：Windows臨時文件
TRM：終端文件
TXT：ASCⅡ文本格式的聲音數據
TZ：老的壓縮格式文件
V
VBA：VBase文件
VBP：Microsoft Visual Basic工程文件
VBW：Microsoft Visual Basic工作區文件
VBX：Microsoft Visual Basic用戶定製控制項
VQE，VQL：Yamaha Sound-VQ定位器文件
VQF：Yamaha Sound-VQ文件（可能出現標准）
VRF：Oracle 7配置文件
VSL：下載列表文件（GetRight）
W
WAB：Microsoft Outlook文件
WAD：包含有視頻、玩家水平和其他信息的DOOM游戲的大文件
WAL：Quake 2正文文件
WAV：Windows波形聲形
WBK：Microsoft Word備份文件
WFM：Visual dBASE Windows表單
WFN：在CorelDRAW中使用的符號
WIZ：Microsoft Word向導
WRL：虛擬現實模型
WWL：Microsoft Word內插器文件
X
XLK：Microsoft Excel備份
XLL：Microsoft Excel內插器文件
XLM：Microsoft Excel宏
XLS：Microsoft Excel工作單
XLT：Microsoft Excel模板
XLV：Microsoft Excel VBA模塊
XLW：Microsoft Excel工作簿/工作區
Z
ZAP：Windows軟體安裝配置文件
ZIP：Zip文件

4. 為什麼有些軟體一定要裝在C盤（系統盤）才能使用

主要是系統的設計需要，還有就是有些軟體的設定不支持c盤以外的盤符。

一個原因是因為要尊重系統的設計，Windows系統中: Program Files和Program Files(x86)是用來存放程序本體的， ProgramData和%user%/appdata是用來存放程序數據的，當你的程序本體出現問題, 你只需要重新安裝程序, 你的用戶數據依然會保存。

當你要還原程序設置，你只需要從ProgramData或者%user%/appdata中刪掉程序的配置文件，就能夠把程序還原到初始設置程序在安裝過程中向對應的注冊表位置寫入軟體信息和卸載程序的路徑，這樣就可以通過控制面板統一的管理程序。

還有一個原因是軟體如果支持C盤以外的盤符，需要額外的編碼以及額外的測試。如果產品經理與測試工程師都沒有對只能裝C盤表示異議，那麼程序員當然只需要實現C盤安裝的功能。所以有的軟體是不支持c盤以外的盤符的。

(4)程序員的文件碎片擴展閱讀：

軟體裝在c盤的優缺點。

軟體裝在C盤的讀取速度更快。相較於C盤後面的D盤、E盤之類的，C盤是開機最先讀取的，速度也是最快的，因為C盤是系統盤，軟體和系統盤安裝在一起，可以減少運行時間。

是這些軟體的運行會使C分區生成一些緩存文件碎片，隨著這些文件的增多，會拖慢系統運行速度。

眾多軟體同系統文件混雜在一起，不便於管理維護。

5. 操作系統執行可執行程序時，內存分配是怎樣的

在操作系統中，一個進程就是處於執行期的程序（當然包括系統資源），實際上正在執行的程序代碼的活標本。那麼進程的邏輯地址空間是如何劃分的呢？

圖1做了簡單的說明(Linux系統下的)：

圖一

左邊的是UNIX/LINUX系統的執行文件，右邊是對應進程邏輯地址空間的劃分情況。

一般認為在c中分為這幾個存儲區： 1. 棧－－有編譯器自動分配釋放 2. 堆－－一般由程序員分配釋放，若程序員不釋放，程序結束時可能由OS回收 3. 全局區（靜態區）－－全局變數和靜態變數的存儲是放在一塊的，初始化的全局變數和靜態變數在一塊區域，未初始化的全局變數和未初始化的靜態變數在相鄰的另一塊區域。程序結束釋放。 4. 另外還有一個專門放常量的地方。程序結束釋放。在函數體中定義的變數通常是在棧上，用malloc, calloc, realloc等分配內存的函數分配得到的就是在堆上。在所有函數體外定義的是全局量，加了static修飾符後不管在哪裡都存放在全局區（靜態區）,在所有函數體外定義的static變數表示在該文件中有效，不能extern到別的文件用，在函數體內定義的static表示只在該函數體內有效。另外，函數中的"adgfdf"這樣的字元串存放在常量區。比如：代碼:

int a = 0; //全局初始化區

char *p1; //全局未初始化區

main(){

int b; //棧

char s[] = "abc"; //棧

char *p2; //棧

char *p3 = "123456"; //123456在常量區，p3在棧上。

static int c = 0； //全局（靜態）初始化區

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);//分配得來得10和20位元組的區域就在堆區。

strcpy(p1, "123456");//123456放在常量區，編譯器可能會將它與p3所指向的"123456"優化成一塊。

}

還有就是函數調用時會在棧上有一系列的保留現場及傳遞參數的操作。棧的空間大小有限定，vc的預設是2M。棧不夠用的情況一般是程序中分配了大量數組和遞歸函數層次太深。有一點必須知道，當一個函數調用完返回後它會釋放該函數中所有的棧空間。棧是由編譯器自動管理的，不用你操心。堆是動態分配內存的，並且你可以分配使用很大的內存。但是用不好會產生內存泄漏。並且頻繁地malloc和free會產生內存碎片（有點類似磁碟碎片），因為c分配動態內存時是尋找匹配的內存的。而用棧則不會產生碎片。在棧上存取數據比通過指針在堆上存取數據快些。一般大家說的堆棧和棧是一樣的，就是棧(stack)，而說堆時才是堆heap. 棧是先入後出的，一般是由高地址向低地址生長。

堆(heap)和堆棧(stack)的區別

2.1申請方式stack:由系統自動分配。例如，聲明在函數中一個局部變數 int b; 系統自動在棧中為b開辟空間heap:需要程序員自己申請，並指明大小，在c中malloc函數

如p1 = (char *)malloc(10);

在C++中用new運算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在棧中的。

2.2 申請後系統的響應棧：只要棧的剩餘空間大於所申請空間，系統將為程序提供內存，否則將報異常提示棧溢出。堆：首先應該知道操作系統有一個記錄空閑內存地址的鏈表，當系統收到程序的申請時，會遍歷該鏈表，尋找第一個空間大於所申請空間的堆結點，然後將該結點從空閑結點鏈表中刪除，並將該結點的空間分配給程序，另外，對於大多數系統，會在這塊內存空間中的首地址處記錄本次分配的大小，這樣，代碼中的delete語句才能正確的釋放本內存空間。另外，由於找到的堆結點的大小不一定正好等於申請的大小，系統會自動的將多餘的那部分重新放入空閑鏈表中。

2.3

2.4申請效率的比較：棧由系統自動分配，速度較快。但程序員是無法控制的。堆是由new分配的內存，一般速度比較慢，而且容易產生內存碎片,不過用起來最方便.另外，在WINDOWS下，最好的方式是用VirtualAlloc分配內存，他不是在堆，也不是在棧是直接在進程的地址空間中保留一快內存，雖然用起來最不方便。但是速度快，也最靈活。

2.5堆和棧中的存儲內容棧：在函數調用時，第一個進棧的是主函數中後的下一條指令（函數調用語句的下一條可執行語句）的地址，然後是函數的各個參數，在大多數的C編譯器中，參數是由右往左入棧的，然後是函數中的局部變數。注意靜態變數是不入棧的。當本次函數調用結束後，局部變數先出棧，然後是參數，最後棧頂指針指向最開始存的地址，也就是主函數中的下一條指令，程序由該點繼續運行。堆：一般是在堆的頭部用一個位元組存放堆的大小。堆中的具體內容有程序員安排。

2.6存取效率的比較

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在運行時刻賦值的；

而bbbbbbbbbbb是在編譯時就確定的；

但是，在以後的存取中，在棧上的數組比指針所指向的字元串(例如堆)快。

比如：#include <...>

void main(){

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

對應的匯編代碼

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一種在讀取時直接就把字元串中的元素讀到寄存器cl中，而第二種則要先把指針值讀到edx中，在根據edx讀取字元，顯然慢了。

2.7小結：堆和棧的區別可以用如下的比喻來看出：使用棧就象我們去飯館里吃飯，只管點菜（發出申請）、付錢、和吃（使用），吃飽了就走，不必理會切菜、洗菜等准備工作和洗碗、刷鍋等掃尾工作，他的好處是快捷，但是自由度小。使用堆就象是自己動手做喜歡吃的菜餚，比較麻煩，但是比較符合自己的口味，而且自由度大。堆和棧的區別主要分：操作系統方面的堆和棧，如上面說的那些，不多說了。還有就是數據結構方面的堆和棧，這些都是不同的概念。這里的堆實際上指的就是（滿足堆性質的）優先隊列的一種數據結構，第1個元素有最高的優先權；棧實際上就是滿足先進後出的性質的數學或數據結構。雖然堆棧，堆棧的說法是連起來叫，但是他們還是有很大區別的，連著叫只是由於歷史的原因。

申請大小的限制棧：在Windows下,棧是向低地址擴展的數據結構，是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的，在 WINDOWS下，棧的大小是2M（也有的說是1M，總之是一個編譯時就確定的常數），如果申請的空間超過棧的剩餘空間時，將提示overflow。因此，能從棧獲得的空間較小。堆：堆是向高地址擴展的數據結構，是不連續的內存區域。這是由於系統是用鏈表來存儲的空閑內存地址的，自然是不連續的，而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見，堆獲得的空間比較靈活，也比較大。一、預備知識—程序的內存分配一個由c/C++編譯的程序佔用的內存分為以下幾個部分

1、棧區（stack）— 由編譯器自動分配釋放，存放函數的參數值，局部變數的值等。其操作方式類似於數據結構中的棧。2、堆區（heap）— 一般由程序員分配釋放，若程序員不釋放，程序結束時可能由OS回收。注意它與數據結構中的堆是兩回事，分配方式倒是類似於鏈表，呵呵。3、全局區（靜態區）（static）—全局變數和靜態變數的存儲是放在一塊的，初始化的全局變數和靜態變數在一塊區域，未初始化的全局變數和未初始化的靜態變數在相鄰的另一塊區域。 - 程序結束後有系統釋放4、文字常量區 —常量字元串就是放在這里的。程序結束後由系統釋放5、程序代碼區(text)—存放函數體的二進制代碼。

6. C++中關於內存碎片的，為什麼要重載new和delete，這跟系統內置的new和delete有什麼不同（關於內存的）

首先看碎片，32位系統的內存是按「頁」管理的，一頁內存為64K，只有當前在使用的頁面才會在內存中，其他頁面不一定總是在內存。因此，分配連續的內存時，當請求少於64K，系統會盡量將其分配在一個內存頁面中，當大於64K時，會分配在連續的頁面中。以實例說明，例如首先請求30K內存，那麼會在第一頁分配，第二次請求50K，就必須在第二頁面分配。於是第一次返回的地址為0，第二次為64K，30K～64K之間的內存就是所謂的「碎片」。可以將「碎片」簡單理解為兩塊以分配內存之間的空間。當然，「碎片」也可能被利用，但是考慮一種極端的情況：如果一台電腦擁有4G內存，但是每個頁面都只分配了32K，那麼你將不能申請一片大於32K的內存，即使目前你的物理內存還有2G沒有使用。這種情況是很常見的，當程序比較大時如果你沒作好這些管理，你會發現new個3～5百MB內存會經常失敗。
系統中的new會實施一些演算法或者策略，防止內存碎片過快產生，這些演算法類似於數據結構中的「堆」，所以new被稱之為「堆分配」。但是，系統的堆管理策略是宏觀的，通用的。你只要使用它，一定會產生內存碎片。同時，隨著堆的規模的加大，會有很多時間浪費在頁面在主存與虛擬內存的交換中，這是因為一般情況下，系統返回給你的內存指針是不能改變的，試想你的程序中new了一個新指針，可這片內存不知什麼時候被系統換到其他地方了，那麼你的程序離奔潰就不遠了。這說明在C++中，出現內存碎片後系統是無法執行「碎片整理」的，然而在底層的windows介面中，你能使用「內存句柄」代替指針，內存句柄代表的內存是操作系統管理的而不是地址本身，因此這種情況下操作系統能幫你完成「碎片整理」。只是，內存句柄即使在微軟自己的平台上也不及指針通用，各種內庫的介面中，絕大部分只認指針，因此你可能在「內存句柄」與指針間不停轉換消耗掉程序的時間。
重寫內存管理要根據實際需要，這沒有統一的方法。最簡單的做法是讓new返回一個全局數組的地址。全局數組的內存空間在程序啟動時就初始化好了，因此你立即就能獲取到地址並且這個分配一定是成功的（要是內存耗盡，程序會在啟動時掛掉）。全局數組好處在於它的內存一定是連續的，32位系統上能保證2G左右的長度，因此對於操作系統而言可以做到消除碎片，至於如何高效使用這些內存就是程序員的事情了。最後，全局數組的方法也要注意64K對其，否則程序性能會因為內存交換收到影響，特別是當內存使用量很大的時候。
最後，除非程序需要極高的性能，比如大型三維游戲；或者你的程序特別吃內存，比如伺服器上的某些服務。你是完沒必要重寫new delete。

7. 程序員如何清理電腦垃圾

在網路飛速發展的現在，如今電腦已經成為了人們生活中不可或缺的一件物品了。不管是辦公還是娛樂，電腦都是很多人的第一選擇。但電腦在帶給人們方便的同時，也會讓它自己積攢很多的無效文件，也就是大家熟知的電腦垃圾，當電腦垃圾積累到一定程度的時候就需要清理一下了。你一般是怎麼清理電腦垃圾的呢？今天小編就帶大家來看看，普通人清理電腦垃圾和程序員清理電腦垃圾的區別吧。

電腦在運行過程中，會產生很多系統垃圾，佔用硬碟資源，垃圾多了會拖慢系統響應速度，這個時候就需要清理一下了，而很多人是不是直接下載一個電腦垃圾清理軟體，直接點擊一鍵清理來清理電腦的垃圾的？盡管這樣是很簡單方便，雖然藉助衛士或者殺軟，也能清理電腦垃圾，但它需要經常檢測電腦的情況，會需要時時刻刻監測電腦的情況，所以會佔用很大的電腦資源，如果你電腦的運行內存只有4個G的話，那使用這個反而可能會拖累電腦，使之變的更慢，還不如不用。

那有人就會說了，我可以在需要清理的時候再去下載工具，清理完了之後再卸載它，但這樣是不是太過麻煩了。其實清理電腦垃圾對於程序員來說就是小事一樁，所以這就是程序員和不懂電腦的小白之間的區別，今天小編就安利一個程序員清理電腦垃圾的方法，既不佔用系統資源又能有效的清理電腦垃圾。

好了，閑話不多說，我們開始教學吧，第一步：右擊桌面空白處，新建一個文本文檔.txt文件。

第二步，打開新建文本文檔.txt文件，將下面的代碼復制粘貼到裡面，並保存退出。

8. 程序員必備知識（操作系統5-文件系統）

本篇與之前的第三篇的內存管理知識點有相似的地方

對於運行的進程來說，內存就像一個紙箱子, 僅僅是一個暫存數據的地方，而且空間有限。如果我們想要進程結束之後，數據依然能夠保存下來，就不能只保存在內存里，而是應該保存在外部存儲中。就像圖書館這種地方，不僅空間大,而且能夠永久保存。

我們最常用的外部存儲就是硬碟，數據是以文件的形式保存在硬碟上的。為了管理這些文件，我們在規劃文件系統的時候，需要考慮到以下幾點。

第一點,文件系統要有嚴格的組織形式，使得文件能夠以塊為單位進行存儲。這就像圖書館里，我們會給設置一排排書架，然後再把書架分成一個個小格子，有的項目存放的資料非常多，一個格子放不下，就需要多個格子來進行存放。我們把這個區域稱為存放原始資料的倉庫區。

第二點,文件系統中也要有索引區，用來方便查找一個文件分成的多個塊都存放在了什麼位置。這就好比，圖書館的書太多了,為了方便查找,我們需要專門設置一排書架,這裡面會寫清楚整個檔案庫有哪些資料,資料在哪個架子的哪個格子上。這樣找資料的時候就不用跑遍整個檔案庫,在這個書架上找到後，直奔目標書架就可以了。

第三點,如果文件系統中有的文件是熱點文件,近期經常被讀取和寫入，文件系統應該有緩存層。這就相當於圖書館裡面的熱門圖書區,這裡面的書都是暢銷書或者是常常被借還的圖書。因為借還的次數比較多,那就沒必要每次有人還了之後，還放回遙遠的貨架，我們可以專門開辟一個區域, 放置這些借還頻次高的圖書。這樣借還的效率就會提高。

第四點,文件應該用文件夾的形式組織起來，方便管理和查詢。這就像在圖書館裡面，你可以給這些資料分門別類,比如分成計算機類.文學類.歷史類等等。這樣你也容易管理，項目組借閱的時候只要在某個類別中去找就可以了。

在文件系統中，每個文件都有一個名字,這樣我們訪問一個文件，希望通過它的名字就可以找到。文件名就是一個普通的文本。當然文件名會經常沖突,不同用戶取相同的名字的情況還是會經常出現的。

要想把很多的文件有序地組織起來,我們就需要把它們成為目錄或者文件夾。這樣,一個文件夾里可以包含文件夾,也可以包含文件,這樣就形成了一種樹形結構。而我們可以將不同的用戶放在不同的用戶目錄下，就可以一定程度上避免了命名的沖突問題。

第五點，Linux 內核要在自己的內存裡面維護一套數據結構，來保存哪些文件被哪些進程打開和使用。這就好比，圖書館里會有個圖書管理系統，記錄哪些書被借閱了，被誰借閱了，借閱了多久,什麼時候歸還。

文件系統是操作系統中負責管理持久數據的子系統，說簡單點,就是負責把用戶的文件存到磁碟硬體中,因為即使計算機斷電了，磁碟里的數據並不會丟失,所以可以持久化的保存文件。

文件系統的基本數據單位是文件，它的目的是對磁碟上的文件進行組織管理，那組織的方式不同,就會形成不同的文件系統。

Linux最經典的一句話是:「一切皆文件」,不僅普通的文件和目錄，就連塊設備、管道、socket 等，也都是統一交給文件系統管理的。

Linux文件系統會為每個文件分配兩個數據結構: 索引節點(index node) 和目錄項(directory entry) ，它們主要用來記錄文件的元信息和目錄層次結構。

●索引節點，也就是inode, 用來記錄文件的元信息，比如inode編號、文件大小訪問許可權、創建時間、修改時間、數據在磁碟的位置等等。索引節點是文件的唯一標識 ,它們之間一一對應, 也同樣都會被存儲在硬碟中,所以索引節點同樣佔用磁碟空間。

●目錄項，也就是dentry, 用來記錄文件的名字、索引節點指針以及與其他目錄項的層級關聯關系。多個目錄項關聯起來，就會形成目錄結構，但它與索引節點不同的是,目錄項是由內核維護的一個數據結構,不存放於磁碟，而是緩存在內存。

由於索引節點唯一標識一個文件，而目錄項記錄著文件的名，所以目錄項和索引節點的關系是多對一,也就是說，一個文件可以有多個別字。比如，硬鏈接的實現就是多個目錄項中的索引節點指向同一個文件。

注意，目錄也是文件，也是用索引節點唯一標識，和普通文件不同的是，普通文件在磁碟裡面保存的是文件數據，而目錄文件在磁碟裡面保存子目錄或文件。

（PS：目錄項和目錄不是一個東西！你也不是一個東西（^_=），雖然名字很相近，但目錄是個文件。持久化存儲在磁碟,而目錄項是內核一個數據結構,緩存在內存。

如果查詢目錄頻繁從磁碟讀，效率會很低，所以內核會把已經讀過的目錄用目錄項這個數據結構緩存在內存，下次再次讀到相同的目錄時，只需從內存讀就可以,大大提高了文件系統的效率。

目錄項這個數據結構不只是表示目錄，也是可以表示文件的。）

磁碟讀寫的最小單位是扇區，扇區的大小隻有512B大小，很明顯，如果每次讀寫都以這么小為單位，那這讀寫的效率會非常低。

所以，文件系統把多個扇區組成了一個邏輯塊，每次讀寫的最小單位就是邏輯塊(數據塊) , Linux中的邏輯塊大小為4KB,也就是一次性讀寫 8個扇區,這將大大提高了磁碟的讀寫的效率。

以上就是索引節點、目錄項以及文件數據的關系，下面這個圖就很好的展示了它們之間的關系:

索引節點是存儲在硬碟上的數據，那麼為了加速文件的訪問，通常會把索引節點載入到內存中。

另外，磁碟進行格式化的時候，會被分成三個存儲區域，分別是超級塊、索引節點區和數據塊區。

●超級塊,用來存儲文件系統的詳細信息，比如塊個數、塊大小、空閑塊等等。

●索引節點區,用來存儲索引節點;

●數據塊區，用來存儲文件或目錄數據;

我們不可能把超級塊和索引節點區全部載入到內存,這樣內存肯定撐不住，所以只有當需要使用的時候，才將其載入進內存，它們載入進內存的時機是不同的.

●超級塊:當文件系統掛載時進入內存;

●索引節點區:當文件被訪問時進入內存;

文件系統的種類眾多，而操作系統希望對用戶提供一個統一的介面，於是在用戶層與文件系統層引入了中間層，這個中間層就稱為虛擬文件系統(Virtual File System, VFS) 。

VFS定義了一組所有文件系統都支持的數據結構和標准介面,這樣程序員不需要了解文件系統的工作原理，只需要了解VFS提供的統一介面即可。

在Linux文件系統中，用戶空間、系統調用、虛擬機文件系統、緩存、文件系統以及存儲之間的關系如下圖:

Linux支持的文件系統也不少，根據存儲位置的不同，可以把文件系統分為三類:

●磁碟的文件系統，它是直接把數據存儲在磁碟中,比如Ext 2/3/4. XFS 等都是這類文件系統。

●內存的文件系統，這類文件系統的數據不是存儲在硬碟的,而是佔用內存空間，我們經常用到的/proc 和/sys文件系統都屬於這一類,讀寫這類文件,實際上是讀寫內核中相關的數據。

●網路的文件系統,用來訪問其他計算機主機數據的文件系統，比如NFS. SMB等等。

文件系統首先要先掛載到某個目錄才可以正常使用，比如Linux系統在啟動時,會把文件系統掛載到根目錄。

在操作系統的輔助之下，磁碟中的數據在計算機中都會呈現為易讀的形式，並且我們不需要關心數據到底是如何存放在磁碟中,存放在磁碟的哪個地方等等問題，這些全部都是由操作系統完成的。

那麼，文件數據在磁碟中究竟是怎麼樣的呢?我們來一探究竟!

磁碟中的存儲單元會被劃分為一個個的「塊」，也被稱為扇區 ,扇區的大小一般都為512byte.這說明即使一塊數據不足512byte,那麼它也要佔用512byte的磁碟空間。

而幾乎所有的文件系統都會把文件分割成固定大小的塊來存儲，通常一個塊的大小為4K。如果磁碟中的扇區為512byte,而文件系統的塊大小為4K,那麼文件系統的存儲單元就為8個扇區。這也是前面提到的一個問題，文件大小和佔用空間之間有什麼區別?文件大小是文件實際的大小，而佔用空間則是因為即使它的實際大小沒有達到那麼大,但是這部分空間實際也被佔用，其他文件數據無法使用這部分的空間。所以我們寫入1byte的數據到文本中,但是它佔用的空間也會是4K。

這里要注意在Windows下的NTFS文件系統中，如果一開始文件數據小於 1K,那麼則不會分配磁碟塊來存儲，而是存在一個文件表中。但是一旦文件數據大於1K,那麼不管以後文件的大小，都會分配以4K為單位的磁碟空間來存儲。

與內存管理一樣,為了方便對磁碟的管理,文件的邏輯地址也被分為一個個的文件塊。於是文件的邏輯地址就是(邏輯塊號，塊內地址)。用戶通過邏輯地址來操作文件,操作系統負責完成邏輯地址與物理地址的映射。

不同的文件系統為文件分配磁碟空間會有不同的方式，這些方式各自都有優缺點。

連續分配要求每個文件在磁碟上有一組連續的塊，該分配方式較為簡單。

通過上圖可以看到，文件的邏輯塊號的順序是與物理塊號相同的,這樣就可以實現隨機存取了，只要知道了第一個邏輯塊的物理地址, 那麼就可以快速訪問到其他邏輯塊的物理地址。那麼操作系統如何完成邏輯塊與物理塊之間的映射呢?實際上,文件都是存放在目錄下的，而目錄是一種有結構文件, 所以在文件目錄的記錄中會存放目錄下所有文件的信息，每一個文件或者目錄都是一個記錄。而這些信息就包括文件的起始塊號和佔有塊號的數量。

那麼操作系統如何完成邏輯塊與物理塊之間的映射呢? (邏輯塊號, 塊內地址) -> (物理塊號, 塊內地址)，只需要知道邏輯塊號對應的物理塊號即可,塊內地址不變。

用戶訪問一個文件的內容,操作系統通過文件的標識符找到目錄項FCB, 物理塊號=起始塊號+邏輯塊號。當然，還需要檢查邏輯塊號是否合法,是否超過長度等。因為可以根據邏輯塊號直接算出物理塊號，所以連續分配支持順序訪問和隨機訪問。

因為讀/寫文件是需要移動磁頭的，如果訪問兩個相隔很遠的磁碟塊,移動磁頭的時間就會變長。使用連續分配來作為文件的分配方式，會使文件的磁碟塊相鄰，所以文件的讀/寫速度最快。

連續空間存放的方式雖然讀寫效率高，但是有磁碟空間碎片和文件長度不易擴展的缺陷。

如下圖，如果文件B被刪除，磁碟上就留下一塊空缺，這時，如果新來的文件小於其中的一個空缺，我們就可以將其放在相應空缺里。但如果該文件的大小大於所

有的空缺，但卻小於空缺大小之和，則雖然磁碟上有足夠的空缺，但該文件還是不能存放。當然了，我們可以通過將現有文件進行挪動來騰出空間以容納新的文件,但是這個在磁碟挪動文件是非常耗時，所以這種方式不太現實。

另外一個缺陷是文件長度擴展不方便，例如上圖中的文件A要想擴大一下，需要更多的磁碟空間,唯一的辦法就只能是挪動的方式，前面也說了，這種方式效率是非常低的。

那麼有沒有更好的方式來解決上面的問題呢?答案當然有，既然連續空間存放的方式不太行，那麼我們就改變存放的方式，使用非連續空間存放方式來解決這些缺陷。

非連續空間存放方式分為鏈表方式和索引方式。

鏈式分配採取離散分配的方式，可以為文件分配離散的磁碟塊。它有兩種分配方式:顯示鏈接和隱式鏈接。

隱式鏈接是只目錄項中只會記錄文件所佔磁碟塊中的第一塊的地址和最後一塊磁碟塊的地址, 然後通過在每一個磁碟塊中存放一個指向下一磁碟塊的指針，從而可以根據指針找到下一塊磁碟塊。如果需要分配新的磁碟塊,則使用最後一塊磁碟塊中的指針指向新的磁碟塊,然後修改新的磁碟塊為最後的磁碟塊。

我們來思考一個問題, 採用隱式鏈接如何將實現邏輯塊號轉換為物理塊號呢?

用戶給出需要訪問的邏輯塊號i,操作系統需要找到所需訪問文件的目錄項FCB.從目錄項中可以知道文件的起始塊號，然後將邏輯塊號0的數據讀入內存,由此知道1號邏輯塊的物理塊號，然後再讀入1號邏輯塊的數據進內存，此次類推，最終可以找到用戶所需訪問的邏輯塊號i。訪問邏輯塊號i,總共需要i+ 1次磁碟1/0操作。

得出結論: 隱式鏈接分配只能順序訪問，不支持隨機訪問，查找效率低。

我們來思考另外一個問題，採用隱式鏈接是否方便文件拓展?

我們知道目錄項中存有結束塊號的物理地址，所以我們如果要拓展文件，只需要將新分配的磁碟塊掛載到結束塊號的後面即可，修改結束塊號的指針指向新分配的磁碟塊，然後修改目錄項。

得出結論: 隱式鏈接分配很方便文件拓展。所有空閑磁碟塊都可以被利用到，無碎片問題，存儲利用率高。

顯示鏈接是把用於鏈接各個物理塊的指針顯式地存放在一張表中，該表稱為文件分配表(FAT, File Allocation Table)。

由於查找記錄的過程是在內存中進行的,因而不僅顯著地提高了檢索速度，而且大大減少了訪問磁碟的次數。但也正是整個表都存放在內存中的關系，它的主要的缺點是不適用於大磁碟。

比如，對於200GB的磁碟和1KB大小的塊，這張表需要有2億項，每一項對應於這2億個磁碟塊中的一個塊,每項如果需要4個位元組，那這張表要佔用800MB內存,很顯然FAT方案對於大磁碟而言不太合適。

一直都在，加油！（*゜Д゜）σ凸←自爆按鈕

鏈表的方式解決了連續分配的磁碟碎片和文件動態打展的問題，但是不能有效支持直接訪問(FAT除外) ,索引的方式可以解決這個問題。

索引的實現是為每個文件創建一個索引數據塊，裡面存放的是指向文件數據塊的指針列表 ,說白了就像書的目錄一樣,要找哪個章節的內容,看目錄查就可以。

另外，文件頭需要包含指向索引數據塊的指針 ,這樣就可以通過文件頭知道索引數據塊的位置，再通過索弓|數據塊里的索引信息找到對應的數據塊。

創建文件時，索引塊的所有指針都設為空。當首次寫入第i塊時，先從空閑空間中取得一個塊，再將其地址寫到索引塊的第i個條目。

索引的方式優點在於:

●文件的創建、增大、縮小很方便;

●不會有碎片的問題;

●支持順序讀寫和隨機讀寫;

由於索引數據也是存放在磁碟塊的，如果文件很小，明明只需一塊就可以存放的下，但還是需要額外分配一塊來存放索引數據，所以缺陷之一就是存儲索引帶來的開銷。

如果文件很大，大到一個索引數據塊放不下索引信息，這時又要如何處理大文件的存放呢?我們可以通過組合的方式，來處理大文件的存儲。

先來看看鏈表+索引的組合，這種組合稱為鏈式索引塊，它的實現方式是在索引數據塊留出一個存放下一個索引數據塊的指針，於是當一個索引數據塊的索引信息用完了，就可以通過指針的方式，找到下一個索引數據塊的信息。那這種方式也會出現前面提到的鏈表方式的問題，萬一某個指針損壞了，後面的數據也就會無法讀取了。

還有另外一種組合方式是索引+索引的方式，這種組合稱為多級索引塊，實現方式是通過一個索引塊來存放多個索引數據塊,一層套一層索引，像極了俄羅斯套娃是吧๑乛◡乛๑

前面說到的文件的存儲是針對已經被佔用的數據塊組織和管理，接下來的問題是，如果我要保存一個數據塊, 我應該放在硬碟上的哪個位置呢?難道需要將所有的塊掃描一遍，找個空的地方隨便放嗎?

那這種方式效率就太低了，所以針對磁碟的空閑空間也是要引入管理的機制，接下來介紹幾種常見的方法:

●空閑表法

●空閑鏈表法

●點陣圖法

空閑表法

空閑表法就是為所有空閑空間建立一張表，表內容包括空閑區的第一個塊號和該空閑區的塊個數，注意，這個方式是連續分配的。如下圖:

當請求分配磁碟空間時，系統依次掃描空閑表裡的內容，直到找到一個合適的空閑區域為止。當用戶撤銷一個文件時，系統回收文件空間。這時，也需順序掃描空閑表,尋找一個空閑表條目並將釋放空間的第一個物理塊號及它佔用的塊數填到這個條目中。

這種方法僅當有少量的空閑區時才有較好的效果。因為，如果存儲空間中有著大量的小的空閑區,則空閑表變得很大,這樣查詢效率會很低。另外，這種分配技術適用於建立連續文件。

空閑鏈表法

我們也可以使用鏈表的方式來管理空閑空間，每一個空閑塊里有一個指針指向下一個空閑塊，這樣也能很方便的找到空閑塊並管理起來。如下圖：

當創建文件需要一塊或幾塊時，就從鏈頭上依次取下一塊或幾塊。反之，當回收空間時，把這些空閑塊依次接到鏈頭上。

這種技術只要在主存中保存一個指針, 令它指向第一個空閑塊。其特點是簡單,但不能隨機訪問，工作效率低，因為每當在鏈上增加或移動空閑塊時需要做很多1/0操作,同時數據塊的指針消耗了一定的存儲空間。

空閑表法和空閑鏈表法都不適合用於大型文件系統，因為這會使空閑表或空閑鏈表太大。

點陣圖法

點陣圖是利用二進制的一位來表示磁碟中一個盤塊的使用情況，磁碟上所有的盤塊都有一個二進制位與之對應。

當值為0時，表示對應的盤塊空閑，值為1時，表示對應的盤塊已分配。它形式如下:

在Linux文件系統就採用了點陣圖的方式來管理空閑空間,不僅用於數據空閑塊的管理,還用於inode空閑塊的管理，因為inode也是存儲在磁碟的，自然也要有對其管理。

前面提到Linux是用點陣圖的方式管理空閑空間，用戶在創建一個新文件時， Linux 內核會通過inode的點陣圖找到空閑可用的inode,並進行分配。要存儲數據時，會通過塊的點陣圖找到空閑的塊，並分配，但仔細計算一下還是有問題的。

數據塊的點陣圖是放在磁碟塊里的，假設是放在一個塊里,一個塊4K,每位表示一個數據塊,共可以表示4 * 1024 * 8 = 2^15個空閑塊,由於1個數據塊是4K大小，那麼最大可以表示的空間為2^15 * 4 * 1024 = 2^27個byte,也就是128M。

也就是說按照上面的結構，如果採用（一個塊的點陣圖+ 一系列的塊），外加一（個塊的inode的點陣圖+一系列的inode）的結構能表示的最大空間也就128M,

這太少了，現在很多文件都比這個大。

在Linux文件系統，把這個結構稱為一個塊組，那麼有N多的塊組,就能夠表示N大的文件。

最終,整個文件系統格式就是下面這個樣子。

最前面的第一個塊是引導塊,在系統啟動時用於啟用引導，接著後面就是一個一個連續的塊組了,塊組的內容如下:

● 超級塊 ,包含的是文件系統的重要信息，比如inode總個數、塊總個數、每個塊組的inode個數、每個塊組的塊個數等等。

● 塊組描述符 ,包含文件系統中各個塊組的狀態,比如塊組中空閑塊和inode的數目等，每個塊組都包含了文件系統中「所有塊組的組描述符信息」。

● 數據點陣圖和inode點陣圖，用於表示對應的數據塊或inode是空閑的，還是被使用中。

● inode 列表，包含了塊組中所有的inode, inode 用於保存文件系統中與各個文件和目錄相關的所有元數據。

● 數據塊，包含文件的有用數據。

你可以會發現每個塊組里有很多重復的信息，比如超級塊和塊組描述符表，這兩個都是全局信息，而且非常的重要，這么做是有兩個原因:

●如果系統崩潰破壞了超級塊或塊組描述符,有關文件系統結構和內容的所有信息都會丟失。如果有冗餘的副本,該信息是可能恢復的。

●通過使文件和管理數據盡可能接近，減少了磁頭尋道和旋轉,這可以提高文件系統的性能。

不過，Ext2 的後續版本採用了稀疏技術。該做法是，超級塊和塊組描述符表不再存儲到文件系統的每個塊組中,而是只寫入到塊組0、塊組1和其他ID可以表示為3、5、7的冪的塊組中。

在前面，我們知道了一個普通文件是如何存儲的，但還有一個特殊的文件,經常用到的目錄，它是如何保存的呢?

基於Linux 一切切皆文件的設計思想，目錄其實也是個文件,你甚至可以通過vim打開它，它也有inode, inode 裡面也是指向一些塊。

和普通文件不同的是，普通文件的塊裡面保存的是文件數據，而目錄文件的塊裡面保存的是目錄裡面一項一項的文件信息。

在目錄文件的塊中，最簡單的保存格式就是列表，就是一項一項地將目錄下的文件信息(如文件名、文件inode.文件類型等)列在表裡。

列表中每一項就代表該目錄下的文件的文件名和對應的inode,通過這個inode,就可以找到真正的文件。

通常，第一項是「則」，表示當前目錄,第二項是.，表示上一級目錄, 接下來就是一項一項的文件名和inode。

如果一個目錄有超級多的文件,我們要想在這個目錄下找文件,按照列表一項一項的找,效率就不高了。

於是，保存目錄的格式改成哈希表，對文件名進行哈希計算,把哈希值保存起來,如果我們要查找一個目錄下面的文件名，可以通過名稱取哈希。如果哈希能夠匹配上,就說明這個文件的信息在相應的塊裡面。

Linux系統的ext文件系統就是採用了哈希表，來保存目錄的內容,這種方法的優點是查找非常迅速，插入和刪除也較簡單,不過需要一些預備措施來避免哈希沖突。

目錄查詢是通過在磁碟上反復搜索完成，需要不斷地進行/0操作,開銷較大。所以,為了減少/0操作,把當前使用的文件目錄緩存在內存，以後要使用該文件時只要在內存中操作，從而降低了磁碟操作次數,提高了文件系統的訪問速度。

感謝您的閱讀，希望您能攝取到知識！加油！沖沖沖！（發現光，追隨光，成為光，散發光！）我是程序員耶耶！有緣再見。<－biubiu－⊂(`ω´∩)

9. 解決碎片問題，以及使程序可浮動的最好的辦法是採用什麼技術

10. 碎片化問題是什麼

其實磁碟碎片應該稱為文件碎片，是因為文件被分散保存到整個磁碟的不同地方，而不是連續地保存在磁碟連續的簇中形成的。當應用程序所需的物理內存不足時，一般操作系統會在硬碟中產生臨時交換文件，用該文件所佔用的硬碟空間虛擬成內存。

導航:首頁 > 程序命令 > 程序員的文件碎片

程序員的文件碎片

與程序員的文件碎片相關的資料