就好比問,漢語中常用寫作方法有多少種,怎麼分類。
演算法按用途分,體現設計目的、有什麼特點
演算法按實現方式分,有遞歸、迭代、平行、序列、過程、確定、不確定等等
演算法按設計范型分,有分治、動態、貪心、線性、圖論、簡化等等
作為圖靈完備的語言,理論上」Java語言「可以實現所有演算法。
「Java的標准庫'中用了一些常用數據結構和相關演算法.
像apache common這樣的java庫中又提供了一些通用的演算法
2. X分之3.6等於3分之二節比例
排序演算法第一篇-排序演算法介紹
在面試中,現在無論大小公司都會有演算法的。其中排序演算法也是一種很常見的面試題。比如冒泡,快排等。這些,排序演算法自己看了一次又一次,可是過一段時間,又忘掉了。所以,這次就把演算法是怎麼推導出來的,詳細記錄下來。看看這次多久還會忘記。
本文主要介紹排序演算法的分類、時間復雜度、空間復雜。為了後面的學習做准備的。
通過本文學習,將收獲到:排序演算法分幾類?什麼是演算法的時間復雜度?是怎麼算出來的?什麼是演算法的空間復雜度?常見的時間復雜度比較。
如果這些您都已經知道了,可以不用耽誤時間看了。
約定:
文中的n2表示的是n的2次方(n²),n^2也是表示n的2次方;
n3表示的是n的3次方;
n^k表示的是n的k次方;
long2n表示的是以2為底的對數。
本文出自:凱哥Java(微信:kaigejava)學習Java版數據結構與演算法筆記。
一:介紹
排序又稱排序演算法(Sort Algorithm),排序是將一組數據,依據指定的順序進行排序的過程。
二:分類
排序的分類分為兩大類
2.1:內部排序
內部排序是指將需要處理的所有數據一次性都載入到內存中進行排序的。
如:冒泡、快排等這些演算法都是內部排序的
2.2:外部排序
數據量過大,無法全部載入到內存中,需要藉助於外部存儲進行排序的。
如:資料庫中數據8個G,內存只有4個G的這種。
2.3:參加分類如下圖:
三:演算法的時間復雜度
3.1:分類
衡量一個程序(演算法)執行時間有兩種方法
3.1.1:事後統計的方法
所謂的事後統計方法,顧名思義,就是程序(演算法)已經寫完了,運行後得到的結果。
這種方法雖然是可行的,但是有兩個問題:
①:要想對設計的演算法運行的性能進行評估,需要實際運行該程序(浪費時間);
②:運行所得的時間統計嚴重依賴於機器的硬體、軟體等環境因為。
這種方法有個嚴苛的要求:要在同一台機器在相同狀態(軟硬體)下運行,才能比較哪個演算法更快。
3.1.2:事前估算的方法
通過分析某個演算法的時間復雜度來判斷哪個演算法更優。
3.2:時間頻度
概念:一個演算法花費的時間與演算法中語句執行的次數成正比。哪個演算法中語句執行次數多,那麼這個演算法所花費的時間就多(這不廢話嗎)。
一個演算法中語句執行次數稱為語句頻度或時間頻度。記為:T(n).
(復雜的概念是,時間頻度:一個演算法執行所消耗的時間,從理論上是 不能算出來的,想要具體數值,必須要將程序上機運行測試才能知道。但是我們不可能也沒必要對每個演算法都上機進行測試的,只需要知道哪個演算法花費的時間多,哪個演算法花費的時間少就可以了。並且一個演算法花費的時間與演算法中語句執行的次數成正比的,哪個演算法中語句執行次數多,那麼這個程序花費的時間就多。一個演算法中的語句執行次數稱為語句頻度或者時間頻度,即為:T(n))
例如:我們知道的技術從1到100所有數字的和。這個就有兩種演算法。分別如下:
①:使用for循環,從1到100循環出來,然後累加出來。代碼如下:
根據上面概念(注意對概念的理解,total和end這兩行相對於for循環來說,可以忽略。後面我們還會詳細講解還會忽略哪些),我們來看下這個演算法的時間頻度是多少呢?
在for循環中,實際需要執行101次(+1的原因是因為,在for循環的時候,需要做最後一次判斷,才能推出。因此n個數的計算一共是n+1次操作)。所以其時間頻度就是:T(n)=n+1;
我們再來看看第二種演算法:
是不是很簡單,只要一行代碼就執行完成了。所以第二種演算法的T(n)=1了。是不是很快呢?
時間頻度是不是一眼就看出來了?是不是不用在代碼運行下來比較運行時間了?
(ps:從上面簡單地從1到100求和演算法中,我們是不是感受到演算法的魅力了?感受到編程之美了?)
3.3:時間復雜度
在上面3.2中提到的時間頻度中,n稱為問題的規模,當n不斷變化的時候,時間頻度T(n)也會不斷變化。但是有時我們想知道它在變化的時候呈現什麼樣的規律呢?為此,我們引入了時間復雜度概念。
一般情況下,演算法中基本操作重復執行的次數是問題規模n的某個函數,用T(n)表示。若有某個輔助函數f(n),是的當n趨近於無窮大的時候,T(n)/f(n)的極限值為不等於零的參數,則稱為f(n)是T(n)的同數量級函數。記作T(n)=O(f(n)),稱O(f(n))為演算法的漸進的時間復雜度。簡稱時間復雜度。這就是大O法。
在計算時間復雜度的時候,我們會忽略以下幾個數據值
3.3.1:忽略常數項
比如上面,我們計算1到100的第一種演算法中,有兩行int total=0;和 int end = 100;這兩行代碼,這個數值是2,我們一般計算時間復雜度的時候,會忽略這個常數項的。為什麼呢?請看下面四個函數,隨著n的增大而增大運行時間。
T(n) = 2n+20
T(n) = 2*n
T(n)=3n+10
T(n)=3*n
請看下圖隨著n的增大所呈現的規律:
我們來看看,把這些數據使用折線圖展示:
圖例說明:上面兩個是3*n及3n+10的,下面兩個是2n及2n+10的
從上面兩個圖表中我們可以得到以下結論:
①:2n+20和2*n隨著n的增加,執行曲線無限接近(折線圖中下面兩個),常量值20可以忽略了
②:3n+10和3*n隨著n的增加,執行曲線無限接近(折線圖中上面兩個),常量值10可以忽略了
所以,綜上所述,在計算程序(演算法)時間復雜度的時候,常量值是可以忽略的
3.3.2:忽略低次項
請看下面四個函數,隨著n的增大又會呈現什麼規律嗎?
T(n)=2n^2+3n+10
T(n)=2n^2
T(n)=n^2+5n+20
T(n)=n^2
說明:n^2表示n的2次方
我們來看看隨著n的增加,運行所消耗的時間。如下圖:
把上面數據,用折線圖表示,如下圖:
圖例說明:上面兩個是2n^2及2n^2+3n+10,下面兩個是n^2及 n^2+5n+20
從上面兩個圖中我們可以得到如下結論:
①:2n^2+3n+10和2n^2隨著n的增大,執行曲線無限接近,可以忽略低次項及常量項:3n+10
②:n^2+5n+20和n^2隨著n的增大,執行曲線無限接近,可以忽略低次項及常量項:5n+20
綜上所述,我們可以得到結論:在計算程序(演算法)時間復雜度的時候,低次項(3n=3*n^1比n^2項數少)是可以忽略的
3.3.3:忽略系數
我們再來看看下面四個函數,看看它們隨著n的增大呈現出什麼樣的規律
T(n)=3n^2+2n
T(n)=5n^2+7n
T(n)=n^3+5n
T(n)=6n^3+4n
隨著n的增加,運行時間所消耗耗時如下圖:
折線圖如下:
從上圖可以得到如下:
①:隨著n值變大,5n^2+7n和3n^2+2n,執行曲線重合,說明這種情況下,系數5和3可以忽略;
②:n^3+5n和6n^3+4n,執行曲線分離,說明多少次方是關鍵
3.3.4:總結:
計算時間復雜度的時候忽略常數項、忽略低次項、忽略系數
T(n)不同,但時間復雜度可能相同。
如:T(n)=n2+7n+6與T(n)=3n^2+2n+2它們的T(n)不同,但時間復雜相同,都為O(n^2).
計算時間復雜度的方法用常數1代替運行時間中的所有加法常數T(n)=n^2+7n+6 =>T(n)=n^2+7n+1修改後的運行次數函數中,只保留最高階項T(n)=n^2+7n+1 => T(n)=n^2去除最高階項的系數T(n)=n^2 =>T(n)=n^2 => O(n^2)
3.4:常見的時間復雜度
常數階O(1)
對數階O(log2n)
線性階O(n)
線性對數階O(nlog2n)
平方階O(n^2)
立方階O(n^3)
K次方階(n^k)
指數階O(2^n)
各個時間復雜度復雜度折線圖如下圖:
總結:
常見演算法時間復雜度由小到大依次為:
O(1)
從上圖折線圖中,我們可以看出,程序(演算法)盡可能的避免使用指數階段的演算法。
3.5:常見演算法時間復雜度舉例
3.5.1:常數階O(1)
無論代碼執行多少行,只要是沒有循環等復雜結構,那這個代碼的時間復雜度就是O(1)
(計算時間復雜度的時候,忽略常數項)
代碼demo:
上述代碼在執行的時候,消耗的時間並不是隨著某個變數的增長而增長,那麼無論這類代碼有多長,即使有有幾萬幾十萬行,都是可以用O(1)來表示它的時間復雜度。
3.5.2:對數階O(log2n)
代碼敬上:
說明:
在while循環裡面,每次都是將i*2的。n的值是固定的,所以在i乘完之後,i距離n就越來越近了。假設循環x次之後,i就大於n了,此時這個循環就退出了。也就是說2的x次方等於n了。那麼x=log2n。也就是說當循環了log2n次以後,代碼就結束了。因此這個代碼的時間復雜度就是
O(log2n)。
O(log2n)的這個2時間上是隨著代碼變化的。如果i = i*3,那麼時間復雜度就是O(log3n)
回顧下log的理解(這是初中知識點):
如果a的x次方等於N(a>0,且a≠1),那麼熟x就叫做以a為底的對數(logarithm),記作x=logaN.
其中,a叫做對數的底數,N叫做真數,x叫做「以a為底N的對數」。
3.5.3:線性階O(n)
代碼如下:
說明:
這段代碼,for循環裡面的代碼會執行n次。因此它所消耗的時間隨著n的變化而變化的,因此這類代碼都是可以用O(n)來表示它的時間復雜度。
3.5.4:線性對數階O(nlogn)
代碼如下:
說明:
線性對數階O(nlogN)其實非常容易理解的。將時間復雜度為O(logn)的代碼循環了N次的話,那麼它的時間復雜度就是n*O(logn),也就是O(nlogN)
3.5.5:平方階O(n2)
代碼:
說明:
平方階O(n2)就容易理解了。如果把O(n)的代碼再嵌套循環一遍,它的時間復雜度就是O(n2),
上圖中的代碼起始就是嵌套了2層n循環,它的時間復雜度就是O(n*n),即時O(n2)。如果將其中一層循環的n修改成m,那麼它的時間復雜度就變成了O(m*n).
3.5.6:立方階O(n3)、K次方階O(n^k)
說明:參考上面的O(n2)去理解就好了。O(n3)起始就相當於是三層n循環了。其他的一次類推。
3.6:平均時間復雜度和最壞時間復雜度
平均時間復雜度:
是指所有可能的輸入實例均以概率出現的情況下,該演算法的運行時間
最壞時間復雜度:
是指在最壞情況下的時間復雜度稱為最壞時間復雜度。一般討論時間復雜度均是最壞情況下的時間復雜度。
這樣做的原因:最壞情況下的時間復雜度是演算法在任何輸入實例上運行時間的界限。這就保證了演算法的運行時間不會比最壞情況更長了。
平均時間復雜度和最壞時間復雜度是否一致,和演算法有關。具體如下圖:
四:演算法的空間復雜度
空間復雜度介紹
類似於時間復雜度的討論。一個演算法的空間復雜度(Space Complexity)定義為該演算法所消耗的存儲空間,它也是問題規模n的函數;
空間復雜度是對一個演算法在運行過程中臨時佔用存儲空間大小的量度。有的演算法需要佔用臨時工作單元數與解決問題的規模n有關。它們隨著n的增大而增大,當n較大的時候,將佔用較多的存儲單元(存儲空間)。例如:在快排(快速排序)和歸並排序演算法就屬於這種情況。
在做演算法分析的時候,主要討論的是時間的復雜度。因為從用戶的使用體驗上來看,更看重的是程序執行的速度的快慢。一般緩存產品(比如Redis)和技術排序演算法本質就是拿空間換時間的。
下節預告:
下節我們將講講冒泡排序和選擇排序。使用的是圖解+代碼一步一步推導出來演示的。歡迎大家一起學習
3. java快速排序簡單代碼
.example-btn{color:#fff;background-color:#5cb85c;border-color:#4cae4c}.example-btn:hover{color:#fff;background-color:#47a447;border-color:#398439}.example-btn:active{background-image:none}div.example{width:98%;color:#000;background-color:#f6f4f0;background-color:#d0e69c;background-color:#dcecb5;background-color:#e5eecc;margin:0 0 5px 0;padding:5px;border:1px solid #d4d4d4;background-image:-webkit-linear-gradient(#fff,#e5eecc 100px);background-image:linear-gradient(#fff,#e5eecc 100px)}div.example_code{line-height:1.4em;width:98%;background-color:#fff;padding:5px;border:1px solid #d4d4d4;font-size:110%;font-family:Menlo,Monaco,Consolas,"Andale Mono","lucida console","Courier New",monospace;word-break:break-all;word-wrap:break-word}div.example_result{background-color:#fff;padding:4px;border:1px solid #d4d4d4;width:98%}div.code{width:98%;border:1px solid #d4d4d4;background-color:#f6f4f0;color:#444;padding:5px;margin:0}div.code div{font-size:110%}div.code div,div.code p,div.example_code p{font-family:"courier new"}pre{margin:15px auto;font:12px/20px Menlo,Monaco,Consolas,"Andale Mono","lucida console","Courier New",monospace;white-space:pre-wrap;word-break:break-all;word-wrap:break-word;border:1px solid #ddd;border-left-width:4px;padding:10px 15px} 排序演算法是《數據結構與演算法》中最基本的演算法之一。排序演算法可以分為內部排序和外部排序,內部排序是數據記錄在內存中進行排序,而外部排序是因排序的數據很大,一次不能容納全部的排序記錄,在排序過程中需要訪問外存。常見的內部排序演算法有:插入排序、希爾排序、選擇排序、冒泡排序、歸並排序、快速排序、堆排序、基數排序等。以下是快速排序演算法:
快速排序是由東尼·霍爾所發展的一種排序演算法。在平均狀況下,排序 n 個項目要 Ο(nlogn) 次比較。在最壞譽渣宏狀況下則需要 Ο(n2) 次比較,但這種狀況並不常見。事實上,快速排序梁灶通常明顯比其他 Ο(nlogn) 演算法更快,因為它的內部循環(inner loop)可以在大部分的架構上很有效率地被實現出來。
快速排序使用分治法(Divide and conquer)策略來把一個串列(list)分為兩個子串列(sub-lists)。
快速排序又是一種分而治之思想在排序演算法上的典型應用。本質上來看,快速排序應該算是在冒慶冊泡排序基礎上的遞歸分治法。
快速排序的名字起的是簡單粗暴,因為一聽到這個名字你就知道它存在的意義,就是快,而且效率高!它是處理大數據最快的排序演算法之一了。雖然 Worst Case 的時間復雜度達到了 O(n?),但是人家就是優秀,在大多數情況下都比平均時間復雜度為 O(n logn) 的排序演算法表現要更好,可是這是為什麼呢,我也不知道。好在我的強迫症又犯了,查了 N 多資料終於在《演算法藝術與信息學競賽》上找到了滿意的答案:
快速排序的最壞運行情況是 O(n?),比如說順序數列的快排。但它的平攤期望時間是 O(nlogn),且 O(nlogn) 記號中隱含的常數因子很小,比復雜度穩定等於 O(nlogn) 的歸並排序要小很多。所以,對絕大多數順序性較弱的隨機數列而言,快速排序總是優於歸並排序。
1. 演算法步驟
從數列中挑出一個元素,稱為 "基準"(pivot);
重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分區退出之後,該基準就處於數列的中間位置。這個稱為分區(partition)操作;
遞歸地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序;
2. 動圖演示
代碼實現 JavaScript 實例 function quickSort ( arr , left , right ) {
var len = arr. length ,
partitionIndex ,
left = typeof left != 'number' ? 0 : left ,
right = typeof right != 'number' ? len - 1 : right ;
if ( left