❶ 雲計算基礎架構
雲計算到目前為止架構主要可分為四層,
首先:顯示層,多數據中心雲計算架構這層主要是用於以友好的方式展現用戶所需的內容,並會利用到下面中間件層提供的多種服務,主要有五種技術:
HTML:標準的Web頁面技術,現在主要以HTML4為主,但是將要推出的HTML5會在很多方面推動Web頁面的發展,比如視頻[1]和本地存儲等方面。
JavaScript:一種用於Web頁面的動態語言,通過JavaScript,能夠極大地豐富Web頁面的功能。
CSS:主要用於控制Web頁面的外觀,而且能使頁面的內容與其表現形式之間進行優雅地分離。
Flash[2]:業界最常用的RIA(Rich Internet Applications)技術,能夠在現階段提供HTML等技術所無法提供的基於Web的富應用,而且在用戶體驗[3]方面,非常不錯。
Silverlight:來自業界巨擎微軟[4]的RIA技術,雖然其現在市場佔有率稍遜於Flash,但由於其可以使用C#[5]來進行編程,所以對開發者非常友好。
其次:中間層這層是承上啟下的,它在下面的基礎設施層所提供資源的基礎上提供了多種服務,比如緩存服務和REST服務等,而且這些服務即可用於支撐顯示層,也可以直接讓戶調用,並主要有五種技術;
REST:通過REST技術,能夠非常方便和優雅地將中間件層所支撐的部分服務提供給調用者。
多租戶:就是能讓一個單獨的應用實例可以為多個組織服務,而且保持良好的隔離性和安全性,並且通過這種技術,能有效地降低應用的購置和維護成本。
並行處理:為了處理海量的數據,需要利用龐大的X86集群進行規模巨大的並行處理,Google的MapRece是這方面的代表之作。
應用伺服器:在原有的應用伺服器的基礎上為雲計算做了一定程度的優化,比如用於Google App Engine的Jetty應用伺服器。
分布式緩存:通過分布式緩存技術,不僅能有效地降低對後台伺服器的壓力,而且還能加快相應的反應速度,最著名的分布式緩存例子莫過於Memcached。
再有:基礎設施層這層作用是為給上面的中間件層或者用戶准備其所需的計算和存儲等資源,主要有四種技術:
虛擬化:也可以理解它為基礎設施層的「多租戶」,因為通過虛擬化技術,能夠在一個物理伺服器上生成多個虛擬 機,並且能在這些虛擬機之間能實現全面的隔離,這樣不僅能減低伺服器的購置成本,而且還能同時降低伺服器的運維成本,成熟的X86虛擬化技術有 VMware的ESX和開源的Xen。
分布式存儲:為了承載海量的數據,同時也要保證這些數據的可管理性,所以需要一整套分布式的存儲系統。
關系型資料庫:基本是在原有的關系型資料庫的基礎上做了擴展和管理等方面的優化,使其在雲中更適應。
NoSQL:為了滿足一些關系資料庫所無法滿足的目標,比如支撐海量的數據等,一些公司特地設計一批不是基於關系模型的資料庫。
最後:管理層這層是為橫向的三層服務的,並給這三層提供多種管理和維護等方面的技術,主要有下面這六個方面:
帳號管理:通過良好的帳號管理技術,能夠在安全的條件下方便用戶地登錄,並方便管理員對帳號的管理。
SLA監控:對各個層次運行的虛擬機,服務和應用等進行性能方面的監控,以使它們都能在滿足預先設定的SLA(Service Level Agreement)的情況下運行。
計費管理:也就是對每個用戶所消耗的資源等進行統計,來准確地向用戶索取費用。
安全管理:對數據,應用和帳號等IT[6]資源採取全面地保護,使其免受犯罪分子和惡意程序[7]的侵害。
負載均衡:通過將流量分發給一個應用或者服務的多個實例來應對突發情況。
運維管理:主要是使運維操作盡可能地專業和自動化,從而降低雲計算中心的運維成本。
雲計算架構其中有三層是橫向的,分別是顯示層、中間件層和基礎設施層,通過這三層技術能夠提供非常豐富的雲計算能力和友好的用戶界面,雲計算架構還有一層是縱向的,稱為管理層,是為了更好地管理和維護橫向的三層而存在的。
❷ 什麼是雲計算
雲計算,大數據,人工智慧,區塊鏈熱門詞彙經常被媒體提起,是否大家都理解他們之間的聯系和作用,下面我們用通俗點的說法介紹雲計算。
雲計算當初的設計目的是為了通過虛擬化技術實現IT資源的管理,管理的主要是計算資源、網路資源、存儲資源三個方面。
你去選筆記本電腦或台式電腦,肯定都會看最主要的配置:CPU,內存,硬碟,網卡。計算資源就是CPU和內存,有線或無線網卡和你家裡上網的路由器就組成網路資源,硬碟就是存儲資源。
各大互聯網公司的數據中心管的最主要的東西就上面4個,選一塊偏遠的地造一個很大很大的機房,裡面放置成千上萬台伺服器提供7*24小時不間斷服務。數據中心的管理就像你選電腦配置,管好上面的資源。
很多小公司在創業初期,沒有伺服器,沒有機房,就找到這些有大型數據中心的互聯網公司想租用他們機房的設備。在物理設備時期,這個管數據中心的公司就買一台物理設備安裝到機房通過網路分配給這些小公司收取費用。
這種模式在規模小的時候看不出問題,但很多小公司突發的需求和時效,這個數據中心的互聯網公司就滿足不了了。還有小公司可能只要一個小規格的伺服器,但數據中心只有大型規格的伺服器分配,小公司就不幹了,這是讓我多花冤枉錢啊。
物理設備的極度不靈活造成了各種資源的浪費和制約數據中心的規模化發展。
有人就想辦法了。第一個辦法就是虛擬化。用戶不是只要一個很小的伺服器么?
數據中心的物理設備都很強大,我可以從物理的 CPU、內存、硬碟中虛擬出一小塊來給客戶,同時也可以虛擬出一小塊來給其他客戶。每個客戶只能看到自己的那一小塊,但其實每個客戶用的是整個大的設備上的一小塊。
虛擬化的技術使得不同客戶的伺服器看起來是隔離的。也就是我看著好像這塊盤就是我的,你看著這塊盤就是你的,但實際祥豎森情況可能我的這個100G 和你的這個 100G 是落在同樣一個很大很大的存儲上。而且如果事先物理設備都准備好,虛擬化軟體虛擬出一個電腦是非常快的,基本上幾分鍾就能解決。所以在任何一個雲上要謹畝創建一台伺服器,一點幾分鍾就出來了,就是這個道理。
這樣空間靈活性和時間靈活性就基本解決了。
在虛擬化初期階段,最牛的公司是 VMware。它是實現虛擬化技術比較早的一家公司,可以實現計算、網路、存儲的虛擬化。
這家公司很牛,性能做得非常好,虛擬化軟體賣得也非常好,賺了好多的錢,後來讓 EMC(世界五百強,存儲廠商第一品牌)給收購了。但這個世界上還是有很多有情懷的人的,尤其是程序員裡面。有情懷的人喜歡做什麼事情?開源。
這個世界上很多軟體都是有閉源就有開源,源就是源代碼。也就是說,某個軟體做的好,所有人都愛用,但這個軟體的代碼被我封閉起來,只有我公司知道,其他人不知道。
如果其他人想用這個軟體,就要向我付錢,這就叫閉源。但世界上總有一些極客和大牛看不慣這些人壟斷的情況。大牛們覺得,這個技術你會我也會;你能開發出來,我也能。
我開發出來就是不收錢,把代碼拿出來分享給大家,全世界誰用都可以,所有的人都可以享受到好處,這個叫做開源。
我們每天接觸最多的開源就是WWW,萬維網,是由蒂姆·伯納斯·李免費開放代碼。2017 年,他因「發明萬維網、第一個瀏覽器和使萬維網得以擴展的基本協議和演算法」而獲得 2016 年度的計算機里的諾貝爾獎-圖靈獎。
我們現在在網上的所有行為都應該感謝他的功勞,如果他將這個技術拿來收錢,應該和比爾蓋茨差不多有錢。
開源和閉源的例子有很多:例如在閉源的世界裡有 Windows,大家用 Windows 都得給微軟付錢;開源的世界裡面就出現了 Linux。比爾蓋茨靠 Windows、Office 這些閉源的軟體賺了很多錢,成為世界纖孝首富,就有大牛開發了另外一種開源操作系統 Linux。可能不懂IT的人沒有聽說過 Linux,很多後台的伺服器上跑的程序都是 Linux 上的,比如每年的雙十一,無論是淘寶、天貓、京東、考拉……支撐雙十一搶購的系統都是跑在 Linux 上的。
再如有 Apple 就有安卓。Apple 市值很高,但是蘋果系統的代碼我們是看不到的,於是谷歌里就有大牛寫了安卓手機操作系統把開源代碼免費開放。所以大家可以看到幾乎所有的其他手機廠商,裡面都裝安卓系統。原因就是蘋果系統不開源,而安卓系統大家都可以用。
在虛擬化世界也一樣,有了 VMware,這個軟體非常貴。那就有大牛寫了兩個開源的虛擬化軟體,一個叫做 Xen,一個叫做 KVM。
要說虛擬化軟體解決了靈活性問題,其實並不全對。因為虛擬化軟體一般創建一台虛擬的電腦,是需要人工指定這台虛擬電腦放在哪台物理機上的。這一過程可能還需要比較復雜的人工配置,做這個工作的人專業化程度很高,所以僅僅憑虛擬化軟體所能管理的物理機的集群規模都不是特別大,一般在十幾台、幾十台、最多百台這么一個規模。
這一方面會影響時間靈活性:雖然虛擬出一台電腦的時間很短,但是隨著集群規模的擴大,人工配置的過程越來越復雜,越來越耗時。
另一方面也影響空間靈活性:當用戶數量多時,這點集群規模,還遠達不到想要多少要多少的程度,很可能這點資源很快就用完了,還得去采購。
所以隨著集群的規模越來越大,基本都是千台起步,動輒上萬台、甚至幾十上百萬台。如果去查一下 BAT,包括網易、谷歌、亞馬遜,伺服器數目都大的嚇人。
這么多機器要靠人去選一個位置放這台虛擬化的電腦並做相應的配置,幾乎是不可能的事情,還是需要機器去做這個事情。
人們就發明了各種各樣的演算法來做這個事情,演算法的名字叫做調度(Scheler)。
通俗一點說,就是有一個調度中心,幾千台機器都在一個池子裡面,無論用戶需要多少 CPU、內存、硬碟的虛擬電腦,調度中心會自動在大池子裡面找一個能夠滿足用戶需求的地方,把虛擬電腦啟動起來做好配置,用戶就直接能用了。
這個階段我們稱為池化或者雲化,到了這個階段,才可以稱為雲計算,在這之前都只能叫虛擬化,別TM扯上雲化的關系。
雲計算大致分兩種:一個是私有雲,一個是公有雲,還有人把私有雲和公有雲連接起來稱為混合雲。
私有雲:把虛擬化和雲化的這套軟體部署在別人的數據中心裏面。使用私有雲的用戶往往很有錢,自己買地建機房、自己買伺服器,然後讓雲廠商部署在自己這里。
VMware 後來除了虛擬化,也推出了雲計算的產品,並且在私有雲市場大賺特賺。
公有雲:把虛擬化和雲化軟體部署在雲廠商自己數據中心裏面的,用戶不需要很大的投入,只要注冊一個賬號,就能在一個網頁上點一下創建一台虛擬電腦。
例如 AWS 即亞馬遜的公有雲;國內的阿里雲、騰訊雲、網易雲等。
亞馬遜為什麼要做公有雲呢?我們知道亞馬遜原來是國外比較大的一個電商,它做電商時也肯定會遇到類似雙十一的場景:在某一個時刻大家都沖上來買東西,訪問量暴增。
當大家都沖上買東西時,就特別需要雲的時間靈活性和空間靈活性。因為它不能時刻准備好所有的資源,那樣太浪費了。但也不能什麼都不準備,看著雙十一這么多用戶想買東西登不上去。
所以需要雙十一時,就創建一大批虛擬電腦來支撐電商應用,過了雙十一再把這些資源都釋放掉去干別的。因此亞馬遜是需要一個雲平台的,然而商用的虛擬化軟體實在是太貴了,亞馬遜總不能把自己在電商賺的錢全部給了虛擬化廠商。
於是亞馬遜基於開源的虛擬化技術,開發了一套自適應的雲化軟體。沒想到亞馬遜後來電商越做越牛,雲平台也越做越牛。
由於它的雲平台需要支撐自己的電商應用;而傳統的雲計算廠商多為 IT 廠商出身,幾乎沒有自己的應用,所以亞馬遜的雲平台對應用更加友好,迅速發展成為雲計算的第一品牌,賺了很多錢。
公有雲的第一名亞馬遜過得很爽,排第二的 Rackspace 過得就很凄慘了。互聯網行業的天然的壁壘鑄就其殘酷性,勝者為王的模式,壓根沒人聽過老二是誰。
老二就不忿了,我干不過老大怎麼辦呢?開源啊。如上所述,亞馬遜雖然使用了開源的虛擬化技術,但雲化的代碼是閉源的。很多想做又做不了雲化平台的公司,只能眼巴巴的看著亞馬遜掙大錢。Rackspace 把源代碼一公開,整個行業就可以一起把這個平台越做越好,兄弟們大家一起上,和老大拼了。
於是 Rackspace 和美國航空航天局合作創辦了開源軟體 OpenStack,如上圖所示 OpenStack 的架構圖,圖中三個關鍵詞:Compute 計算、Networking 網路、Storage 存儲,就是一個計算、網路、存儲的雲化管理平台。
當然第二名的技術也是非常棒棒的,有了 OpenStack 之後,果真像 Rackspace 想的一樣,所有想做雲的大企業都瘋了,個個豪強都瘋了似的蜂擁而入,你能想像到的所有如雷貫耳的大型 IT 企業:IBM、惠普、戴爾、華為、聯想等。
原來雲平台大家都想做,看著亞馬遜和 VMware 賺了這么多錢,眼巴巴看著沒辦法,想自己做一個好像難度還挺大。現在好了,有了這樣一個開源的雲平台 OpenStack,所有的 IT 廠商都加入到這個社區中來,對這個雲平台進行貢獻,包裝成自己的產品,連同自己的硬體設備一起賣。
有的做了私有雲,有的做了公有雲,OpenStack 已經成為開源雲平台的事實標准。
到了這個階段,雲計算基本上實現了時間靈活性和空間靈活性;實現了計算、網路、存儲資源的彈性。
計算、網路、存儲我們常稱為基礎設施 Infranstracture, 因而這個階段的彈性稱為資源層面的彈性。
計算資源已經變成了如日常的水電一般,人們可隨意調用。