Ⅰ 有關電腦的資料!急!!!!!!!!!!!!!!!!!!!11
英文名稱:
computer
電子計算機是一種根據一系列指令來對數據進行處理的機器。所相關的技術研究叫計算機科學,由數據為核心的研究稱信息技術。
計算機種類繁多。實際來看,計算機總體上是處理信息的工具。根據圖靈機理論,一部具有最基本功能的計算機應當能夠完成任何其它計算機能做的事情。因此,只要不考慮時間和存儲因素,從個人數碼助理(PDA)到超級計算機都應該可以完成同樣的作業。即是說,即使是設計完全相同的計算機,只要經過相應改裝,就應該可以被用於從公司薪金管理到無人駕駛飛船操控在內的各種任務。由於科技的飛速進步,下一代計算機總是在性能上能夠顯著地超過其前一代,這一現象有時被稱作「摩爾定律」。
計算機在組成上形式不一。早期計算機的體積足有一間房屋大小,而今天某些嵌入式計算機可能比一副撲克牌還小。當然,即使在今天,依然有大量體積龐大的巨型計算機為特別的科學計算或面向大型組織的事務處理需求服務。比較小的,為個人應用而設計的計算機稱為微型計算機,簡稱微機。我們今天在日常使用「計算機」一詞時通常也是指此。不過,現在計算機最為普遍的應用形式卻是嵌入式的。嵌入式計算機通常相對簡單,體積小,並被用來控制其它設備—無論是飛機,工業機器人還是數碼相機。
上述對於電子計算機的定義包括了許多能計算或是只有有限功能的特定用途的設備。然而當說到現代的電子計算機,其最重要的特徵是,只要給予正確的指示,任何一台電子計算機都可以模擬其他任何計算機的行為(只受限於電子計算機本身的存儲容量和執行的速度)。據此,現代電子計算機相對於早期的電子計算機也被稱為通用型電子計算機。
歷史
ENIAC是電腦發展史上的一個里程碑本來,計算機的英文原詞「computer」是指從事數據計算的人。而他們往往都需要藉助某些機械計算設備或模擬計算機。這些早期計算設備的祖先包括有算盤,以及可以追溯到公元前87年的被古希臘人用於計算行星移動的安提基特拉機制。隨著中世紀末期歐洲數學與工程學的再次繁榮,1623年由Wilhelm Schickard率先研製出了歐洲第一台計算設備,這是一個能進行六位以內數加減法,並能通過鈴聲輸出答案的「計算鍾」。使用轉動齒輪來進行操作。
1642年法國數學家Pascal 在WILLIAM Oughtred計算尺的基礎上,將計算尺加以改進,能進行八位計算。還賣出了許多製品,成為當時一種時髦的商品。
1801年,Joseph Marie Jacquard對織布機的設計進行了改進,其中他使用了一系列打孔的紙卡片來作為編織復雜圖案的程序。Jacquard式織布機,盡管並不被認為是一台真正的計算機,但是它的出現確實是現代計算機發展過程中重要的一步。
查爾斯・巴比奇(Charles Babbage)是構想和設計一台完全可編程計算機的第一人,當時是1820年。但由於技術條件,經費限制,以及無法忍耐對設計不停的修補,這台計算機在他有生之年始終未能問世。約到19世紀晚期,許多後來被證明對計算機科學有著重大意義的技術相繼出現,包括打孔卡片以及真空管。Hermann Hollerith設計了一台製表用的機器,就實現了應用打孔卡片的大規模自動數據處理。
在20世紀前半葉,為了迎合科學計算的需要,許許多多單一用途的並不斷深化復雜的模擬計算機被研製出來。這些計算機都是用它們所針對的特定問題的機械或電子模型作為計算基礎。20世紀三四十年代,計算機的性能逐漸強大並且通用性得到提升,現代計算機的關鍵特色被不斷地加入進來。
1937年由克勞德·艾爾伍德·香農(Claude Shannon)發表了他的偉大論文《對繼電器和開關電路中的符號分析》,文中首次提及數字電子技術的應用。他向人們展示了如何使用開關來實現邏輯和數學運算。此後,他通過研究Vannevar Bush的微分模擬器進一步鞏固了他的想法。這是一個標志著二進制電子電路設計和邏輯門應用開始的重要時刻,而作為這些關鍵思想誕生的先驅,應當包括:Almon Strowger,他為一個含有邏輯門電路的設備申請了專利;尼古拉・特斯拉(Nikola Tesla),他早在1898年就曾申請含有邏輯門的電路設備;Lee De Forest,於1907年他用真空管代替了繼電器。
Commodore公司在20世紀八十年代生產的Amiga 500電腦沿著這樣一條上下求索的漫漫長途去定義所謂的「第一台電子計算機」可謂相當困難。1941年5月12日,Konrad Zuse完成了他的機電共享設備「Z3」,這是第一台具有自動二進制數學計算特色以及可行的編程功能的計算機,但還不是「電子」計算機。此外,其他值得注意的成就主要有:1941年夏天誕生的阿塔納索夫-貝瑞計算機是世界上第一台電子計算機,它使用了真空管計算器,二進制數值,可復用內存;在英國於1943年被展示的神秘的巨像計算機(Colossus computer),盡管編程能力極其有限,但是它的的確確告訴了人們使用真空管既值得信賴又能實現電氣化的再編程;哈佛大學的Harvard Mark I;以及基於二進制的「埃尼阿克」(ENIAC,1944年),這是第一台通用意圖的計算機,但由於其結構設計不夠彈性化,導致對它的每一次再編程都意味著電氣物理線路的再連接。
開發埃尼愛克的小組針對其缺陷又進一步完善了設計,並最終呈現出今天我們所熟知的馮·諾伊曼結構(程序存儲體系結構)。這個體系是當今所有計算機的基礎。20世紀40年代中晚期,大批基於此一體系的計算機開始被研製,其中以英國最早。盡管第一台研製完成並投入運轉的是「小規模實驗機」(Small-Scale Experimental Machine,SSEM),但真正被開發出來的實用機很可能是EDSAC。
在整個20世紀50年代,真空管計算機居於統治地位。1958年 9月12日 在Robert Noyce(INTEL公司的創始人)的領導下,發明了集成電路。不久又推出了微處理器。1959年到1964年間設計的計算機一般被稱為第二代計算機。
到了60年代,晶體管計算機將其取而代之。晶體管體積更小,速度更快,價格更加低廉,性能更加可靠,這使得它們可以被商品化生產。1964年到1972年的計算機一般被稱為第三代計算機。大量使用集成電路,典型的機型是IBM360系列。
到了70年代,集成電路技術的引入極大地降低了計算機生產成本,計算機也從此開始走向千家萬戶。1972年以後的計算機習慣上被稱為第四代計算機。基於大規模集成電路,及後來的超大規模集成電路。1972年4月1日 INTEL推出8008微處理器。1976年Stephen Wozinak和Stephen Jobs創辦蘋果計算機公司。並推出其Apple I 計算機。1977年5月 Apple II 型計算機發布。1979年6月1日 INTEL發布了8位元的8088微處理器。
1982年,微電腦開始普及,大量進入學校和家庭。1982年1月Commodore 64計算機發布,價格:595美元。 1982 年2月80286發布。時鍾頻率提高到20MHz,並增加了保護模式,可訪問16M內存。支持1GB以上的虛擬內存。每秒執行270萬條指令,集成了134000個晶體管。
1990年11月: 第一代MPC (多媒體個人電腦標准)發布。處理器至少80286/12MHz,後來增加到80386SX/16 MHz ,及一個光碟機,至少150 KB/sec的傳輸率。1994年10月10日 Intel 發布75 MHz Pentium處理器。1995年11月1日Pentium Pro發布。主頻可達200 MHz ,每秒鍾完成4.4億條指令,集成了550萬個晶體管。1997年1月8日Intel發布Pentium MMX。對游戲和多媒體功能進行了增強。
此後計算機的變化日新月異,1965年發表的摩爾定律發表不斷被應證,預測在未來10~15年仍依然適用。
原理
個人電腦的主要結構:
顯示器
主板
CPU (中央處理器)
主要儲存器 (內存)
擴充卡
電源供應器
光碟機
次要儲存器 (硬碟)
鍵盤
滑鼠
盡管計算機技術自20世紀40年代第一台電子通用計算機誕生以來以來有了令人目眩的飛速發展,但是今天計算機仍然基本上採用的是存儲程序結構,即馮·諾伊曼結構。這個結構實現了實用化的通用計算機。
存儲程序結構間將一台計算機描述成四個主要部分:算術邏輯單元(ALU),控制電路,存儲器,以及輸入輸出設備(I/O)。這些部件通過一組一組的排線連接(特別地,當一組線被用於多種不同意圖的數據傳輸時又被稱為匯流排),並且由一個時鍾來驅動(當然某些其他事件也可能驅動控制電路)。
概念上講,一部計算機的存儲器可以被視為一組「細胞」單元。每一個「細胞」都有一個編號,稱為地址;又都可以存儲一個較小的定長信息。這個信息既可以是指令(告訴計算機去做什麼),也可以是數據(指令的處理對象)。原則上,每一個「細胞」都是可以存儲二者之任一的。
算術邏輯單元(ALU)可以被稱作計算機的大腦。它可以做兩類運算:第一類是算術運算,比如對兩個數字進行加減法。算術運算部件的功能在ALU中是十分有限的,事實上,一些ALU根本不支持電路級的乘法和除法運算(由是使用者只能通過編程進行乘除法運算)。第二類是比較運算,即給定兩個數,ALU對其進行比較以確定哪個更大一些。
輸入輸出系統是計算機從外部世界接收信息和向外部世界反饋運算結果的手段。對於一台標準的個人電腦,輸入設備主要有鍵盤和滑鼠,輸出設備則是顯示器,列印機以及其他許多後文將要討論的可連接到計算機上的I/O設備。
控制系統將以上計算機各部分聯系起來。它的功能是從存儲器和輸入輸出設備中讀取指令和數據,對指令進行解碼,並向ALU交付符合指令要求的正確輸入,告知ALU對這些數據做哪些運算並將結果數據返回到何處。控制系統中一個重要組件就是一個用來保持跟蹤當前指令所在地址的計數器。通常這個計數器隨著指令的執行而累加,但有時如果指令指示進行跳轉則不依此規則。
20世紀80年代以來ALU和控制單元(二者合成中央處理器,CPU)逐漸被整合到一塊集成電路上,稱作微處理器。這類計算機的工作模式十分直觀:在一個時鍾周期內,計算機先從存儲器中獲取指令和數據,然後執行指令,存儲數據,再獲取下一條指令。這個過程被反復執行,直至得到一個終止指令。
由控制器解釋,運算器執行的指令集是一個精心定義的數目十分有限的簡單指令集合。一般可以分為四類:1)、數據移動(如:將一個數值從存儲單元A拷貝到存儲單元B)2)、數邏運算(如:計算存儲單元A與存儲單元B之和,結果返回存儲單元C)3)、條件驗證(如:如果存儲單元A內數值為100,則下一條指令地址為存儲單元F)4)、指令序列改易(如:下一條指令地址為存儲單元F)
指令如同數據一樣在計算機內部是以二進制來表示的。比如說,10110000就是一條Intel x86系列微處理器的拷貝指令代碼。某一個計算機所支持的指令集就是該計算機的機器語言。因此,使用流行的機器語言將會使既成軟體在一台新計算機上運行得更加容易。所以對於那些機型商業化軟體開發的人來說,它們通常只會關注一種或幾種不同的機器語言。
更加強大的小型計算機,大型計算機和伺服器可能會與上述計算機有所不同。它們通常將任務分擔給不同的CPU來執行。今天,微處理器和多核個人電腦也在朝這個方向發展。
超級計算機通常有著與基本的存儲程序計算機顯著區別的體系結構。它們通常有著數以千計的CPU,不過這些設計似乎只對特定任務有用。在各種計算機中,還有一些微控制器採用令程序和數據分離的哈佛架構(Harvard architecture)。
計算機的數字電路實現
以上所說的這些概念性設計的物理實現是多種多樣的。如同我們前述所及,一台存儲程序式計算機既可以是巴比奇的機械式的,也可以是基於數字電子的。但是,數字電路可以通過諸如繼電器之類的電子控制開關來實現使用2進制數的算術和邏輯運算。香農的論文正是向我們展示了如何排列繼電器來組成能夠實現簡單布爾運算的邏輯門。其他一些學者很快指出使用真空管可以代替繼電器電路。真空管最初被用作無線電電路中的放大器,之後便開始被越來越多地用作數字電子電路中的快速開關。當電子管的一個針腳被通電後,電流就可以在另外兩端間自由通過。
通過邏輯門的排列組合我們可以設計完成很多復雜的任務。舉例而言,加法器就是其中之一。該器件在電子領域實現了兩個數相加並將結果保存下來—在計算機科學中這樣一個通過一組運算來實現某個特定意圖的方法被稱做一個演算法。最終,人們通過數量可觀的邏輯門電路組裝成功了完整的ALU和控制器。說它數量可觀,只需看一下CSIRAC這台可能是最小的實用化電子管計算機。該機含有2000個電子管,其中還有不少是雙用器件,也即是說總計合有2000到4000個邏輯器件。
真空管對於製造規模龐大的門電路明顯力不從心。昂貴,不穩(尤其是數量多時),臃腫,能耗高,並且速度也不夠快—盡管遠超機械開關電路。這一切導致20世紀60年代它們被晶體管取代。後者體積更小,易於操作,可靠性高,更省能耗,同時成本也更低。
集成電路是現今電子計算機的基礎20世紀60年代後,晶體管開始逐漸為將大量晶體管、其他各種電器元件和連接導線安置在一片硅板上的集成電路所取代。70年代,ALU和控制器作為組成CPU的兩大部分,開始被集成到一塊晶元上,並稱為「微處理器」。沿著集成電路的發展史,可以看到一片晶元上所集成器件的數量有了飛速增長。第一塊集成電路只不過包含幾十個部件,而到了2006年,一塊Intel Core Duo處理器上的晶體管數目高達一億五千一百萬之巨。
無論是電子管,晶體管還是集成電路,它們都可以通過使用一種觸發器設計機制來用作存儲程序體系結構中的「存儲」部件。而事實上觸發器的確被用作小規模的超高速存儲。但是,幾乎沒有任何計算機設計使用觸發器來進行大規模數據存儲。最早的計算機是使用Williams電子管向一個電視屏或若干條水銀延遲線(聲波通過這種線時的走行速度極為緩慢足夠被認為是「存儲」在了上面)發射電子束然後再來讀取的方式來存儲數據的。當然,這些盡管有效卻不怎麼優雅的方法最終還是被磁性存儲取而代之。比如說磁芯存儲器,代表信息的電流可在其中的鐵質材料內製造恆久的弱磁場,當這個磁場再被讀出時就實現了數據恢復。動態隨機存儲器(DRAM)亦被發明出來。它是一個包含大量電容的集成電路,而這些電容器件正是負責存儲數據電荷—電荷的強度則被定義為數據的值。
輸入輸出設備
輸入輸出設備(I/O)是對將外部世界信息發送給計算機的設備和將處理結果返回給外部世界的設備的總稱。這些返回結果可能是作為使用者能夠視覺上體驗的,或是作為該計算機所控制的其他設備的輸入:對於一台機器人,控制計算機的輸出基本上就是這台機器人本身,如做出各種行為。
第一代計算機的輸入輸出設備種類非常有限。通常的輸入用設備是打孔卡片的讀卡機,用來將指令和數據導入內存;而用於存儲結果的輸出設備則一般是磁帶。隨著科技的進步,輸入輸出設備的豐富性得到提高。以個人計算機為例:鍵盤和滑鼠是用戶向計算機直接輸入信息的主要工具,而顯示器、列印機、擴音器、耳機則返回處理結果。此外還有許多輸入設備可以接受其他不同種類的信息,如數碼相機可以輸入圖像。在輸入輸出設備中,有兩類很值得注意:第一類是二級存儲設備,如硬碟,光碟或其他速度緩慢但擁有很高容量的設備。第二個是計算機網路訪問設備,通過他們而實現的計算機間直接數據傳送極大地提升了計算機的價值。今天,國際互聯網成就了數以千萬計的計算機彼此間傳送各種類型的數據。
程序
簡單說,計算機程序就是計算機執行指令的一個序列。它既可以只是幾條執行某個簡單任務的指令,也可能是可能要操作巨大數據量的復雜指令隊列。許多計算機程序包含有百萬計的指令,而其中很多指令可能被反復執行。在2005年,一台典型的個人電腦可以每秒執行大約30億條指令。計算機通常並不會執行一些很復雜的指令來獲得額外的機能,更多地它們是在按照程序員的排列來運行那些較簡單但為數眾多的短指令。
一般情況下,程序員們是不會直接用機器語言來為計算機寫入指令的。那麼做的結果只能是費時費力、效率低下而且漏洞百出。所以,程序員一般通過「高級」一些的語言來寫程序,然後再由某些特別的計算機程序,如解釋器或編譯器將之翻譯成機器語言。一些編程語言看起來很接近機器語言,如匯編程序,被認為是低級語言。而另一些語言,如即如抽象原則的Prolog,則完全無視計算機實際運行的操作細節,可謂是高級語言。對於一項特定任務,應該根據其事務特點,程序員技能,可用工具和客戶需求來選擇相應的語言,其中又以客戶需求最為重要(美國和中國軍隊的工程項目通常被要求使用Ada語言)。
計算機軟體是與計算機程序並不相等的另一個詞彙。計算機軟體一個較為包容性較強的技術術語,它包含了用於完成任務的各種程序以及所有相關材料。舉例說,一個視頻游戲不但只包含程序本身,也包括圖片、聲音以及其他創造虛擬游戲環境的數據內容。在零售市場,在一台計算機上的某個應用程序只是一個面向大量用戶的軟體的一個副本。這里老生常談的例子當然還是微軟的office軟體組,它包括一些列互相關聯的、面向一般辦公需求的程序。
利用那些極其簡單的機器語言指令來實現無數功能強大的應用軟體意味著其編程規模註定不小。Windows XP這個操作系統程序包含的C++高級語言源代碼達到了4000萬行。當然這還不是最大的。如此龐大的軟體規模也顯示了管理在開發過程中的重要性。實際編程時,程序會被細分到每一個程序員都可以在一個可接受的時長內完成的規模。
即便如此,軟體開發的過程仍然進程緩慢,不可預見且遺漏多多。應運而生的軟體工程學就重點面向如何加快作業進度和提高效率與質量。
庫與操作系統
在計算機誕生後不久,人們發現某些特定作業在許多不同的程序中都要被實施,比如說計算某些標准數學函數。出於效率考量,這些程序的標准版本就被收集到一個「庫」中以供各程序調用。許多任務經常要去額外處理種類繁多的輸入輸出介面,這時,用於連接的庫就能派上用場。
20世紀60年代,隨著計算機工業化普及,計算機越來越多地被用作一個組織內不同作業的處理。很快,能夠自動安排作業時續和執行的特殊軟體出現了。這些既控制硬體又負責作業時序安排的軟體被稱為「操作系統」。一個早期操作系統的例子是IBM的OS/360。
在不斷地完善中,操作系統又引入了時間共享機制——並發。這使得多個不同用戶可以「同時」地使用機器執行他們自己的程序,看起來就像是每個人都有一台自己的計算機。為此,操作系統需要像每個用戶提供一台「虛擬機」來分離各個不同的程序。由於需要操作系統控制的設備也在不斷增加,其中之一便是硬碟。因之,操作系統又引入了文件管理和目錄管理(文件夾),大大簡化了這類永久儲存性設備的應用。此外,操作系統也負責安全控制,確保用戶只能訪問那些已獲得允許的文件。
當然,到目前為止操作系統發展歷程中最後一個重要步驟就是為程序提供標准圖形用戶界面(GUI)。盡管沒有什麼技術原因表明操作系統必須得提供這些界面,但操作系統供應商們總是希望並鼓勵那些運行在其系統上的軟體能夠在外觀和行為特徵上與操作系統保持一致或相似。
除了以上這些核心功能,操作系統還封裝了一系列其他常用工具。其中一些雖然對計算機管理並無重大意義,但是於用戶而言很是有用。比如,蘋果公司的Mac OS X就包含視頻剪輯應用程序。
一些用於更小規模的計算機的操作系統可能沒用如此眾多的功能。早期的微型計算機由於記憶體和處理能力有限而不會提供額外功能,而嵌入式計算機則使用特定化了的操作系統或者乾脆沒有,它們往往通過應用程序直接代理操作系統的某些功能。
應用
由電腦控制的機械在工業中十分常見
很多現代大量生產的玩具,如Furby,是不能沒有便宜的嵌入式處理器
起初,體積龐大而價格昂貴的數字計算機主要是用做執行科學計算,特別是軍用課題。如ENIAC最早就是被用作火炮彈道計算和設計氫彈時計算斷面中子密度的(如今許多超級計算機仍然在模擬核試驗方面發揮著巨大作用)。澳大利亞設計的首台存儲程序計算機CSIR Mk I型負責對水電工程中的集水地帶的降雨情形進行評估。還有一些被用於解密,比如英國的「巨像」可編程計算機。除去這些早年的科學或軍工應用,計算機在其他領域的推廣亦十分迅速。
從一開始,存儲程序計算機就與商業問題的解決息息相關。早在IBM的第一台商用計算機誕生之前,英國J. Lyons等就設計製造了LEO以進行資產管理或迎合其他商業用途。由於持續的體積與成本控制,計算機開始向更小型的組織內普及。加之20世紀70年代微處理器的發明,廉價計算機成為了現實。80年代,個人計算機全面流行,電子文檔寫作與印刷,計算預算和其他重復性的報表作業越來越多地開始依賴計算機。
隨著計算機便宜起來,創作性的藝術工作也開始使用它們。人們利用合成器,計算機圖形和動畫來創作和修改聲音,圖像,視頻。視頻游戲的產業化也說明了計算機在娛樂方面也開創了新的歷史。
計算機小型化以來,機械設備的控制也開始仰仗計算機的支持。其實,正是當年為了建造足夠小的嵌入式計算機來控制阿波羅宇宙飛船才刺激了集成電路技術的躍進。今天想要找一台不被計算機控制的有源機械設備要比找一台哪怕是部分計算機控制的設備要難得多。可能最著名的計算機控制設備要非機器人莫屬,這些機器有著或多或少人類的外表和並具備人類行為的某一子集。在批量生產中,工業機器人已是尋常之物。不過,完全的擬人機器人還只是停留在科幻小說或實驗室之中。
機器人技術實質上是人工智慧領域中的物理表達環節。所謂人工智慧是一個定義模糊的概念但是可以肯定的是這門學科試圖令計算機擁有目前它們還沒有但作為人類卻固有的能力。數年以來,不斷有許多新方法被開發出來以允許計算機做那些之前被認為只有人才能做的事情。比如讀書、下棋。然而,到目前為止,在研製具有人類的一般「整體性」智能的計算機方面,進展仍十分緩慢。
網路、國際互聯網
20世紀50年代以來計算機開始用作協調來自不同地方之信息的工具,美國軍方的賢者系統(SAGE)就是這方面第一個大規模系統。之後「軍刀」等一系列特殊用途的商業系統也不斷涌現出來。
70年代後,美國各大院校的計算機工程師開始使用電信技術把他們的計算機連接起來。由於這方面的工作得到了ARPA的贊助,其計算機網路也就被稱為ARPANET。此後,用於ARPA網的技術快速擴散和進化,這個網路也沖破大學和軍隊的范圍最終形成了今天的國際互聯網(Internet)。網路的出現導致了對計算機屬性和邊界的再定義。太陽微系統公司的John Gage 和 Bill Joy就指出:「網路即是計算機」。計算機操作系統和應用程序紛紛向能訪問諸如網內其它計算機等網路資源的方向發展。最初這些網路設備僅限於為高端科學工作者所使用,但90年代後隨著電子郵件和萬維網(World Wide Web)技術的擴散,以及乙太網和ADSL等網路連接技術的廉價化,互聯網路已變得無所不在。今日入網的計算機總數,何以千萬計;無線互聯技術的普及,使得互聯網在移動計算環境中亦如影隨形。比如在筆記本計算機上廣泛使用的Wi-Fi技術就是無線上網的代表性應用。
下一代計算機
自問世以來數字計算機在速度和能力上有了可觀的提升,迄今仍有不少課題顯得超出了當前計算機的能力所及。對於其中一部分課題,傳統計算機是無論如何也不可能實現的,因為找到一個解決方法的時間還趕不上問題規模的擴展速度。因此,科學家開始將目光轉向生物計算技術和量子理論來解決這一類問題。比如,人們計劃用生物性的處理來解決特定問題(DNA計算)。由於細胞分裂的指數級增長方式,DNA計算系統很有可能具備解決同等規模問題的能力。當然,這樣一個系統直接受限於可控制的DNA總量。
量子計算機,顧名思義,利用了量子物理世界的超常特性。一旦能夠造出量子計算機,那麼它在速度上的提升將令一般計算機難以望其項背。當然,這種涉及密碼學和量子物理模擬的下一代計算機還只是停留在構想階段。
Ⅱ 為什麼從事大數據行業,一定要學習python
你好,這主要是因為Python在處理大數據方面有著得天獨厚的優勢。
以後您如果再遇到類似的問題,可以按照下面的思路去解決:
1、發現問題:往往生活在世界中,時時刻刻都處在這各種各樣的矛盾中,當某些矛盾放映到意識中時,個體才發現他是個問題,並要求設法去解決它。這就是發現問題的階段。從問題的解決的階段性看,這是第一階段,是解決問題的前提。
2、分析問題:要解決所發現的問題,必須明確問題的性質,也就是弄清楚有哪些矛盾、哪些矛盾方面,他們之間有什麼關系,以明確所要解決的問題要達到什麼結果,所必須具備的條件、其間的關系和已具有哪些條件,從而找出重要的矛盾、關鍵矛盾之所在。
3、提出假設:在分析問題的基礎上,提出解決問題的假設,即可採用的解決方案,其中包括採取什麼原則和具體的途徑和方法,但所有這些往往不是簡單現成的,而且有多種多樣的可能。但提出假設是問題解決的關鍵階段,正確的假設引導問題順利得到解決,不正確不恰當的假設則使問題的解決走彎路或導向歧途。
4、校驗假設:假設只是提出n種可能解決方案,還不能保證問題必定能獲得解決,所以問題解決的最後一步是對假設進行檢驗。不論哪種檢驗如果未能獲得預期結果,必須重新另提出假設再進行檢驗,直至獲得正確結果,問題才算解決。
Ⅲ 為什麼從事大數據行業,一定要學習Python
需要澄清兩點之後才可以比較全面的看這個問題: 1. 百萬行級不算大數據量,以目前的互聯網應用來看,大數據量的起點是10億條以上。 2. 處理的具體含義,如果是數據載入和分發,用python是很高效的;如果是求一些常用的統計量和求一些基本演算法的結果,python也有現成的高效的 庫,c實現的和並行化的;如果是純粹自己寫的演算法,沒有任何其他可借鑒的,什麼庫也用不上,用純python寫是自討苦吃。 python的優勢不在於運行效率,而在於開發效率和高可維護性。針對特定的問題挑選合適的工具,本身也是一項技術能力。Python是一個強大的,靈活的,開放的,易於學習的源語言,使用方便,並具有強大的數據操作和分析庫。其簡單的語法使編程新手很容易學習和掌握,經歷過Matlab,,C / C++,java,或Visual Basic,Python提供了一個獨特的組合,都能使用編程語言以及使用方便的分析和定量計算
Ⅳ 演算法工程師應該學哪些
一、演算法工程師簡介
(通常是月薪15k以上,年薪18萬以上,只是一個概數,具體薪資可以到招聘網站如拉鉤,獵聘網上看看)
演算法工程師目前是一個高端也是相對緊缺的職位;
演算法工程師包括
音/視頻演算法工程師(通常統稱為語音/視頻/圖形開發工程師)、圖像處理演算法工程師、計算機視覺演算法工程師、通信基帶演算法工程師、信號演算法工程師、射頻/通信演算法工程師、自然語言演算法工程師、數據挖掘演算法工程師、搜索演算法工程師、控制演算法工程師(雲台演算法工程師,飛控演算法工程師,機器人控制演算法)、導航演算法工程師(
@之介
感謝補充)、其他【其他一切需要復雜演算法的行業】
專業要求:計算機、電子、通信、數學等相關專業;
學歷要求:本科及其以上的學歷,大多數是碩士學歷及其以上;
語言要求:英語要求是熟練,基本上能閱讀國外專業書刊,做這一行經常要讀論文;
必須掌握計算機相關知識,熟練使用模擬工具MATLAB等,必須會一門編程語言。
演算法工程師的技能樹(不同方向差異較大,此處僅供參考)
1 機器學習
2 大數據處理:熟悉至少一個分布式計算框架Hadoop/Spark/Storm/ map-rece/MPI
3 數據挖掘
4 扎實的數學功底
5 至少熟悉C/C++或者Java,熟悉至少一門編程語言例如java/python/R
加分項:具有較為豐富的項目實踐經驗(不是水論文的哪種)
二、演算法工程師大致分類與技術要求
(一)圖像演算法/計算機視覺工程師類
包括
圖像演算法工程師,圖像處理工程師,音/視頻處理演算法工程師,計算機視覺工程師
要求
l
專業:計算機、數學、統計學相關專業;
l
技術領域:機器學習,模式識別
l
技術要求:
(1) 精通DirectX HLSL和OpenGL GLSL等shader語言,熟悉常見圖像處理演算法GPU實現及優化;
(2) 語言:精通C/C++;
(3) 工具:Matlab數學軟體,CUDA運算平台,VTK圖像圖形開源軟體【醫學領域:ITK,醫學圖像處理軟體包】
(4) 熟悉OpenCV/OpenGL/Caffe等常用開源庫;
(5) 有人臉識別,行人檢測,視頻分析,三維建模,動態跟蹤,車識別,目標檢測跟蹤識別經歷的人優先考慮;
(6) 熟悉基於GPU的演算法設計與優化和並行優化經驗者優先;
(7) 【音/視頻領域】熟悉H.264等視頻編解碼標准和FFMPEG,熟悉rtmp等流媒體傳輸協議,熟悉視頻和音頻解碼演算法,研究各種多媒體文件格式,GPU加速;
應用領域:
(1) 互聯網:如美顏app
(2) 醫學領域:如臨床醫學圖像
(3) 汽車領域
(4) 人工智慧
相關術語:
(1) OCR:OCR (Optical Character Recognition,光學字元識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上列印的字元,通過檢測暗、亮的模式確定其形狀,然後用字元識別方法將形狀翻譯成計算機文字的過程
(2) Matlab:商業數學軟體;
(3) CUDA: (Compute Unified Device Architecture),是顯卡廠商NVIDIA推出的運算平台(由ISA和GPU構成)。 CUDA™是一種由NVIDIA推出的通用並行計算架構,該架構使GPU能夠解決復雜的計算問題
(4) OpenCL: OpenCL是一個為異構平台編寫程序的框架,此異構平台可由CPU,GPU或其他類型的處理器組成。
(5) OpenCV:開源計算機視覺庫;OpenGL:開源圖形庫;Caffe:是一個清晰,可讀性高,快速的深度學習框架。
(6) CNN:(深度學習)卷積神經網路(Convolutional Neural Network)CNN主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形。
(7) 開源庫:指的是計算機行業中對所有人開發的代碼庫,所有人均可以使用並改進代碼演算法。
(二)機器學習工程師
包括
機器學習工程師
要求
l
專業:計算機、數學、統計學相關專業;
l
技術領域:人工智慧,機器學習
l
技術要求:
(1) 熟悉Hadoop/Hive以及Map-Rece計算模式,熟悉Spark、Shark等尤佳;
(2) 大數據挖掘;
(3) 高性能、高並發的機器學習、數據挖掘方法及架構的研發;
應用領域:
(1)人工智慧,比如各類模擬、擬人應用,如機器人
(2)醫療用於各類擬合預測
(3)金融高頻交易
(4)互聯網數據挖掘、關聯推薦
(5)無人汽車,無人機
相關術語:
(1) Map-Rece:MapRece是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念"Map(映射)"和"Rece(歸約)",是它們的主要思想,都是從函數式編程語言里借來的,還有從矢量編程語言里借來的特性。
(三)自然語言處理工程師
包括
自然語言處理工程師
要求
l
專業:計算機相關專業;
l
技術領域:文本資料庫
l
技術要求:
(1) 熟悉中文分詞標注、文本分類、語言模型、實體識別、知識圖譜抽取和推理、問答系統設計、深度問答等NLP 相關演算法;
(2) 應用NLP、機器學習等技術解決海量UGC的文本相關性;
(3) 分詞、詞性分析、實體識別、新詞發現、語義關聯等NLP基礎性研究與開發;
(4) 人工智慧,分布式處理Hadoop;
(5) 數據結構和演算法;
應用領域:
口語輸入、書面語輸入
、語言分析和理解、語言生成、口語輸出技術、話語分析與對話、文獻自動處理、多語問題的計算機處理、多模態的計算機處理、信息傳輸與信息存儲 、自然語言處理中的數學方法、語言資源、自然語言處理系統的評測。
相關術語:
(2) NLP:人工智慧的自然語言處理,NLP (Natural Language Processing) 是人工智慧(AI)的一個子領域。NLP涉及領域很多,最令我感興趣的是「中文自動分詞」(Chinese word segmentation):結婚的和尚未結婚的【計算機中卻有可能理解為結婚的「和尚「】
(四)射頻/通信/信號演算法工程師類
包括
3G/4G無線通信演算法工程師, 通信基帶演算法工程師,DSP開發工程師(數字信號處理),射頻通信工程師,信號演算法工程師
要求
l
專業:計算機、通信相關專業;
l
技術領域:2G、3G、4G,BlueTooth(藍牙),WLAN,無線移動通信, 網路通信基帶信號處理
l
技術要求:
(1) 了解2G,3G,4G,BlueTooth,WLAN等無線通信相關知識,熟悉現有的通信系統和標准協議,熟悉常用的無線測試設備;
(2) 信號處理技術,通信演算法;
(3) 熟悉同步、均衡、信道解碼等演算法的基本原理;
(4) 【射頻部分】熟悉射頻前端晶元,扎實的射頻微波理論和測試經驗,熟練使用射頻電路模擬工具(如ADS或MW或Ansoft);熟練使用cadence、altium designer PCB電路設計軟體;
(5) 有扎實的數學基礎,如復變函數、隨機過程、數值計算、矩陣論、離散數學
應用領域:
通信
VR【用於快速傳輸視頻圖像,例如樂客靈境VR公司招募的通信工程師(數據編碼、流數據)】
物聯網,車聯網
導航,軍事,衛星,雷達
相關術語:
(1) 基帶信號:指的是沒有經過調制(進行頻譜搬移和變換)的原始電信號。
(2) 基帶通信(又稱基帶傳輸):指傳輸基帶信號。進行基帶傳輸的系統稱為基帶傳輸系統。傳輸介質的整個信道被一個基帶信號佔用.基帶傳輸不需要數據機,設備化費小,具有速率高和誤碼率低等優點,.適合短距離的數據傳輸,傳輸距離在100米內,在音頻市話、計算機網路通信中被廣泛採用。如從計算機到監視器、列印機等外設的信號就是基帶傳輸的。大多數的區域網使用基帶傳輸,如乙太網、令牌環網。
(3) 射頻:射頻(RF)是Radio Frequency的縮寫,表示可以輻射到空間的電磁頻率(電磁波),頻率范圍從300KHz~300GHz之間(因為其較高的頻率使其具有遠距離傳輸能力)。射頻簡稱RF射頻就是射頻電流,它是一種高頻交流變化電磁波的簡稱。每秒變化小於1000次的交流電稱為低頻電流,大於10000次的稱為高頻電流,而射頻就是這樣一種高頻電流。高頻(大於10K);射頻(300K-300G)是高頻的較高頻段;微波頻段(300M-300G)又是射頻的較高頻段。【有線電視就是用射頻傳輸方式】
(4) DSP:數字信號處理,也指數字信號處理晶元
(五)數據挖掘演算法工程師類
包括
推薦演算法工程師,數據挖掘演算法工程師
要求
l
專業:計算機、通信、應用數學、金融數學、模式識別、人工智慧;
l
技術領域:機器學習,數據挖掘
l
技術要求:
(1) 熟悉常用機器學習和數據挖掘演算法,包括但不限於決策樹、Kmeans、SVM、線性回歸、邏輯回歸以及神經網路等演算法;
(2) 熟練使用SQL、Matlab、Python等工具優先;
(3) 對Hadoop、Spark、Storm等大規模數據存儲與運算平台有實踐經驗【均為分布式計算框架】
(4) 數學基礎要好,如高數,統計學,數據結構
l
加分項:數據挖掘建模大賽;
應用領域
(1) 個性化推薦
(2) 廣告投放
(3) 大數據分析
相關術語
Map-Rece:MapRece是一種編程模型,用於大規模數據集(大於1TB)的並行運算。概念"Map(映射)"和"Rece(歸約)",是它們的主要思想,都是從函數式編程語言里借來的,還有從矢量編程語言里借來的特性。
(六)搜索演算法工程師
要求
l
技術領域:自然語言
l
技術要求:
(1) 數據結構,海量數據處理、高性能計算、大規模分布式系統開發
(2) hadoop、lucene
(3) 精通Lucene/Solr/Elastic Search等技術,並有二次開發經驗
(4) 精通Lucene/Solr/Elastic Search等技術,並有二次開發經驗;
(5) 精通倒排索引、全文檢索、分詞、排序等相關技術;
(6) 熟悉Java,熟悉Spring、MyBatis、Netty等主流框架;
(7) 優秀的資料庫設計和優化能力,精通MySQL資料庫應用 ;
(8) 了解推薦引擎和數據挖掘和機器學習的理論知識,有大型搜索應用的開發經驗者優先。
(七)控制演算法工程師類
包括了雲台控制演算法,飛控控制演算法,機器人控制演算法
要求
l
專業:計算機,電子信息工程,航天航空,自動化
l
技術要求:
(1) 精通自動控制原理(如PID)、現代控制理論,精通組合導航原理,姿態融合演算法,電機驅動,電機驅動
(2) 卡爾曼濾波,熟悉狀態空間分析法對控制系統進行數學模型建模、分析調試;
l
加分項:有電子設計大賽,機器人比賽,robocon等比賽經驗,有硬體設計的基礎;
應用領域
(1)醫療/工業機械設備
(2)工業機器人
(3)機器人
(4)無人機飛控、雲台控制等
(八)導航演算法工程師
要求
l 專業:計算機,電子信息工程,航天航空,自動化
l 技術要求(以公司職位JD為例)
公司一(1)精通慣性導航、激光導航、雷達導航等工作原理;
(2)精通組合導航演算法設計、精通卡爾曼濾波演算法、精通路徑規劃演算法;
(3)具備導航方案設計和實現的工程經驗;
(4)熟悉C/C++語言、熟悉至少一種嵌入式系統開發、熟悉Matlab工具;
公司二(1)熟悉基於視覺信息的SLAM、定位、導航演算法,有1年以上相關的科研或項目經歷;
(2)熟悉慣性導航演算法,熟悉IMU與視覺信息的融合;
應用領域
無人機、機器人等。