導航:首頁 > 文件處理 > perl怎樣遍歷文件夾

perl怎樣遍歷文件夾

發布時間:2024-11-13 07:28:22

『壹』 Perl入門教程

2樓真是的,人家還沒入門,你直接整個文件操作幹嘛?
什麼是Perl?

Perl 是一種最初開發用於文本操作的編程語言。現在它能應用於廣泛的任務,包括系統管理、 web 開發、 網路編程、 GUI 開發和更多的普通用途。

這個語言以實用性為目標(易用、高效、完整)寧願失去美麗(小巧、優雅、迷你)。它使用方便,且支持面向過程和面向對象編程,內置強大的文本處理支持,並有世界上最令人印象深刻的第三方模塊的集中營。
運行Perl程序

在Unix命令行運行Perl程序:

perl progname.pl

另一種方法是,把這個放到你的腳本第一行:

#!/usr/bin/env perl

然後用/path/to/script.pl運行。當然,首先得讓它能執行,你得chmod 755 script.pl(Unix下)。

(這里的第一行假設你有env程序。你也可以直接把你的perl解釋器的路徑直接放到第一行,比如#!/usr/bin/perl)
安全保障

默認情況下,Perl非常隨意。為了使它更強健建議每個程序由下列行開始:

1. #!/usr/bin/perl
2. use strict;
3. use warnings;

附加的兩行從perl中捕獲您的代碼中的各種常見的問題。它們檢查不同的事情,所以你需要兩個都加上。一個潛在的問題通過use strict;捕獲,一旦它捕獲到問題,會馬上讓你的程序停止運行。當然使用use warnings;時,僅僅出現警告(就好像命令行的-w選項)並不會停止程序。
基本語法概述

一個Perl腳本或程序包含一條或多條語句。這些語句只需直接寫在腳本中,而不需要像main()這樣的東西作為程序入口。

Perl語句以分別結束:

print "Hello, world";

以星號(#)開始的語句是注釋:

# This is a comment(這是一條注釋)

空白字元會被Perl忽略:

1. print
2. "Hello, world"
3. ;

……引號里的字元串除外:

1. # this would print with a linebreak in the middle
2. print "Hello
3. world";

字元串使用雙引號或單引號:

1. print "Hello, world";
2. print 'Hello, world';

然而,只有雙引號會「插入」變數值和像換行符(\n)這樣的特殊字元(轉義字元):

1. print "Hello, $name\n"; # works fine
2. print 'Hello, $name\n'; # prints $name\n literally

數字不需要引號:

print 42;

你可以使用或省略括弧來傳遞函數的參數。它們只是在偶爾要改變或明確優先順序的時候必須使用。

1. print("Hello, world\n");
2. print "Hello, world\n";

Perl變數類型

Perl有3種主要的變數類型:標量(scalars)、數組(arrays)和哈希(hashes)。

* 標量(Scalars)

一個標量表示只有一個值:

1. my $animal = "camel";
2. my $answer = 42;

標量的值可以是字元串、整數或浮點數,並且Perl會在需要的時候自動轉換。你不需要預先聲明你的變數類型,但是你需要在第一次使用它們的時候,使用my來聲明它們。(這是use strict;所要求的)

標量可以用不用的方式使用:

1. print $animal;
2. print "The animal is $animal\n";
3. print "The square of $answer is ", $answer * $answer, "\n";

有大量的「魔法」標量的名稱看上去像標點或線路噪音。這些特殊的變數用於各種目的。現在你只要知道其中一個,這就是「默認變數」$_。它被許多Perl的函數用作默認的參數,並且它被隱式設置到某些循環結構中。

print; # prints contents of $_ by default(默認列印$_的內容)

* 數組(Arrays)

數組用於表示一些值的列表:

1. my @animals = ("camel", "llama", "owl");
2. my @numbers = (23, 42, 69);
3. my @mixed = ("camel", 42, 1.23);

特殊變數$#array將返回數組最後一個元素的索引:

print $mixed[$#mixed]; # last element, prints 1.23

你可能想使用$#array + 1來得到這個數組的元素個數。別急,這很容易。在Perl預想找到一個標量值的時候(「在標量上下文」),使用@array會得到數組的元素個數:(譯註:「上下文」是Perl很重要的特性之一,請查閱相關文檔或在無憂Perl搜索相關內容)

if (@animals < 5) { ... } #譯註:當@animals數組的元素個數少於5個的時候

當我們從數組獲得元素值的時候,需要使用$,因為我們只要獲取數組里的一個值;你請求一個標量,然後會獲得一個標量。

從數組里獲取多個值:

(譯註:獲取多個值,使用@,因為我們要獲取數組里的幾個值(列表)。)

1. @animals[0,1]; # gives ("camel", "llama");
2. @animals[0..2]; # gives ("camel", "llama", "owl");
3. @animals[1..$#animals]; # gives all except the first element

這叫「數組切片」。

你可以在列表裡幹些有意義的事情:

1. my @sorted = sort @animals;
2. my @backwards = reverse @numbers;

有兩個特殊的數組,一個是命令行傳到你腳本的參數@ARGV;另一個是傳遞給子程序的參數@_。
* 哈希

哈希用來表示鍵/值對:

1. my %fruit_color = ("apple", "red", "banana", "yellow");

你可以使用空白字元和=>操作符來美化上面的代碼:

1. my %fruit_color = (
2. apple => "red",
3. banana => "yellow",
4. );

獲取哈希元素:

1. $fruit_color{"apple"}; # gives "red"

你可以通過keys()和values()來獲取鍵列表和值列表。

1. my @fruits = keys %fruit_colors;
2. my @colors = values %fruit_colors;

哈希沒有特定的內部排序,然而你可以對鍵進行排序來遍歷它。

和特殊的標量、數組一樣,哈希也有特殊的。我們現在只要知道哈希%ENV包括所有環境變數



更復雜的數據類型可以使用引用來構造,允許你把列表和哈希放到另一個列表和哈希中。

引用是一個標量值,它可以引用任何其它的Perl數據類型。通過把引用存儲為數組或哈希的元素值,你可以輕松創建列表/哈希中的列表/哈希。

以下示例演示了使用匿名哈希引用實現的兩級哈希結構

1. my $variables = {
2. scalar => {
3. description => "single item",
4. sigil => '$',
5. },
6. array => {
7. description => "ordered list of items",
8. sigil => '@',
9. },
10. hash => {
11. description => "key/value pairs",
12. sigil => '%',
13. },
14. };
15.
16. print "Scalars begin with a $variables->{'scalar'}->{'sigil'}\n";

變數作用域

上面所有的例子都使用這種語法:

1. my $var = "value";

實際上,my不是必須的。你可以省略:(譯註:前提是,你沒有使用「use strict;」語句)

1. $var = "value";

但是,上面的用法將創建一個全局變數,這是一個很差的編程實踐。my創建一個詞法作用域變數,這個變數只在定義它們的語句塊中可見(比如一段包在大括弧里的語句)。

1. my $x = "foo";
2. my $some_condition = 1;
3. if ($some_condition) {
4. my $y = "bar";
5. print $x; # prints "foo"
6. print $y; # prints "bar"
7. }
8. print $x; # prints "foo"
9. print $y; # prints nothing; $y has fallen out of scope

結合使用my和在Perl腳本開頭使用use strict,解釋器將捕獲常見的編程錯誤。比如,在上面的例子中,最後的print $y將引發一個編譯時錯誤並阻止程序運行。強烈建議使用use strict語句!
條件和循環語句

Perl有許多常用的條件和循環語句。Perl 5.10甚至提供了分支語句(拼作given/when)。

條件可以是任何Perl表達式。比較和布爾條件語句中常用的邏輯運算符,請參閱有關信息的下一節中的運算符的列表。

* if

1. if ( condition ) {
2. ...
3. } elsif ( other condition ) {
4. ...
5. } else {
6. ...
7. }

還有否定版本的:

1. unless ( condition ) {
2. ...
3. }

這個否定版比if (!condition)更易讀。

注意,大括弧是必須的,即使代碼塊中只有一行。不過,這里有一個方法可以讓你通過類似英語的語法來實現單行條件語句:

1. # the traditional way
2. if ($zippy) {
3. print "Yow!";
4. }
5.
6. # the Perlish post-condition way
7. print "Yow!" if $zippy;
8. print "We have no bananas" unless $bananas;

* while

1. while ( condition ) {
2. ...
3. }

為了和unless同樣的理由,也有一個否定版本:

1. until ( condition ) {
2. ...
3. }

你也可以在後置條件里使用while:

print "LA LA LA\n" while 1; # loops forever

* for

跟C語言一樣:

1. for ($i = 0; $i <= $max; $i++) {
2. ...
3. }

自然Perl提供了更友好的列表遍歷循環foreach以後,C語言風格的for循環在Perl幾乎不需要了。
* foreach

1. foreach (@array) {
2. print "This element is $_\n";
3. }
4.
5. print $list[$_] foreach 0 .. $max;
6.
7. # you don't have to use the default $_ either...
8. foreach my $key (keys %hash) {
9. print "The value of $key is $hash{$key}\n";
10. }

內置操作符和函數

Perl 附帶了各種各樣的內置函數。我們已經看到的幾個,包括print,sort和reverse。

Perl常見操作符(運算符)

* 算術

1. + 加法
2. - 減法
3. * 乘法
4. / 除法

* 數字比較

1. == 等於
2. != 不等於
3. < 小於
4. > 大於
5. <= 小於等於
6. >= 大於等於

* 字元串比較

1. eq 等於
2. ne 不等於
3. lt 小於
4. gt 大於
5. le 小於等於
6. ge 大於等於

(為什麼數字和字元串的比較運算符不同?因為我們沒有不同的變數類型,並且Perl需要知道是以數字進行排序(99小於100)還是以字母進行排序(100在99前面))
* 邏輯

1. && and 和
2. || or 或
3. ! not 否

* 混合

1. = 賦值
2. . 字元串連接
3. x 字元串乘法
4. .. 范圍 (建立一個列表)

一些操作符可以和=結合,像這樣:

1. $a += 1; # same as $a = $a + 1
2. $a -= 1; # same as $a = $a - 1
3. $a .= "\n"; # same as $a = $a . "\n";

文件和I/O

你可以使用open()函數來打開一個文件,用於輸入或輸出:

1. open(my $in, "<", "input.txt") or die "Can't open input.txt: $!";
2. open(my $out, ">", "output.txt") or die "Can't open output.txt: $!";
3. open(my $log, ">>", "my.log") or die "Can't open my.log: $!";

你可以使用<>操作符從打開的文件句柄中讀數據。在標量上下文中,它從文件句柄中讀取一行;在列表上下文中,它讀取整個文件,並將每一行作為列表的元素。

1. my $line = <$in>;
2. my @lines = <$in>;

一次性把整個文件讀完,叫做「啜食(slurping)」。它能讓人滿意,但它可能是內存吞噬者。大多數文本文件處理可以通過Perl的循環結構,一行一行地完成。

<>操作符經常出現在while循環里:

1. while (<$in>) { # assigns each line in turn to $_
2. print "Just read in this line: $_";
3. }

我們已經看到了如何使用print()在標准輸出里列印。但是,print()還能通過第一個可選參數指定一個文件句柄來列印(譯註:將內容輸出到指定的文件句柄中,即寫入到文件句柄相關聯的文件中)

1. print STDERR "This is your final warning.\n";
2. print $out $record;
3. print $log $logmessage;

當你完成了對文件句柄的操作之後,你應該使用close()來關閉文件句柄。(老實說,如果你忘記關閉了,Perl會幫你處理。)

close $in or die "$in: $!";

正則表達式

Perl對正則表達式的支持寬廣而深入:

* 簡單匹配

1. if (/foo/) { ... } # true if $_ contains "foo"
2. if ($a =~ /foo/) { ... } # true if $a contains "foo"

//匹配操作符(譯注,完整的應該是:m//)默認操作$_,或者使用=~來綁定其它變數進行操作。
* 簡單置換

1. s/foo/bar/; # replaces foo with bar in $_
2. $a =~ s/foo/bar/; # replaces foo with bar in $a
3. $a =~ s/foo/bar/g; # replaces ALL INSTANCES of foo with bar in $a

* 更復雜的正則表達式

你不僅能匹配固定的字元串。其實,你可以匹配任何你能想到的復雜正則表達式。

1. . 單個任意字元(默認不包含\n)
2. \s 一個空白字元 (空格, tab, 換行, ...)
3. \S 一個非空白字元
4. \d 一個數字 (0-9)
5. \D 一個非數字
6. \w 一個能組成單詞的字元 (a-z, A-Z, 0-9, _)
7. \W 一個不能組成單詞的字元
8. [aeiou] 匹配中括弧內的任意一個字元
9. [^aeiou] 匹配除了中括弧內列出的字元之外的任意一個字元
10. (foo|bar|baz) 匹配foo或bar或baz
11.
12. ^ 匹配開頭
13. $ 匹配結尾

量詞可用來指定數量:

1. * 零個或任意多個
2. + 至少一個
3. ? 零個或一個
4. {3} 3個
5. {3,6} 3到6個
6. {3,} 至少3個

一些簡單的例子:

1. /^\d+/ 以一個或多個數字開頭
2. /^$/ 空的,沒有任何東西
3. /(\d\s){3}/ 3個帶空白字元的數字
4. (比如 "3 4 5 ")
5. /(a.)+/ 匹配最少一次,含有a和任意字元
6. (比如 "abacadaf")
7.
8. # 從STDIN循環讀入,並列印出非空白行:
9. while (<>) {
10. next if /^$/;
11. print;
12. }

* 圓括弧捕捉

括弧的另一個用法是分組。它可以用來捕捉最後使用的正則表達式匹配的結果。這些結果用$1、$2……表示。

1. # a cheap and nasty way to break an email address up into parts
2.
3. if ($email =~ /([^@]+)@(.+)/) {
4. print "Username is $1\n";
5. print "Hostname is $2\n";
6. }

子程序

寫一個子程序是很容易的:

1. sub logger {
2. my $logmessage = shift;
3. open my $logfile, ">>", "my.log" or die "Could not open my.log: $!";
4. print $logfile $logmessage;
5. }

現在我們可以像使用其它內置函數一樣,使用該子程序了:

1. logger("We have a logger subroutine!");

什麼是shift?傳遞給子程序的參數保存在@_數組中。shift函數的默認參數是@_。所以my $logmessage = shift;去掉第一個參數,並將其賦值給$logmessage。

可以通過別的方法操作@_:

1. my ($logmessage, $priority) = @_; # common(通用)
2. my $logmessage = $_[0]; # uncommon, and ugly(不通過,並且很醜陋)

子程序可以返回值:

# sub square {
# my $num = shift;
# my $result = $num * $num;
# return $result;
# }

然後像這樣使用它:

1. $sq = square(8);

Perl面向對象

Perl面向對象相對比較簡單,這是實現使用引用什麼樣的對象知道自己是在Perl的概念為基礎的封裝。

剛開始進行Perl編程,你最常使用的Perl面向對象將是使用第三方模塊,參見下文。
使用Perl模塊

Perl 模塊提供了一系列的功能,可幫助您避免重復勞動,它們可以通過CPAN(www.cpan.org)下載。許多流行的模塊都已經包含在了Perl發行包中。

本文由無憂Perl(www.51perl.com)翻譯,轉載請註明本文鏈接:www.51perl.com/perl-brief-introction/

水平有限,錯誤難免,歡迎指正,並以原文為准。原文地址:http://perldoc.perl.org/perlintro.html

希望對你有用

閱讀全文

與perl怎樣遍歷文件夾相關的資料

熱點內容
一個演算法效率可以分為 瀏覽:600
64腳pic單片機 瀏覽:219
nba2k17壓縮包 瀏覽:868
取快遞為什麼有加密號碼 瀏覽:288
伺服器太多人登錄怎麼引導 瀏覽:594
歸整演算法 瀏覽:981
長沙應屆生找工作用什麼app 瀏覽:605
貨車空調壓縮機根部線斷了能修嗎 瀏覽:156
提示文件夾正在使用怎麼關 瀏覽:526
老人單片機編程 瀏覽:63
計算機視覺處理的基本演算法 瀏覽:786
東芝64位單片機 瀏覽:773
新松編程 瀏覽:548
快手app大屏下線通知什麼意思 瀏覽:843
移動政務伺服器地址是多少 瀏覽:644
ios打包編譯命令 瀏覽:906
幸福演算法師 瀏覽:586
照片壓縮包格式zip 瀏覽:393
oa伺服器如何設置台式機 瀏覽:658
51單片機4個並口功能 瀏覽:948