导航:首页 > 程序命令 > linuxperl命令

linuxperl命令

发布时间:2023-03-04 13:51:50

linux下的并行神器——parallel

GNU Parallel的输入源支持文件、命令行和标准输入(stdin或pipe)。

当然,若不想象上面那样进行组合,可使用 --xapply 参数从每一个源获取一个参数(或文件一行),这个参数有些类似R中的函数,具有广播作用——如果其中一个输入源的长度比较短,它的值会被重复。

GNU Parallel可以通过 --arg-sep 和 --arg-file-sep 指定分隔符替代 ::: 或 ::::,当这两个符号被其它命令占用的时候会特别有用。

GNU Parallel默认把一行做为一个参数:使用 \n 做为参数定界符。可以使用 -d 改变:

GNU Parallel支持通过 -E 参数指定一个值做为结束标志:

GNU Parallel使用 --no-run-if-empty 来跳过空行:

如果parallel之后没有给定命令,那么这些参数会被当做命令:

此外,命令还可以是一个脚本文件,一个二进制可执行文件或一个bash的函数(须用 export -f 导出函数)

GNU Parallel支持多种替换字符串,默认使用 {},使用 -I 改变替换字符串符号 {}。其最常见的字符串替换包括以下几种: {.} ,去掉扩展名; {/} ,去掉路径,只保留文件名; {//} ,只保留路径; {/.} ,同时去掉路径和扩展名; {#} ,输出任务编号。同时对于每一个字符串替换都可以自己指定符号: -I 对应 {} ; --extensionreplace 替换 {.} ; --basenamereplace 替换 {/} ; --dirnamereplace 替换 {//} ; --basenameextensionreplace 替换 {/.} ; --seqreplace 替换 {#} 。

同时,如果有多个输入源时,可以通过 {编号} 指定某一个输入源的参数:

使用 --header 把每一行输入中的第一个值做为参数名。

使用 --colsep 把文件中的行切分为列,做为输入参数。

--xargs 会在一行中输入尽可能多的参数(与参数字符串长度有关),通过 -s 可指定一行中参数的上限。

为了获得更好的并发性,GNU Parallel会在文件读取结束后再分发参数。
GNU Parallel 在读取完最后一个参数之后,才开始第二个任务,此时会把所有的参数平均分配到4个任务(如果指定了4个任务)。
第一个任务与上面使用 --xargs 的例子一样,但是第二个任务会被平均的分成4个任务,最终一共5个任务。(奇怪的是我的结果与官网教程的结果不一样)

替换字符串可以是输出字符的一部分,使用 -m 参数表示每个job不重复输出“背景”(context), -X 则与 -m 相反,会重复输出“背景文本”,具体通过下面几个例子进行理解:

使用 -N 限制每行参数的个数,其中 -N0 表示一次只读取一个参数,且不输入这个参数(作为计数器来使用)。

如果命令行中包含特殊字符,就需要使用引号保护起来。
perl脚本 'print "@ARGV\n"' 与linux的 echo 的功能一样。

使用GNU Parallel运行这条命令的时候,perl命令需要用引号包起来,也可以使用 -q 保护perl命令:

使用 --trim 去除参数两头的空格:

使用 --tag 以参数做为输出前缀,使用 --tagstring 修改输出前缀:

--dryrun 作用类似于echo:

--verbose 则在运行之前先打印命令:

一般来说,GNU Parallel 会延迟输出,直到一组命令执行完成。使用 --ungroup ,可立刻打印输出已完成部分。

使用 --ungroup 会很快,但会导致输出错乱,一个任务的行输出可能会被另一个任务的输出截断。像上例所示,第二行输出混合了两个任务: '4-middle' '2-start'。使用 --linebuffer 避免这个问题(稍慢一点):

强制使输出与参数保持顺序 --keep-order/-k :

GNU Parallel可以把每一个任务的输出保存到文件中,临时文件默认保存在 /tmp 中,可以使用 --tmpdir改变(或者修改 $TMPDIR):

输出文件可以有结构的保存 --results ,输出文件不仅包含标准输出(stdout)也会包含标准错误输出(stderr):

在使用多个变量的时候会显示很有用:

使用 --jobs/-j 指定并行任务数。

通过使用 --interactive 在一个任务执行之前让用户决定是否执行。

当job有大量的IO操作时,为避免 “惊群效应” ,可使用 --delay 参数指定各个job开始的时间间隔。

若已知任务超过一定时间未反应则为失败则可以通过 --timeout 指定等待时间避免无谓的等待。GNU parallel能计算所有任务运行时间的中位数,因此可以指定时间为中位数的倍数关系。

GNU parallel有多种方式可用来动态的显示任务进度信息,如:

使用 --joblog 参数能够生成各个任务的日志文件:

通过 --resume-failed 参数可以重新运行失败的任务; --retry-failed 的作用与 --resume-failed 类似,只是 --resume-failed 从命令行读取失败任务,而 --retry-failed 则是从日志文件中读取失败任务:

GNU parallel支持在某一情况下(如第一个失败或成功时,或者20%任务失败时)终止任务,终止任务又有两种类型,其一为立即终止(通过 --halt now 指定),杀死所有正在运行的任务并停止生成新的任务,其二为稍后终止(通过 --halt soon 指定),停止生成新任务并等待正在运行任务完成。

GNU parallel还支持在任务失败后重试运行 --retries :

关于终止信号的高级用法参考 官方入门文档 。

GNU parallel能够在开始一个新的任务前检查系统的负载情况防止过载(通过 --load 可指定负载),同时还能检查系统是否使用了交换空间(swap)(通过 --noswap 限制使用swap)。

同时,对于某些占用内存较多的程序,parallel会检查内存只有内存满足时才启动任务(通过 --memfree 指定需要内存大小),而且在启动任务后内存不够50%时会杀掉最新开始的任务,直到这个任务完成再重新开始那些杀死的任务。

还可以通过 --nice 来指定任务的优先级。

可使用 -S host 来进行远程登陆:
parallel -S username@$SERVER1 echo running on ::: username@$SERVER1

GNU parallel 文件传输使用的是rsync。

更多远程操作参见入门文档。

--pipe 参数使得我们可以将输入(stdin)分为多块(block),然后分配给多个任务多个cpu以达到负载均衡,最后的结果顺序与原始顺序一致。使用 --block 参数可以指定每块的大小,默认为1M。

如果不关心结果顺序,只想要快速的得到结果,可使用 --round-robin 参数。没有这个参数时每块文件都会启动一个命令,使用这个参数后会将这些文件块分配给job数任务(通过 --jobs 进行指定)。若想分配更为均匀还可同时指定 --block 参数。

参考:
官方文档
GNU Parallel指南

❷ linux下怎么运行perl程序

1、perl解释器基本在所有的linux平台上都是自带的,用户可以通过如下命令判断是否有perl解释器:

which perl

2、如果自己的linux系统上没有perl解释器,可以去其官网下载安装。

3、在具备perl解释器的情况下,可以参考如下运行步骤:

1)、用vim编写test.pl,代码如下:

#!/usr/local/bin/perl
print "HellonWorld! ";

2、编写完成后,直接执行如下命令即可:

perl test.perl

3、有时候需要一些权限,自己可以通过su、sudo等命令提示权限。

❸ linux下如何运行可执行文件

1、打开kali linux的终端。创建一个文件并命名为test.c。在终端输入:touch test.c。

❹ linux下 如何用perl脚本给程序传参(argv)

把执行perl脚本的指令放在反引号之间
./test `perl -e 'print "A"x128'`
`这个符号在键盘tab的上边,1的左边
还可以放在$()中
./test $(perl -e 'print "A"x128')
这个test是一个linux命令,最好不要用作程序名

❺ 总结linux替换字符串的几种方法

一)通过vi编辑器来替换。
vi/vim 中可以使用 :s 命令来替换字符串。
:s/well/good/ 替换当前行第一个 well 为 good
:s/well/good/g 替换当前行所有 well 为 good
:n,$s/well/good/ 替换第 n 行开始到最后一行中每一行的第一个 well 为 good
:n,$s/well/good/g 替换第 n 行开始到最后一行中每一行所有 well 为 good
n 为数字,若 n 为 .,表示从当前行开始到最后一行
:%s/well/good/(等同于 :g/well/s//good/) 替换每一行的第一个 well 为 good
:%s/well/good/g(等同于 :g/well/s//good/g) 替换每一行中所有 well 为 good
可以使用 # 作为分隔符,此时中间出现的 / 不会作为分隔符
:s#well/#good/# 替换当前行第一个 well/ 为 good/
:%s#/usr/bin#/bin#g 可以把文件中所有路径/usr/bin换成/bin

(二)直接替换文件中的字符串。(此法不用打开文件即可替换字符串,而且可以批量替换多个文件。)
1.perl命令替换,参数含义如下:
-a 自动分隔模式,用空格分隔$_并保存到@F中。相当于@F = split ”。分隔符可以使用-F参数指定
-F 指定-a的分隔符,可以使用正则表达式
-e 执行指定的脚本。
-i<扩展名> 原地替换文件,并将旧文件用指定的扩展名备份。不指定扩展名则不备份。
-l 对输入内容自动chomp,对输出内容自动添加换行
-n 自动循环,相当于 while(<>) { 脚本; }
-p 自动循环+自动输出,相当于 while(<>) { 脚本; print; }
用法示例:
perl -p -i.bak -e 's/foo/bar/g' *.c
将所有C程序中的foo替换成bar,旧文件备份成.bak

perl -p -i -e "s/shan/hua/g" ./lishan.txt ./lishan.txt.bak
将当前文件夹下lishan.txt和lishan.txt.bak中的“shan”都替换为“hua”

perl -i.bak -pe 's/(d+)/ 1 + $1 /ge' file1 file2
将每个文件中出现的数值都加一

2.sed命令下批量替换文件内容

格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 文件名

-i 表示inplace edit,就地修改文件

-r 表示搜索子目录

-l 表示输出匹配的文件名
s表示替换,d表示删除

示例:sed -i "s/shan/hua/g" lishan.txt

把当前目录下lishan.txt里的shan都替换为hua 各个Linux详细命令介绍及应用可如下进行查找

❻ perl是怎样执行linux命令的

perl中的文件判断 -s file 返回的就是文件大小,单位Byte。你这个可以这么写:

#!/usr/bin/perl
opendir DF,"/home/perl" or die "$!";
for (readdir DF){
next if -d $_; #遇到目录就跳到下一次循环
if (-s $_ > 100000) { #100K
unlink; #相当于shell里的rm
}
}
closedir DF;

我也是才学perl。希望对你有所帮助。

阅读全文

与linuxperl命令相关的资料

热点内容
c启动进程Linux 浏览:115
突破前期高点源码 浏览:596
c语言农历算法 浏览:325
32位单片机语言 浏览:979
安卓全服是什么意思 浏览:147
程序员那么可爱陆漓和姜逸城吻戏 浏览:802
android获取窗口大小 浏览:182
程序员为世界带来的贡献 浏览:216
程序员招聘自荐信 浏览:693
魔兽键位设置命令宏 浏览:647
程序员没有目标了 浏览:830
抢答器c程序编程 浏览:705
什么app可以自己玩 浏览:76
刨客app是什么 浏览:965
cad输入命令栏不见了 浏览:834
做故事集可以用什么app 浏览:692
qq邮箱发送压缩包 浏览:672
程序员桌面机器人 浏览:589
xjr快速开发平台源码 浏览:159
java接口runnable 浏览:31