hdfs命令_如何在linux脚本中执行hdfs命令

‘壹’ 如何进入hdfs模式使用hadoop distcp命令

hadoop有提供相应的脚本去验证文件目录是否存在的：-bash-3.2$hadoopfs-help-test-[defsz]:Answervariousquestionsabout,withresultviaexitstatus.-dreturn0ifisadirectory.-ereturn0ifexists.-freturn0ifisafile.-.-.else,return1.

‘贰’ hadoop中在HDFS中创建一个input目录，然后hadoop fs -ls命令

你创建input目录的时候是不是也用了sudo命令？这样的话就是使用了root用户来创建了input，所以生成的是user/root/input，而不是用了hadoop这个用户创的目录，所以没有生成/user/hadoop/input。hadoop的指令都不需要用sudo来使用root权限啊，

‘叁’ 怎么用命令行删除hdfs上的文件

命令：hadoop fs -rmr /home/mm/lily2(要求是你把hadoop的bin加到PATH中，并开启hadoop)

rm -rf /home/mm/lily2（这是删除linux文件系统的文件夹）。
删除目录
rd /s /q "c:\hello"
rem 加引号可以防止因路径中有空格而出错
rem 上面的代码意为：删除c:\hello目录下所有的内容(包括"c:\hello")
删除文件
del /f /q /s "c:\hello\*.*"
rem 删除c;\hello文件夹下所有的文件，包括子文件夹的内容，（不包括子文件夹，也不包括c:\hello文件夹）
rem 文件夹=目录

‘肆’ 如何用命令取hdfs-site.xml的值

<configuration>
<property>
<name>dfs.cluster.administrators</name>
<value> hdfs</value>

</property>
<property>
<name>dfs.block.access.token.enable</name>
<value>true</value>

</property>
<property>
<name>dfs.datanode.failed.volumes.tolerated</name>
<value>0</value>

</property>
<property>
<name>dfs.replication.max</name>
<value>50</value>

</property>
<property>
<name>dfs.datanode..reserved</name>
<value>1073741824</value>

</property>
<property>
<name>dfs.blockreport.initialDelay</name>
<value>120</value>

</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///data/hadoop/hdfs/dn</value>

</property>
<property>
<name>dfs.client.read.shortcircuit</name>
<value>true</value>
</property>
<property>
<name>dfs.datanode.max.transfer.threads</name>
<value>4096</value>

</property>
<property>
<name>dfs.namenode.http-address</name>
<value>hadoop01:50070</value>

</property>
<property>
<name>dfs.client.read.shortcircuit.streams.cache.size</name>
<value>4096</value>

</property>
<property>
<name>dfs.namenode.avoid.write.stale.datanode</name>
<value>true</value>

</property>
<property>
<name>dfs.namenode.avoid.read.stale.datanode</name>
<value>true</value>
</property>
<property>
<name>dfs.namenode.stale.datanode.interval</name>
<value>30000</value>


</property>
<property>
<name>dfs.permissions.enabled</name>
<value>true</value>

</property>
<property>
<name>dfs.datanode.ipc.address</name>
<value>0.0.0.0:8010</value>

</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///data/hadoop/hdfs/nn</value>

</property>
<property>
<name>dfs.journalnode.http-address</name>
<value>0.0.0.0:8480</value>

</property>
<property>
<name>dfs.heartbeat.interval</name>
<value>3</value>

</property>
<property>
<name>dfs.datanode.data.dir.perm</name>
<value>750</value>

</property>
<property>
<name>fs.permissions.umask-mode</name>
<value>022</value>

</property>
<property>
<name>dfs.datanode.balance.bandwidthPerSec</name>
<value>6250000</value>

</property>
<property>
<name>dfs.namenode.accesstime.precision</name>
<value>0</value>

</property>
<property>
<name>dfs.namenode.write.stale.datanode.ratio</name>
<value>1.0f</value>

</property>
<property>
<name>dfs.namenode.checkpoint.dir</name>
<value>file:///data/hadoop/hdfs/snn</value>

</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/grid/0/hdfs/journal</value>
</property>
<property>
<name>dfs.blocksize</name>
<value>134217728</value>

</property>
<property>
<name>dfs.replication</name>
<value>3</value>

</property>
<property>
<name>dfs.block.local-path-access.user</name>
<value>hbase</value>
</property>
<property>
<name>dfs.datanode.address</name>
<value>0.0.0.0:50010</value>

</property>
<property>
<name>dfs.datanode.http.address</name>
<value>0.0.0.0:50075</value>

</property>
<property>
<name>dfs.https.namenode.https-address</name>
<value>c6401.ambari.apache.org:50470</value>

</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>

</property>
<property>
<name>dfs.namenode.handler.count</name>
<value>100</value>

</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop02:50090</value>

</property>
<property>
<name>dfs.permissions.superusergroup</name>
<value>hdfs</value>
</property>
<property>
<name>dfs.namenode.safemode.threshold-pct</name>
<value>1.0f</value>
</property>
<property>
<name>dfs.domain.socket.path</name>
<value>/var/lib/hadoop-hdfs/dn_socket</value>
</property>
</configuration>

‘伍’ 何时使用hadoop fs，hadoop dfs与hdfs dfs命令

hadoop hdfs dfs基本操作
本文主要参考：
http://hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/FileSystemShell.html

根据上面官方文档的提示我们能够知道可以通过shell的方式访问hdfs中的数据，对数据进行操作。那么首先让我们看一下hdfs的版本，使用命令hdfs version。
好，下面上货：
1、查询
使用命令：
hdfs dfs -ls / 这条执行会列出/目录下的文件和目录
hdfs dfs -ls -R /这条会列出/目录下的左右文件，由于有-R参数，会在文件夹和子文件夹下执行ls操作。
2、添加文件夹
使用命令；
hdfs dfs -mkdir -p /xytest/testdata001/
这里需要注意的是，root用户是否拥有hdfs 的权限，如果有，我们可以继续操作，如果没有，我们可以直接使用hdfs用户，默认安装完cdh后，用户hdfs拥有所有的权限。如果对于权限有不明白的，推荐看一下我的另一篇文章：
http://blog.csdn.net/wild46cat/article/details/69664376

3、增加文件
使用命令：
hdfs dfs -FromLocal ~/123.txt /xytest/testdata001/
4、查看hdfs文件中的内容
使用命令：
hdfs dfs -cat /xytest/testdata001/123.txt
或者，可以把hdfs中的文件到本地
使用命令：
hdfs dfs -ToLocal /xytest/testdata001/123.txt ~/222.txt
5、删除文件
使用命令：
hdfs dfs -rm -f /xytest/testdata001/123.txt
6、删除文件夹
使用命令：
hdfs dfs -rm -r /xytest/testdata001

‘陆’ hadoop常用shell命令怎么用

一、常用的hadoop命令
1、hadoop的fs命令
#查看hadoop所有的fs命令

1

hadoop fs

#上传文件（put与FromLocal都是上传命令）

1
2

hadoop fs -put jdk-7u55-linux-i586.tar.gz hdfs://hucc01:9000/jdk
hadoop fs -FromLocal jdk-7u55-linux-i586.tar.gz hdfs://hucc01:9000/jdk

#下载命令(get与ToLocal都是下载命令)

1
2

hadoop fs -get hdfs://hucc01:9000/jdk jdk1.7
hadoop fs -ToLocal hdfs://hucc01:9000/jdk jdk1.7

#将本地一个或者多个文件追加到hdfs文件中（appendToFile）

1

hadoop fs -appendToFile install.log /words

#查询hdfs的所有文件（ls）

1

hadoop fs -ls /

#帮助命令（help）

1

hadoop fs -help fs

#查看hdfs文件的内容（cat和text）

1
2

hadoop fs -cat /words
hadoop fs -text /words

#删除hdfs文件(rm)

1

hadoop fs -rm -r /words

#统计hdfs文件和文件夹的数量（count）

1

hadoop fs -count -r /

#合并hdfs某个文件夹的文件，并且下载到本地（getmerge）

1

hadoop fs -getmerge / merge

#将本地文件剪切到hdfs，相当于对本地文件上传后再删除（moveFormLocal）

1

hadoop fs -moveFromLocal words /

#查看当前文件系统的使用状态（df）

1

hadoop fs -df

二、常用的hdfs命令（这个用的比较多）
用法跟hadoop命令一样，推荐2.0之后使用hdfs命令

1

hdfs dfs

‘柒’ hadoop操作命令记录在哪

Hadoop自身是否有记录不清楚，但Hadoop是部署在linux上的，可以通过linux的历史命令查看。
1、history
2、fc -l
可以用grep过滤，例如：
history | grep 'hadoop'
或history | grep 'hdfs'

‘捌’ 与HDFS命令交互时如何指定文件和目录确切位

在集群模式下，如果与集群的HDFS交互时，必须指定URI中的scheme、authority、path，三个配置均不能省略。我们可以查看主节点的etc/hadoop/core-site.xml配置文件，查看fs.defaultFS属性

<property><name>fs.defaultFS</name><value>hdfs://hadoop-master-vm:9000</value></property>

同样以Hadoop的cat命令为例来显示example.txt文件内容：hadoop fs -cat hdfs://hadoop-master-vm:9000/user/hadoop/example.txt

‘玖’ 如何在linux脚本中执行hdfs命令

首先脚本需要有执行权限
chmod u+x file.sh
执行脚本有三种方法：
1. ./file.sh
特点：开启bash子进程来执行，也就是开启额外的进程来进行，不影响原进程的变量、配置等
2. bash file.sh
特点：和./file.sh相同
3. source file.sh 或者 . file.sh
特点：在原bash进程中执行脚本。

第三种方法主要用于在脚本中切换用户su、切换目录cd等命令。
source 和 . 命令是相同的。
你可以搜索 source

‘拾’ hadoop中命令经常含有-fs，-dfs，fs和dfs有什么区别作用是什么

You can see definitions of the two commands (hadoop fs & hadoop dfs) in
可以看一下hadoop的源代码

$HADOOP_HOME/bin/hadoop
...elif [ "$COMMAND" = "datanode" ] ; then CLASS='org.apache.hadoop.hdfs.server.datanode.DataNode' HADOOP_OPTS="$HADOOP_OPTS $HADOOP_DATANODE_OPTS"elif [ "$COMMAND" = "fs" ] ; then CLASS=org.apache.hadoop.fs.FsShell HADOOP_OPTS="$HADOOP_OPTS $HADOOP_CLIENT_OPTS"elif [ "$COMMAND" = "dfs" ] ; then CLASS=org.apache.hadoop.fs.FsShell HADOOP_OPTS="$HADOOP_OPTS $HADOOP_CLIENT_OPTS"elif [ "$COMMAND" = "dfsadmin" ] ; then CLASS=org.apache.hadoop.hdfs.tools.DFSAdmin HADOOP_OPTS="$HADOOP_OPTS $HADOOP_CLIENT_OPTS"...
So, they are exactly the same.
所以，发现两者是完全一样的功能。

谢谢

导航:首页 > 程序命令 > hdfs命令

hdfs命令

与hdfs命令相关的资料