java上傳文件hadoop_關於用java寫程序把本地文件上傳到HDFS中的問題

1. 如何用java程序把本地文件拷貝到hdfs上並顯示進度

把程序打成jar包放到Linux上

轉到目錄下執行命令 hadoop jar maprecer.jar /home/clq/export/java/count.jar hdfs://ubuntu:9000/out06/count/

上面一個是本地文件，一個是上傳hdfs位置

成功後出現：列印出來，你所要列印的字元。

package com.clq.hdfs;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URI;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.util.Progressable;

public class FileCopyWithProgress {
//********************************
//把本地的一個文件拷貝到hdfs上
//********************************
public static void main(String[] args) throws IOException {
String localSrc = args[0];
String dst = args[1];
InputStream in = new BufferedInputStream(new FileInputStream(localSrc));
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(dst), conf);
FSDataOutputStream out = fs.create(new Path(dst), new Progressable() {
@Override
public void progress() {
System.out.print(".");
}
});
IOUtils.Bytes(in, out, conf, true);
}

}
可能出現異常：

Exception in thread "main" org.apache.hadoop.ipc.RemoteException: java.io.IOException: Cannot create /out06; already exists as a directory

at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.startFileInternal(FSNamesystem.java:1569)

at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.startFile(FSNamesystem.java:1527)

at org.apache.hadoop.hdfs.server.namenode.NameNode.create(NameNode.java:710)

at org.apache.hadoop.hdfs.server.namenode.NameNode.create(NameNode.java:689)

at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)

at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

at java.lang.reflect.Method.invoke(Method.java:606)

at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:587)

at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1432)

at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1428)

at java.security.AccessController.doPrivileged(Native Method)

at javax.security.auth.Subject.doAs(Subject.java:415)

說明你這個路徑在hdfs上已經存在，換一個即可。

2. 利用JAVA+API向HDFS文件系統上的文件寫入數據一共有哪三種方法,請敘述該三種

摘要一.構建環境

3. java開發中什麼樣的項目會用到Hadoop

java項目一般是不會用到hadoop的，除非涉及到處理大數據方面的業務。hadoop是用java實現的。主要原因如下：
1. java比較適合做大型復雜系統
2. Doug Cutting本身從事java方面的研究，主要是lucence，開源檢索架構說來也是這樣的。
3. java開源，活躍程度最高，這樣搞出來放在apache上有利於交流、改進
Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。
用戶可以在不了解分布式底層細節的情況下，開發分布式程序。充分利用集群的威力進行高速運算和存儲。
Hadoop實現了一個分布式文件系統（Hadoop Distributed File System），簡稱HDFS。HDFS有高容錯性的特點，並且設計用來部署在低廉的（low-cost）硬體上；而且它提供高吞吐量（high throughput）來訪問應用程序的數據，適合那些有著超大數據集（large data set）的應用程序。HDFS放寬了（relax）POSIX的要求，可以以流的形式訪問（streaming access）文件系統中的數據。
Hadoop的框架最核心的設計就是：HDFS和MapRece。HDFS為海量的數據提供了存儲，則MapRece為海量的數據提供了計算。

4. 關於用java寫程序把本地文件上傳到HDFS中的問題

將這FileSystem hdfs = FileSystem.get(config);
改成FileSystem hdfs = FileSystem.get(URI.create("hdfs://master:9000"),config)
上面那句取得的是本地文件系統對象，改成下面這個才是取得hdfs文件系統對象，當你要操作本地文件對象的時候就要用上面那句取得本地文件對象，我在2.7.4剛開始也是跟你一樣的錯誤，改為下面的就可以了

5. 剛學習spark,想上傳文件給hdfs，是不是需要hadoop然後java編程這樣是用eclip

spark會把hdfs當做一個數據源來處理, 所以數據存儲都要做, 之後編程是從Hadoop改成spark就可以了. 是否用eclipse無所謂, 只要能編譯運行就可以

熱點內容

erp是什麼伺服器發布：2025-04-30 14:13:04 瀏覽：182

python中tmp 發布：2025-04-30 14:08:20 瀏覽：19

說明wpf加密過程發布：2025-04-30 13:34:12 瀏覽：142

java讀取list 發布：2025-04-30 13:22:24 瀏覽：702

iis7gzip壓縮發布：2025-04-30 13:12:40 瀏覽：39

有什麼安卓機打吃雞好發布：2025-04-30 13:12:34 瀏覽：597

三星u盤加密狗發布：2025-04-30 13:08:26 瀏覽：473

php函數的返回值嗎發布：2025-04-30 13:07:13 瀏覽：586

國企穩定程序員發布：2025-04-30 13:06:58 瀏覽：328

編程貓如何使用教程視頻發布：2025-04-30 13:06:19 瀏覽：218

安卓遠端網頁如何打日誌發布：2025-04-30 13:05:22 瀏覽：218

壓縮flash大小發布：2025-04-30 12:56:11 瀏覽：993

解壓的玩具教程可愛版發布：2025-04-30 12:39:30 瀏覽：366

哪個求職app比較靠譜發布：2025-04-30 12:35:22 瀏覽：888

java的讀法發布：2025-04-30 12:01:32 瀏覽：59

nod32區域網伺服器地址發布：2025-04-30 12:01:31 瀏覽：1003

數碼科技解壓發布：2025-04-30 12:01:29 瀏覽：236

新網的雲伺服器管理界面復雜嗎發布：2025-04-30 12:00:41 瀏覽：367

無人聲解壓強迫症視頻發布：2025-04-30 11:55:29 瀏覽：573

計算機編譯運行發布：2025-04-30 11:47:44 瀏覽：640

導航:首頁 > 編程語言 > java上傳文件hadoop

java上傳文件hadoop

與java上傳文件hadoop相關的資料