導航:首頁 > 編程語言 > java實現搜索引擎

java實現搜索引擎

發布時間:2022-09-05 06:46:36

① 哪位朋友知道用java如何實現網路爬蟲和搜索引擎的技術,說說原理最好附帶代碼 十分感謝 好的話可以追加分

heritrix抓取網頁
網頁解析的有很多就不說了,不過最好自己寫
lucene索引

首先爬蟲是需要一個處理器鏈的,網頁的抓取並非幾十行代碼就能實現的,因為有很多問題出
現。
1.獲取網頁:判斷網頁編碼,計算網頁正文位置,獲取頁面內url(url的過濾、緩存、存儲這部分還需要線程池的優化),url的分配、及線程池的啟動。
2.網頁持久化。網頁解析,網頁中樣式表、圖片等下載以及網頁的保存(xml和html)網頁快照的生成。
3.網頁的消重去噪:去掉沒用的網頁,如果是垂直搜索引擎則需要更多的判斷,可以利用內容模板和空間向量的演算法實現。
4.索引的建立及優化,主要是簡歷倒排索引。

你的分類基本上可以用內容模板和空間向量計算實現。

還有其他很多東西,一時間不能說細了。你想做到什麼程度。(比如:空間向量的演算法及結果的參考值、網頁內容模板的建立。)

② 基於java搜索引擎的實現怎麼做

獲取數據:

while(rs.next()){
String name = rs.getString("name") ;
String pass = rs.getString(1) ; // 此方法比較高效
}

③ 如何用java實現一個十分小型的搜索引擎,需要實現思路和代碼,非常感謝!

你想要的是什麼,類似網路谷歌的么?

思路是:

  1. 利用爬蟲方式獲取各個網站的網頁內容;

  2. 通過內部的分類機制將每個頁面內容抽取關鍵字,並賦予權重值(網路競價機制)

  3. 拆分搜索文本成關鍵字,去匹配關鍵字以及按照權重排列

④ 如何利用java語言編寫一個小型的搜索引擎

一. 創建索引 1.一般創建索引的核心步驟 (1). 創建索引寫入對象IndexWriter: IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create); 參數說明:INDEX_STORE_PATH:

⑤ 如何用java實現一個搜索引擎,求代碼編程,再點擊搜索按鈕之後,查找出相關的所有信息,

這個代碼,可以做得較復雜,也可以做得較簡單,要看你的測試包是什麼格式的信息。
不過,在這里貼代碼不是很現實,可以參考下,有些自然語言處理和搜索演算法的書籍看看,自己能學到非常多的東西。

⑥ Java 實現 搜索引擎

引擎類似於,模糊查找,,,

你知道資料庫吧,,就是用模糊查找語句的,

比如你找 網路 關鍵字

它會到數據把有網路的字。全部提出來

"SELECT id,title,author,content from note where title like ? or author like ? or content like ?";

就像這樣的mysql語句,

⑦ java如何實現搜索功能。比如,輸入txt就能搜索出這個文件夾內所有txt格式的文件。請給完整代碼。

importjava.io.*;
publicclassFileDemo{
publicstaticvoidmain(String[]args)throwsException{
//第一個參數是文件路徑,第二個參數是要搜索的文件擴展名
getFile("D:\JavaDemo",".txt");
}
privatestaticvoidgetFile(StringpathName,finalStringendsWith)throwsException{
Filefile=newFile(pathName);
if(!file.exists())
thrownewRuntimeException("文件不存在,你檢索個P呀。");
file.listFiles(newFileFilter(){
publicbooleanaccept(Filefile){
if(file.getName().endsWith(endsWith)){
System.out.println(file.getName());
returntrue;
}else
returnfalse;
}
});
}
}

⑧ java如何實現文件搜索功能

java實現文件搜索主要使用file類和正則表達式,如下示例:

packagecom.kiritor.util;

importjava.io.File;
importjava.io.FileFilter;
importjava.util.Arrays;
importjava.util.Collections;
importjava.util.List;

/**
*文件的相關操作類
*
*@authorKiritor
*/
publicclassFileOperation{
;
privatestaticStringfilePath;
privatestaticFile[]fileList=null;//保存文件列表,過濾掉目錄

publicFileOperation(){

}

/**構造函數的參數是一個目錄*/
publicFileOperation(Stringpath){
Filefile=newFile(path);
if(file.isDirectory())
this.contentPath=path;
else
this.filePath=path;
}
/**獲取文件列表*/
publicstaticFile[]getFiles(){
if(contentPath==null){

Filefile=newFile(filePath);
fileList=newFile[1];
fileList[0]=file;
returnfileList;
}
fileList=newFile(contentPath).listFiles(newFileFilter(){

/**使用過濾器過濾掉目錄*/
@Override
publicbooleanaccept(Filepathname){
if(pathname.isDirectory())
{
returnfalse;
}else
returntrue;
}
});
returnfileList;
}

/**對當前目錄下的所有文件進行排序*/
publicstaticFile[]sort(){
getFiles();
Arrays.sort(fileList,newFileComparator());
returnfileList;
}

publicstaticvoidtree(Filef,intlevel){
StringpreStr="";
for(inti=0;i<level;i++){
preStr+="";
}
File[]childs=f.listFiles();
//返回一個抽象路徑名數組,這些路徑名表示此抽象路徑名表示的目錄中的文件。
for(inti=0;i<childs.length;i++){
System.out.println(preStr+childs[i].getName());
if(childs[i].isDirectory()){
tree(childs[i],level+1);
}
}
}

//提供一個"比較器"
.util.Comparator<File>{
@Override
publicintcompare(Fileo1,Fileo2){
//按照文件名的字典順序進行比較
returno1.getName().compareTo(o2.getName());
}

}
}

⑨ java 搜索引擎

用lucene檢索包,很強大。到官網下一個最新版本就可以進行二次開發。
至於中文支持,可以使用流行的中文分詞包,建議用用paoding。

⑩ java可以開發搜索引擎嗎

有,但不推薦。

如果想嘗試一下可以參考 @奇跡降臨pan 的答案

理由如下:

  1. 明確你需要的是哪種的。

  2. 數學功底/演算法基礎(龐大的搜索引擎建立在可靠的演算法基礎上)

  3. 消耗/功耗

閱讀全文

與java實現搜索引擎相關的資料

熱點內容
怎樣製作文件夾和圖片 瀏覽:58
調研編譯寫信息 瀏覽:859
python馮諾依曼 瀏覽:417
同時安裝多個app有什麼影響 瀏覽:252
奧術殺戮命令宏 瀏覽:182
用sdes加密明文字母e 瀏覽:359
單片機原理及應用試題 瀏覽:423
易語言開啟指定文件夾 瀏覽:40
馬思純參加密室大逃脫 瀏覽:322
文件夾冬季澆築溫度 瀏覽:712
京東有返點的aPp叫什麼 瀏覽:603
如何查看u點家庭伺服器是幾兆 瀏覽:262
python應用介面怎麼接 瀏覽:67
腐蝕怎麼進不去伺服器啊 瀏覽:359
linuxcpiogz 瀏覽:630
安卓中的布局是什麼文件 瀏覽:397
dex反編譯部分代碼無法查看 瀏覽:464
linuxandroid編譯 瀏覽:603
程序員電視劇20集 瀏覽:910
怎麼擴建文件夾 瀏覽:160