導航:首頁 > 編程語言 > java開發搜索引擎

java開發搜索引擎

發布時間:2023-03-08 05:20:19

1. java 搜索引擎

用lucene檢索包,很強大。到官網下一個最新版本就可以進行二次開發。
至於中文支持,可以使用流行的中文分詞包,建議用用paoding。

2. 在javaweb開發中怎麼使用外部搜索引擎

你可以在代碼里訪問,然後把結果解析一下再放到頁面上

try{
StringurlStr=
你要搜的東西;
urlStr=URLEncoder.encode(urlStr);//URL有中文需要轉碼
URLurl=newURL(urlStr);
URLConnectionurlConnection=url.openConnection();
BufferedReaderbr=newBufferedReader(newInputStreamReader(urlConnection.getInputStream(),"UTF-8"));
Stringstr=br.readLine();
System.out.println(str);
}catch(Exceptione){
e.printStackTrace();
}

3. 怎麼用java 開發一個搜索引擎呀

一.創建索引

1.一般創建索引的核心步驟

(1).創建索引寫入對象IndexWriter:

IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);

參數說明:INDEX_STORE_PATH:索引文件存放路徑

new StandardAnalyzer():分詞工具

create:此參數為Boolean型,true表示重新創建整個索引,false表示增量式創建索引。

(2).創建文檔模型,並用IndexWriter對象寫入

Document doc = new Document();

Field field1 = new Field(fieldName1, fieldValue ,Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field1);

Field field2 = new Field(fieldName2, fieldValue ,Field.Store.YES, Field.Index.TOKENIZED);

doc.add(field2);

……

indexWriter.addDocument(doc);

indexWriter.close();

參數說明:

Document:負責搜集數據源,它可以從不同的物理文件提取數據並放入同一個Document中或從一個物理文件中提取出不同的數據並放入同一個Document中。

如下圖所示

二.搜索索引

1.lucene搜索的核心步驟:

String[]fields={「title」,「summary」,……};//要查找的field范圍

BooleanClause.Occur[]flags={BooleanClause.Occur.SHOULD, BooleanClause.Occur.MUST ,……};

Queryquery = MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());

Hitshits=newIndexSearcher(INDEX_STORE_PATH).search(query);

for (int i = 0;i < hitsLength ; i++)

{

Document doc = hits.doc(i);

String title = doc.get(「title」);

String summary = doc.get(「summary」);

//搜索出來的結果高亮顯示在頁面上

if (title != null) {

TokenStream tokenStream = analyzer.tokenStream(「title」,new StringReader(title));

String highlighterValue = highlighter.getBestFragment(tokenStream, title) ;

if(highlighterValue != null){

title = highlighterValue ;

}

//log.info("SearchHelper.search.title="+title);

}

if(summary!= null){

TokenStream tokenStream = analyzer.tokenStream(「summary」,new StringReader(summary));

String highlighterValue = highlighter.getBestFragment(tokenStream, creator) ;

if(highlighterValue != null){

summary = highlighterValue ;

}

//log.info("SearchHelper.search. summary ="+ summary);

}

}

2.結合平台構造搜索模塊

PageData類用來存放檢索結果集數據。

PageInfo類用來存放頁面相關信息例如,PageData對象集合、總記錄個數、每一頁的記錄數、總頁面數量等等。

SearchHelper用來充當整個搜索模塊的對外介面。

三.為平台組件添加索引的步驟(以知識中心為例)

1.在com.cscec.oa.searchengine.extend.mole目錄下添加一個新的package

例如:com.cscec.oa.searchengine.extend.mole.resourcestore

2.在新的目錄下建立data package並建立相應的數據類,並使這個數據類繼承BeanData。

例如:

package com.cscec.oa.searchengine.extend.mole.resourcestore.data

public class ResourceStoreBeanData extends BeanData{

}

3.與data package同一級目錄建立manager package並建立相應管理類,並使這個管理類繼承BeanDataManager

例如:

com.cscec.oa.searchengine.extend.mole.resourcestore.manager

public class extends BeanDataManager{

}

4.以管理員的身份登陸OA後,在菜單中找到「索引模塊管理」鏈接,將相應信息添加完成後,便可以在List頁面點擊「創建索引」對該模塊的數據進行索引的建立,建立完成後便可以進行查詢。

4. 有沒有java 開源的簡單搜索引擎

被邀請回答這個問題,但是似乎問錯人了,問的是開源的搜索引擎,但是很抱歉,我對此領域並不熟悉。

我所知道的搜索引擎方案僅有:

1. Nutch (http://nutch.apache.org/)

2. Datapark search http://www.dataparksearch.org/

以下列表不是一個完整的搜索引擎方案,一般都不包括爬蟲,確切的說是IR或者全文檢索引擎更為恰當:
1. Zettair http://www.seg.rmit.e.au/zettair/
2. Indri http://www.lemurproject.org/indri/
3. Terrier http://terrier.org/
4. Galago http://www.galagosearch.org/
5. Zebra https://www.indexdata.com/zebra

6. Lucene 及其變種

5. 用Java如何實現站內搜索

1,使用lucene
2. 使用solr
3. 使用sphinx
4. 低效率使用sql like

6. java可以開發搜索引擎嗎

有,但不推薦。

如果想嘗試一下可以參考 @奇跡降臨pan 的答案

理由如下:

  1. 明確你需要的是哪種的。

  2. 數學功底/演算法基礎(龐大的搜索引擎建立在可靠的演算法基礎上)

  3. 消耗/功耗

閱讀全文

與java開發搜索引擎相關的資料

熱點內容
udp命令字 瀏覽:659
app服務端java源碼 瀏覽:798
電腦用文件夾玩大型游戲 瀏覽:254
安卓耳塞失靈怎麼辦 瀏覽:765
華三交換機保存命令 瀏覽:605
命令方塊怎麼調鍵盤 瀏覽:841
不把密碼存在伺服器上怎麼辦 瀏覽:398
怎麼讓指令方塊的命令消失 瀏覽:543
用單片機做plc 瀏覽:404
雲伺服器進入子目錄命令 瀏覽:795
伺服器機櫃如何配電 瀏覽:578
怎麼刪除iphone資源庫里的app 瀏覽:940
pdf魚 瀏覽:648
單片機pcf8591什麼作用 瀏覽:805
sql命令學院 瀏覽:283
加密軟體在電腦那個盤 瀏覽:988
android獲取外部存儲 瀏覽:573
怎麼查自己家的伺服器地址 瀏覽:858
編程c語言工作好不好 瀏覽:569
單片機焊接地怎麼連接 瀏覽:694