导航:首页 > 编程语言 > java实现搜索引擎

java实现搜索引擎

发布时间:2022-09-05 06:46:36

① 哪位朋友知道用java如何实现网络爬虫和搜索引擎的技术,说说原理最好附带代码 十分感谢 好的话可以追加分

heritrix抓取网页
网页解析的有很多就不说了,不过最好自己写
lucene索引

首先爬虫是需要一个处理器链的,网页的抓取并非几十行代码就能实现的,因为有很多问题出
现。
1.获取网页:判断网页编码,计算网页正文位置,获取页面内url(url的过滤、缓存、存储这部分还需要线程池的优化),url的分配、及线程池的启动。
2.网页持久化。网页解析,网页中样式表、图片等下载以及网页的保存(xml和html)网页快照的生成。
3.网页的消重去噪:去掉没用的网页,如果是垂直搜索引擎则需要更多的判断,可以利用内容模板和空间向量的算法实现。
4.索引的建立及优化,主要是简历倒排索引。

你的分类基本上可以用内容模板和空间向量计算实现。

还有其他很多东西,一时间不能说细了。你想做到什么程度。(比如:空间向量的算法及结果的参考值、网页内容模板的建立。)

② 基于java搜索引擎的实现怎么做

获取数据:

while(rs.next()){
String name = rs.getString("name") ;
String pass = rs.getString(1) ; // 此方法比较高效
}

③ 如何用java实现一个十分小型的搜索引擎,需要实现思路和代码,非常感谢!

你想要的是什么,类似网络谷歌的么?

思路是:

  1. 利用爬虫方式获取各个网站的网页内容;

  2. 通过内部的分类机制将每个页面内容抽取关键字,并赋予权重值(网络竞价机制)

  3. 拆分搜索文本成关键字,去匹配关键字以及按照权重排列

④ 如何利用java语言编写一个小型的搜索引擎

一. 创建索引 1.一般创建索引的核心步骤 (1). 创建索引写入对象IndexWriter: IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create); 参数说明:INDEX_STORE_PATH:

⑤ 如何用java实现一个搜索引擎,求代码编程,再点击搜索按钮之后,查找出相关的所有信息,

这个代码,可以做得较复杂,也可以做得较简单,要看你的测试包是什么格式的信息。
不过,在这里贴代码不是很现实,可以参考下,有些自然语言处理和搜索算法的书籍看看,自己能学到非常多的东西。

⑥ Java 实现 搜索引擎

引擎类似于,模糊查找,,,

你知道数据库吧,,就是用模糊查找语句的,

比如你找 网络 关键字

它会到数据把有网络的字。全部提出来

"SELECT id,title,author,content from note where title like ? or author like ? or content like ?";

就像这样的mysql语句,

⑦ java如何实现搜索功能。比如,输入txt就能搜索出这个文件夹内所有txt格式的文件。请给完整代码。

importjava.io.*;
publicclassFileDemo{
publicstaticvoidmain(String[]args)throwsException{
//第一个参数是文件路径,第二个参数是要搜索的文件扩展名
getFile("D:\JavaDemo",".txt");
}
privatestaticvoidgetFile(StringpathName,finalStringendsWith)throwsException{
Filefile=newFile(pathName);
if(!file.exists())
thrownewRuntimeException("文件不存在,你检索个P呀。");
file.listFiles(newFileFilter(){
publicbooleanaccept(Filefile){
if(file.getName().endsWith(endsWith)){
System.out.println(file.getName());
returntrue;
}else
returnfalse;
}
});
}
}

⑧ java如何实现文件搜索功能

java实现文件搜索主要使用file类和正则表达式,如下示例:

packagecom.kiritor.util;

importjava.io.File;
importjava.io.FileFilter;
importjava.util.Arrays;
importjava.util.Collections;
importjava.util.List;

/**
*文件的相关操作类
*
*@authorKiritor
*/
publicclassFileOperation{
;
privatestaticStringfilePath;
privatestaticFile[]fileList=null;//保存文件列表,过滤掉目录

publicFileOperation(){

}

/**构造函数的参数是一个目录*/
publicFileOperation(Stringpath){
Filefile=newFile(path);
if(file.isDirectory())
this.contentPath=path;
else
this.filePath=path;
}
/**获取文件列表*/
publicstaticFile[]getFiles(){
if(contentPath==null){

Filefile=newFile(filePath);
fileList=newFile[1];
fileList[0]=file;
returnfileList;
}
fileList=newFile(contentPath).listFiles(newFileFilter(){

/**使用过滤器过滤掉目录*/
@Override
publicbooleanaccept(Filepathname){
if(pathname.isDirectory())
{
returnfalse;
}else
returntrue;
}
});
returnfileList;
}

/**对当前目录下的所有文件进行排序*/
publicstaticFile[]sort(){
getFiles();
Arrays.sort(fileList,newFileComparator());
returnfileList;
}

publicstaticvoidtree(Filef,intlevel){
StringpreStr="";
for(inti=0;i<level;i++){
preStr+="";
}
File[]childs=f.listFiles();
//返回一个抽象路径名数组,这些路径名表示此抽象路径名表示的目录中的文件。
for(inti=0;i<childs.length;i++){
System.out.println(preStr+childs[i].getName());
if(childs[i].isDirectory()){
tree(childs[i],level+1);
}
}
}

//提供一个"比较器"
.util.Comparator<File>{
@Override
publicintcompare(Fileo1,Fileo2){
//按照文件名的字典顺序进行比较
returno1.getName().compareTo(o2.getName());
}

}
}

⑨ java 搜索引擎

用lucene检索包,很强大。到官网下一个最新版本就可以进行二次开发。
至于中文支持,可以使用流行的中文分词包,建议用用paoding。

⑩ java可以开发搜索引擎吗

有,但不推荐。

如果想尝试一下可以参考 @奇迹降临pan 的答案

理由如下:

  1. 明确你需要的是哪种的。

  2. 数学功底/算法基础(庞大的搜索引擎建立在可靠的算法基础上)

  3. 消耗/功耗

阅读全文

与java实现搜索引擎相关的资料

热点内容
unix网络编程卷4 浏览:805
找靓机app下单什么时候发货 浏览:411
android一个应用两个进程 浏览:801
linux硬盘复制 浏览:806
php图片服务器搭建 浏览:798
下载压缩文件怎么打开 浏览:192
新建文件夹叫什么名字 浏览:565
windows20的开机命令 浏览:332
微信一般在电脑的那个文件夹 浏览:509
go在win7下编译特别慢 浏览:256
光遇ios耳机安卓为什么没有 浏览:904
小米手机桌面文件夹经常自动散开 浏览:607
小米电话手表用什么app进行设置 浏览:265
虚拟打印机pdf下载 浏览:671
jdk编译运行方法 浏览:459
android执行shell命令 浏览:349
程序员头像女 浏览:57
有什么可以变头发颜色的app 浏览:935
玩具解压屋游戏下载 浏览:849
我的世界拔刀剑服务器地址id 浏览:891