导航:首页 > 源码编译 > 图书匹配算法

图书匹配算法

发布时间:2023-08-27 04:00:50

⑴ 网络信息检索的图书1

ISBN: 978-7-5606-2378-8
开本: 16开
定价: 32.00元 《网络信息检索》详细介绍了网络信息检索的原理和技术,内容包括信息检索模型、网络信息的自动获取、网络信息预处理和索引、查询语言和查询优化等。针对网络信息检索的广泛应用,书中对搜索引擎、中文和跨语言信息检索、多媒体检索、并行和分布式信息检索、信息分类和聚类、信息提取与自动问答等重要应用的关键技术也进行了深入的探讨。
《网络信息检索》层次分明,深入浅出;既有原理阐述和理论推导,也有大量的实例分析,阐述力求系统性和科学性。《网络信息检索》可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的高年级本科生或研究生的教科书和参考书,对广大从事网络信息检索、数字图书馆、信息管理、人工智能、Web数据挖掘等研究和应用开发的科技人员也有较大的参考价值。 第1章 绪论
1.1 网络信息检索概述
1.1.1 网络信息
1.1.2 信息检索
1.1.3 网络信息检索
1.2 信息检索的发展
1.2.1 手工检索
1.2.2 脱机批处理检索
1.2.3 联机检索
1.2.4 网络信息检索
1.3 网络信息检索的应用
1.3.1 搜索引擎
1.3.2 多媒体信息检索
1.3.3 话题识别与跟踪
1.3.4 信息过滤
1.3.5 问题回答
思考题
参考文献
第2章 信息检索模型
2.1 检索模型定义
2.2布尔模型
2.3 向量模型
2.3.1 索引项权重
2.3.2 相似度量
2.3.3 计算方法
2,4 概率模型
2.5 扩展的布尔模型
2.5.1 模糊集合模型
2.5.2 扩展布尔模型
2.6 扩展的向量模型
2.6.1 广义向量空间模型
2.6.2 潜语义标引模型
2.6.3神经网络模型
2.7 扩展的概率模型
2.7.1 推理网络模型
2.7.2 信任度网络模型
2.7.3 语言模型
2.8 小结
思考题
习题
参考文献
第3章 网络信息的自动搜集
3.1 网络信息的特点
3.1.1 Web的组成
3.1.2 Web的特点
3.2 网络信息搜集的原理
3.2.1 信息搜集的基本流程
3.2.2 遍历策略
3.2.3 页面解析
3.3 网络信息搜集的礼貌原则
3.3.1 机器人排斥协议
3.3.2 机器人元标签
3.4 高性能信息搜集
3.4.1 并行搜集
3.4.2 DNS优化
3.4.3 优先搜集策略
3.4.4 网页更新
3.4.5 网页消重
3.4.6 避免蜘蛛陷阱
3.5 专题信息搜集
3.5.1 网页的主题特性
3.5.2 专题信息搜集算法
3.6 小结
思考题
习题
参考文献
第4章 网页文本处理和索引
4.1 文本的特性
4.1.1 信息熵
4.1.2 统计定律
4.2 网页信息的特征
4.2.1 网页结构
4.2.2 网页类型
4.3 网页去噪
4.3.1 基于网页结构的方法
4.3.2 基于模板的方法
4.4 文本处理
4.4.1 词汇分析
4.4.2 排除停用词
4.4.3 词干提取
4.4.4 索引词选择
4.5 索引
4.5.1 Trie树
4.5.2 后缀树
4.5.3 签名档
4.5.4 倒排文件
4.6 小结
思考题
习题
参考文献
第5章 查询语言与查询处理
5.1 Web查询语言
5.1.1 WebSQL查询语言
5.1.2 W3QL查询语言
5.1.3 WebOQL查询语言
5.2 查询方式
5.2.1 基于关键字的查询
5.2.2 模式匹配
5.3 相关反馈
5.3.1 向量空间模型中的相关反馈
5.3.2 概率模型中的相关反馈
5.4 查询扩展
5.4.1 基于字典的简单查询扩展
5.4.2 自动局部分析
5,4.3 自动全局分析
5.5 小结
思考题
习题
参考文献
第6章 信息检索性能评价
6.1 信息检索评价指标
6.1.1 查全率和查准率
6.1.2 其他评价指标
6.2 信息检索评价基准
6.2.1 基准测试
6.2.2 TREC评测
6.2.3 Web检索评价
6.2.4 CWIRF评测
6.3 小结
思考题
习题
参考文献
第7章 搜索引擎
7.1 概述
7.1.1 发展概况
7.1,2 术语与定义
7.1.3 工作原理
7.2 链接分析
7.2.1 PageRank
7.2.2 HITS
7.2.3 算法比较
7.3 相关排序
7.3.1 Lucene检索模型
7.3.2 Nutch排序算法
7.4 大规模搜索引擎
7.4.1 体系架构
7.4.2数据结构
7.4.3 检索算法
7.4.4 相关排序
7.5 小结
思考题
习题
参考文献
第8章 并行和分布式信息检索
8.1 并行信息检索
8.1.1 并行计算的概念
8.1.2 并行信息检索体系架构
8.1.3 并行编程
8.1.4 数据并行
8.2 分布式信息检索
8.3元搜索引擎
8.3.1 系统架构
8.3.2 资源选择
8.3.3 文档选择
8.3.4 信息融合
8.4 P2P网络信息检索
8.4.1 P2P网络信息检索的原理
8.4.2 非结构化P2P网络信息检索
8.4.3 结构化P2P网络信息检索
8.5 小结
思考题
习题
参考文献
第9章 中文和跨语言信息检索
9.1 中文预处理
9.1.1 中文编码及转换
9.1.2 中文分词
9.2中文信息检索
9.2.1 中文检索模型
9.2.2 中文索引
9.3 跨语言信息检索
9.3.1 基本原理
9.3.2 基于GVSM的跨语言检索
9.3.3 基于LSI的跨语言检索
9,4 小结
思考题
习题
参考文献
第10章 多媒体信息检索
10.1 基于内容的图像信息检索
10.2 图像特征提取
10.2.1 颜色特征
10.2.2 形状特征提取
10.2.3 纹理特征提取
10.3 图像相似量度
10.4 基于内容的视频信息检索
10.4.1 镜头分割
10.4.2 关键帧提取
10.5 基于内容的音频信息检索
10.6 小结
思考题
习题
参考文献
第11章 信息分类与聚类
11.1 基本知识
11.1.1 类的概念
11.1.2 对象特征描述
11.1.3 文档相似性
11.1.4 类间距离
11.2 特征描述及提取
11.2.1 特征提取
11.2.2 特征选择
11.3 聚类方法
11.3.1 划分聚类法
11.3.2 层次聚类法
11.3.3 其他聚类方法
11.4 分类方法
11.4.1 NaiveBayes算法
11.4.2 kNN算法
11.4.3 Rocchio算法
11.4.4 SVM算法
11.5 方法评测
11.5.1 聚类方法评测
11.5.2 分类方法评测
11.5.3 显着性检验
11.6 小结
思考题
习题
参考文献
第12章 Web信息抽取与问答系统
12.1 信息抽取概述
12.1.1 信息抽取的发展
12.1.2 信息抽取的评价指标
12.2 Web信息抽取
12.2.1 基于关键字的Web信息抽取
12.2.2 基于模式的Web信息抽取
12.2.3 基于样本的Web信息抽取
12.3 问答系统
12.3.1 问题分析
12.3.2 信息检索
12.3.3 答案抽取
12.6 小结
思考题
参考文献

⑵ 基于大数据的图书馆个性化服务读者行为分析方法和策略

1. 基于大数据的图书馆个性化服务读者行为分析方法与步骤

基于大数据的图书馆个性化服务读者行为分析,是指图书馆基于事件存储大数据库数据的支持,通过对用户海量数据进行采集、过滤、分析和定义,从中发现读者行为数据中蕴含的行为关系、用户需求和知识,是对读者的行为进行分析、判定、定义和匹配的过程,也是图书馆掌握读者阅读习惯和发现服务需求,提高个性化服务精确性和用户满意度的关键,读者行为分析与判定流程见图2-2。

读者行为分析过程可分为用户行为事件采集、用户行为事件的存储、用户行为事件初步过滤、用户行为定义、用户行为分析与判定、用户行为匹配、用户行为存储大数据库的更新、行为分析与判定过程的完善8部分内容。在用户行为事件分析、判定前,图书馆应全面、规范地采集读者行为数据,并对数据进行科学分类、综合分析、行为定义和人工匹配,构建具备海量存储、高效管理和查询功能的用户行为事件存储大数据库。

当图书馆完成对用户行为数据的采集后,首先,应依据对用户行为的分类和管理员经验,对用户行为数据进行价值过滤和人工筛选,以提高行为数据的价值密度和可用性。其次,对用户行为发生的时间、地点、方式、作用对象和结果进行定义,采用高效算法对存储于用户行为事件大数据库中的资源进行分析、判定,并对用户行为的类型进行详细定义。再次,应将已定义的用户行为和用户行为存储大数据库中的数据进行比对,进一步完善、规范用户行为存储大数据库的资源。同时,利用用户行为存储大数据库资源,对用户行为分析与判定的规则实施反馈,完成对用户行为分析、判定规则的动态修改与完善。最后,图书馆可依据读者行为分析与判定的结果,明确读者阅读需求及其变化趋势,为读者提供个性化的阅读推送式服务。

图2-2 图书馆读者行为分析与判定流程图

个性化服务是一个不断完善的过程,多次经过行为模拟和分析反复校准才能让个性化服务尽可能贴近每一个用户。如通过记录用户访问某些专业内容来判断为用户推荐的相关内容或深度内容是否精准,就需要不断地积累用户在某专业内容上的行为记录,记录次数越多,记录越精细,在下一次为用户做个性化推荐时的精准度就越高。所以个性化服务所需的数据分析系统包括采集与感知都是循环起效的,这是一个闭环上升的垂直优化体系。

2.基于大数据的图书馆个性化服务读者行为分析策略

(1)发现读者需求及变化趋势。大数据背景下,图书馆可通过监控设备、传感器网络和其他读者行为采集设备,获取读者阅读活动的服务内容与方式、阅读终端与服务模式、阅读社会关系组成、成员信息交流、论坛、博客、微博、微信朋友圈等社交网络上的思想表达、移动阅读中读者个体的行为路径、传感器网络对读者活动的记录、服务系统的运行参数信息等数据,这些数据蕴含着巨大的社会和商业价值。因此,图书馆力图采集读者行为大数据,将读者行为进行解析、描述和量化,最终实现对读者服务需求、服务模式变化趋势预测与控制。同时,图书馆应注重读者行为数据分析的时效性,及时获取读者阅读情绪和服务需求的变化数据,并将数据变化结果可视化表现出来,确保服务策略和内容随着读者个性化需求变化而动态调整。

(2)最大范围的采集读者行为数据。科学采集高价值读者行为数据,是准确分析和预测读者需求,提高读者忠诚度和服务满意度的关键。首先,图书馆应从读者服务全局出发,收集读者的行为数据,采集来自服务器运行监控设备、传感器网络、用户阅读终端设备、系统运行日志、读者论坛与博客、读者服务反馈系统、网页cookies、搜索引擎、读者阅读行为监控设备的数据,尽量减少用户行为数据采集的盲点,提高数据的完整性、精确性、及时性和有效性。其次,所采集的数据应具有海量和实时性特点,依据读者阅读需求对读者行为分析的内容,选取数据和应用对象进行调整,避免读者行为分析过程中可能会对读者服务产生的消极影响,最终实现从理解读者阅读行为到掌握读者阅读需求的转变。再次,图书馆应与第三方服务商合作,以服务协作和大数据资源共享的方式,努力拓展读者行为数据采集的广度和深度,在实现以读者为中心的读者行为数据选择、过滤、共享和互补前提下,提高数据应用分析和增强数据的可用性。

(3)保证读者行为数据的安全性和可用性。读者行为数据具有海量、全面、高价值和实时性的特点,图书馆应加强对读者行为数据的安全性和可用性管理,保证用户保密信息和隐私数据的安全。但是,移动终端工作模式和使用环境的不确定性,严重影响了图书馆大数据阅读服务的安全性,因此,必须加强阅读终端的安全性管理。首先,图书馆应依据阅读终端的安全设计标准及其移动性、开放性,以及阅读终端与读者阅读行为的关联性,为不同类型的阅读终端划分相应安全度,并通过严格限制阅读终端的使用对象、安全模式、应用环境和通信方式来保证设备安全。其次,应将读者行为数据划分为用户隐私数据、读者特征数据、行为日志数据和公开数据四个安全等级,执行相应的安全存储、管理和使用策略,并依据用户行为数据生命周期发展规律,加强数据收集、存储、使用、转移和删除五个环节的安全管理。再次,应坚持读者需求精确感知、行为关系全面挖掘、服务模式发展准确预测和读者行为科学分析的原则,实现读者行为数据的良性监控和采集,避免采集与读者阅读服务保障无关的个人隐私行为数据。

(4)重点突出读者阅读行为数据挖掘的知识关联分析。知识关联分析就是从海量数据中发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式,通过读者阅读行为数据的知识关联分析,发现读者不同行为之间的联系,以及读者的阅读习惯和服务需求,是图书馆以读者需求为中心制定服务策略的前提。图书馆应在三维空间开展读者阅读行为数据的交叉关联分析,所涉及的主要内容包括读者阅读活动频率、阅读的时间与地点、阅读内容分布规律、阅读习惯和爱好、阅读关键词关联度、阅读社会关系交集、热点内容的关注度等。同时,行为数据的选择要坚持以服务保障为中心和高价值的原则,特别加强对读者阅读活动的热点内容、主要阅读模式和个性化服务需求反馈行为数据之间的关联分析。此外,基于读者阅读行为数据挖掘的知识关联分析,应加强对读者阅读行为的跟踪和监控,在加强对读者显性行为特征数据监控的同时,还应突出利用显性行为数据挖掘,而获得隐性行为信息。对读者阅读需求、阅读热点、阅读行为关联性等进行关联分析,增强读者行为知识关联分析的广度、深度和有效性。

阅读全文

与图书匹配算法相关的资料

热点内容
路由器多种加密方法 浏览:604
程序员阻止电脑自动弹出定位 浏览:166
如何做服务器服务商 浏览:759
su剖切命令 浏览:726
devc编译背景 浏览:209
学习单片机的意义 浏览:49
音频算法AEC 浏览:911
加密货币容易被盗 浏览:82
苹果平板如何开启隐私单个app 浏览:704
空调压缩机一开就停止 浏览:528
如何下载虎牙app 浏览:847
日语年号的算法 浏览:955
dev里面的编译日志咋调出来 浏览:298
php函数引用返回 浏览:816
文件夹和文件夹的创建 浏览:259
香港加密货币牌照 浏览:838
程序员鼓励自己的代码 浏览:393
计算机网络原理pdf 浏览:752
吃鸡国际体验服为什么服务器繁忙 浏览:94
php中sleep 浏览:491