罗刚编著的《解密搜索引擎技术实战》分为相关技术总体介绍部分、爬虫部分、全文检索部分、自然语言处理部分以及相关案例分析。
本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定的参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。
书名 | 解密搜索引擎技术实战(附光盘Lucene & Java精华版) |
分类 | 人文社科-社会科学-社会科学总论 |
作者 | 罗刚 |
出版社 | 电子工业出版社 |
下载 |
![]() |
介绍 |
编辑推荐 罗刚编著的《解密搜索引擎技术实战》分为相关技术总体介绍部分、爬虫部分、全文检索部分、自然语言处理部分以及相关案例分析。 本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定的参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。 内容推荐 罗刚编著的《解密搜索引擎技术实战》是猎兔搜索开发团队的软件研发和教学实践的经验汇总。 《解密搜索引擎技术实战》总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。 《解密搜索引擎技术实战》主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法。在全文检索部分,结合Lucene 3.0介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法。包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。《解密搜索引擎技术实战》还进一步介绍了实现准实时搜索的方法,展示了Solr 1.4版本的用法以及实现分布式搜索服务集群的方法。最后介绍了在地理信息系统领域和户外活动搜索领域的应用。 目录 第1章 搜索引擎总体结构 第2章 网络爬虫的原理与应用 第3章 索引内容提取 第4章 中文分词原理与实现 第5章 让搜索引擎理解自然语言 第6章 Lucene原理与应用 第7章 搜索引擎用户界面 第8章 使用Solr实现企业搜索 第9章 地理信息系统案例分析 第10章 户外活动搜索案例分析 |
随便看 |
|