结合工作方式,试述搜索引擎的分类。
【正确答案】:搜索引擎按其工作方式主要可分为四类:全文搜索引擎、目录索引搜索引擎、元搜索引擎和智能化搜索引擎。
全文搜索引擎是基于全文搜索原理构建而成。它们是以搜索网页文字为主提取各个网站的信息后,建立数据库。典型的全文搜索引擎有百度、Google等。这类引擎可直接或者经过改造后用于公安信息的收集。
目录索引搜索引擎是由专业人员进行网络资源的收薄、按主题加工整理成文的一种按目录分类的网站链接列表,用户按分类目录査找所需的信息。目录索引可应用于数据量相对不大的公安内部搜索网站。
元搜索引擎是一种整合、调用其他独立搜索引擎的引擎。元搜索引擎在接受用户查询请求时,除了自己进行检索外,还会寻求其他帮手帮忙,即同时调用其他多个引擎进行搜索,并将结果返回给用户。所以,元搜索引擎的出现主要是为了提高用户的检索能力,充分发挥其他检索引擎的优势。
智能化搜索引撃是一种具有一定理解力和知识处理能力的搜索引擎,是未来信息检索技术的发展方向。现在的搜索引擎的“智力”水平还比较低,往往存在查不全、查不准、检索质量不高的问题,因此需要不断提高检索引擎的智力。目前的一些做法是利用分词词典、同义词典、同音词典改善检索效果,例如,用户查询“公安”时,同时把与“警察”相关的信息也检索岀来;另外,利用知识描述库、全文索引、上下文分析以及用户相关性反馈等技术,解决歧义信息的检索问题,如“公安”是指公安人员还是指公安机关;“行政管理”究竟是指公共行政管理还是指公安机关内部行政管理,智能化搜索引擎应该能够判断类似的歧义,给出比较准确的检索结果。
进一步提高搜索引擎“智力”的途径是知识挖掘。在网络信息海洋中,如何发现信息之间的关联,提取有用的知识,是对智能化搜索引擎的更高要求。目前,应用于信息检索的知识挖掘仅局限在:从原始文献中自动提取摘要;根据文档内容的相关程度进行按组归并分类(聚类);从内容特征岀发,检索与其相似或相关信息的相似性检索等方面。p48-49
结合工作方式,试述搜索引擎的分类。
- 2024-09-01 00:11:49
- 公安信息学(00372)