- 信息源的分类(按信息载体):
- 传统的图书馆
- 单馆的书目服务系统
- 联合目录及馆际互借
- 学科导航库
- 现代数字图书馆 中国高等教育数字图书馆
- 二次信息库:包括有书目、文摘、引文数据库;
- 全文数据库:中国知网
- 数据和事实数据库:包括有统计、财务、科技、化学反应数据库;
- 多媒体数据库
- Internet
- Web信息资源的特性
- 少量规模;
- 分散无序;
- 动态更新,不稳定;
- 种类或形式多种多样;
- 非结构化或半结构化;
- 主义冗余、质量缺乏控制;
- 需求和使用方式个性化;
- 网络信息检索工具分类
- 字典型工具:用于查询网上用户名、E-mail、URL、服务器地址等;
- 索引型查询工具;
- FTP资源的索引Archie
- Gopher资源的索引Verronica,Jughead
- 网上服务器的索引Wais
- 交互式查询工具
- Gohper类
- WWW类(大多数WWW检索工具也可检索FTP、Gopher等信息)
- 按内容或数据收录的范围分:
- 综合类搜索引擎:google 百度
- 专业类搜索引擎:提供诸如地衅、博客、音乐、图像等专业内容搜索的引擎;Business
- 按信息的组织方式或检索方式分:
- 索引式搜索引擎:google 百度
- 目录式搜索引擎:Yahoo Galaxy go.com goguides
- 元搜索引擎:万纬
MetaCrawler Mamma Search Dogpile ixquick fefoo limmz
终端元搜索引擎软件:WebFerret 飓风
- 计算机检索技术
- 布尔逻辑检索
- 截词检索(truncation searching)用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符的资料,都为命中的资料;截词是指用符号代替变化的部分。如“system?"、"comput?"、"wom?n"、"?ology";
- 字段限定检索(limit searching):限定在数据库记录中的一个或几个字段范围内查找检索词;
- 词位置检索:指限定检索词之间的位置关系;(proximate searching)
- 聚类检索:首先要把将全部资料按相似度进行聚类归档,检索时直接在类目内匹配;
- 相关反馈与提问式扩展技术:指系统对检索词进行适当的修正后再进行检索;
- 可视化检索技术:对检索词构造、检索过程、检索结果都可考虑可视化;
- 文本信息处理自动化技术
- 文本聚类:根据文本文档的内容相关性来组织文档集合;
- 文本分类:在给定的分类体系下,根据文本的内容自动确定文本所属类别;
- 文本过滤:在海量的信息中确定目标信息或剔除不需要的信息;
- 文本摘要:
回到顶部