网站主页   操作系统    网络工程    服务器    网页制作    数据库    程序开发    网络安全    办公软件   
  栏目导航
讲座日期: 本周六下午1点30分 抢座
讲座地点: 北大青鸟马甸校区
主讲老师: 王老师 金牌讲师
讲座主题: 网络安全
讲座内容: 检测、防御、黑客信息,如何过滤不安全的网站,如何防御黑客的进攻。
订座电话: 010-82011432/33
  您当前位置:主页 > 网络学院 > 数据库 >

数据库传统使用方式的全新改变--检索新技术




  当前,互联网上的信息成爆炸式增长,但是搜索引擎所能搜索到的网页数据只是Web上全部数据的一小部分,研究发现,存储在Web数据库中的不能被搜索引擎搜索到的数据大约是搜索引擎能够搜索到的网页数据的500倍左右。对于Web上的数据库,目前用户只能使用其所属网站提供的特定查询界面检索其中的数据。例如,当我们检索网上书店、数字图书馆等专业网站上的信息时,需要通过该网站提供的查询表单分别输入作者名、题名等信息,检索不同的网上书店或者数字图书馆时,要熟悉和使用不同查询表单,这种操作方式不仅麻烦,而且也不能满足灵活多变的查询要求(如查找引用了指定论文的论文等)。同样的例子,还有网上音乐数据库、电影数据库、企业名录、产品数据库等等。另外,当我们需要把自己的数据库发布到Web上时,也需要设计和开发特定的查询表单,这些开发和维护工作非常繁琐。

  采用数据库关键词检索技术,情况就完全不一样了。普通的互联网用户不需要了解数据库的模式,也不需要掌握数据库的查询语言SQL,仅仅使用简单的关键词就能够检索Web数据库中的数据,就像使用谷歌、百度等搜索引擎检索互联网上的信息一样简单方便。而且,相对于定制好的查询表单,这种检索方式的搜索功能更加强大,能够满足用户灵活多变的查询要求。对Web数据库的发布者来说,不再需要为数据库设计开发特定的查询表单,数据库的网上发布变得更加容易。所以说,数据库关键词检索技术可以改变数据库的Web使用方式。

  数据库关键词检索技术还可以用于未来的搜索引擎当中,使得搜索引擎不仅能够搜索网页数据,还能够对互联网上的数据库数据、文本数据、XML格式的数据等各种类型的数据进行统一的检索,大大提高搜索引擎所能提供给用户的信息量。毫不夸张的说,在未来的应用中,数据库关键词检索技术可能对我们每个人产生影响,具有广阔的应用前景。

  数据库关键词检索技术提高了数据库系统的易用性,还将对信息资源的开发利用和国家信息化建设产生积极影响。众所周知,数据库技术是信息资源开发、管理和服务的有效手段,一个国家的数据库建设规模、数据库信息量的大小和使用的频度是衡量一个国家信息化程度的重要标志之一。随着我国经济和社会信息化的发展,越来越多的数据以数据库的形式存储,使用数据库的人越来越多,其中的大多数人并没有专业的数据库知识,只能依赖于定制好的应用软件或查询接口检索数据库。有了数据库关键词检索技术,他们可以使用简单的关键词来自由的检索数据库,挖掘其中的信息和知识,信息资源的利用效率将得到很大提高。

  从研究方面讲,数据库关键词检索技术是在传统的数据库管理系统中实现信息检索技术的有关功能,属于数据库和信息检索的交叉研究领域。王珊教授课题组自2003年开始,率先在国内开展了数据库关键词检索技术的研究,并且获得了国家自然科学基金项目的资助。三年多来,王珊教授课题组一方面跟踪国际研究前沿,一方面自主创新,提出了SEEKER、DETETOR等原型系统,在国内外重要学术期刊和会议上发表了多篇研究论文。其中,2005年发表在JCST第1期上的文章“Searching Databases with Keywords”据世界著名出版商Springer的SpringerLink网站统计,先后两次成为JCST期刊被访问最多的5篇文章之一。

  当前,数据库关键词检索仍然处于应用基础研究阶段,许多技术问题尚没有得到完善解决。国内外的研究热点集中在检索语言、数据模型、性能优化、结果排序、结果展现、系统体系结构等方面,王珊教授课题组近期的研究集中在性能优化和结果展现方面,最近发表在JCST上的这篇关于“CLASCN”的论文就是性能优化方面的重要研究成果之一。

  相对于传统的数据库检索技术,数据库的关键词检索是在数据库中挖掘各种各样的知识,能够给用户提供多样的信息,但是伴随而来的是系统的性能问题,即系统的检索效率不能让用户满意。国际上对性能优化的研究非常多,提出各种了各种性能优化技术,但是系统的效率仍然不够理想。王珊教授课题组提出的CLASCN即候选网络分类、学习和选择方法,在国际相关研究的基础上,对数据库关键词检索的传统模型做了较大改进,采用机器学习的方法对系统产生的中间结果(候选网络,简称CN)做裁剪,只选择有可能产生结果的候选网络执行。大量的实验证明,这种新技术比已有的检索技术的效率提高了数倍,与此同时,使用新技术的系统的检索效果(查全率和查准率)仍然比较理想。该项研究对于促进数据库信息检索技术的发展,以及数据库关键词检索技术的实用化具有重要意义。


上一篇:手把手教你十招摆脱黑客的攻击  
下一篇:Oracle数据库密码文件的使用与维护
相关信息:

·Oracle数据库密码文件的使用与维护 ·SQL多表格查询合并至单一声明的常用方式
·SQLServer索引结构及其使用之一 ·SQLServer索引结构及其使用之二
·SQLServer索引结构及其使用之三 ·SQLServer索引结构及其使用之四
·SQLServer索引结构及其使用之五 ·SQLServer索引结构及其使用之六
·SQLServer索引结构及其使用终结篇 ·Oracle 8.0使用技巧

Copyright © 2002-2015 版权所有
学校地址:北京市海淀区西三旗建材城中路29号北大青鸟
招生热线:010-82011433/32 京公网安备110102004704  京ICP备05043413号 京公网安备110102004704