注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Ooi Beng Chin 黄铭钧

Databases, Machine Learning and Systems

 
 
 

日志

 
 

数据库中的关键词搜索--Keyword Search  

2010-03-18 11:11:43|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

      简单易用的关键词查询 (keyword search) [1, 2, 3] 界面对于互联网被广泛接受和用户提供内容的快速传播有着巨大的贡献。关键词查询界面允许用户自由地查询海量的数据,因此可以提高关键词搜索技术的可用性。在过去的二十年中,数据库系统在性能,可扩展性和容错性方面都有着巨大的进步。现在的数据库系统可以同时处理在多种多样的庞大数据集上的大量复杂并发查询。自然地,下一步的研究难题是如何提供一种比结构化查询语言(structured query language)更方便的、像基于实例的查询(query-by-example)和基于表单(query-by-form)的查询那样流行的搜索查询界面,从而提高数据库系统的可用性。

由于文本数据容量的不断增加,基于关键词的查询机制就成为用户自然有效的与数据库交互的方法。然而,在我们拥有可以允许用户在不知道任何有关底层数据存储的知识时仍然可以对数据库进行有意义的查询这一思维方式的转变之前,仍然有很多悬而未决的研究问题需要被解决。这样,关键词搜索成为一个热门的研究领域并不足以让人感到惊奇。

一个早期的在结构化数据上的基于关键词的检索的方法是检查包含关键词的数据项之间的连接关系(例如BANKS[2]). 最近的一些研究工作已经试图通过在关键词搜索中引入结构,在用户输入时提供交互式的搜索,利用后处理消除歧义以及集成结构化语义等方法来超过原先的方法。然而,必须注意到在搜索引擎和文本数据库上的自由文本搜索的流行在一定程度上激发了关键词搜索的发展。基于关键词的检索在信息检索领域已经有了很深入的研究。所以,为了避免重复研究、并从信息检索领域的研究者那里学到哪些方法适用于数据库领域而哪些方法不适用,引用参考信息检索中存在已久的全文评估方法是非常重要的。参考文献[1]中列出了8篇研究论文,这些论文提供了现有的研究工作的知识,并对未来的研究工作提出了一些建议。

引用文献:

 1) B. C. Ooi (ed): Keyword Search. IEEE Data Engineering Bulletion, March 2010.

 2) G. Bhalotia, A. Hulgeri, C. Nakhe, S. Chakrabarti, S. Sudarshan: Keyword Searching and Browsing in Databases using BANKS. ICDE 2002: 431-440

 3) G. Li, B.C. Ooi, J. Feng, J. Wang, L. Zhou: EASE: An Effective 3-in-1 Keyword Search Method for Unstructured, Semi-structured and Structured Data. ACM SIGMOD Int'l. Conference on Management of Data (SIGMOD), Vancouver, 2008. 

  评论这张
 
阅读(1916)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017