· Database Support for Research on Sustainability
· Rightly Solving the Right Problems
· 微博数据管理 Tweet Data Management
· Query processing on cloud platforms with a shared disk architecture
2008-12-4 16:05:04 阅读656 评论0 42008/12 Dec4
黄铭钧的研究兴趣包括数据库性能问题,索引技术,XML数据处理,多媒体及空间数据库,云计算和并行系统的研究与高级应用等。他的研究工作以企业的实际应用为出发点,致力于将最新的科研成果转化为实际的生产力.
2009-12-16 15:46:50 阅读1170 评论0 162009/12 Dec16
大规模数据分析是能体现云计算优越性的重要应用,它使得海量数据能够在大型集群中得到处理和分析。在目前的云计算环境中,MapReduce框架因其出色的可扩展性和较好的容错性而获得广泛的使用。由于它的普及,研
2011-10-18 10:14:40 阅读161 评论0 182011/10 Oct18
2011-8-9 10:23:54 阅读149 评论0 92011/08 Aug9
2011-8-4 14:01:35 阅读242 评论0 42011/08 Aug4
Data analytics is not new, but is becoming a very hot topic/buzzword in recent years. Data mining, which most database people are familiar with, has been around for years, and is used to discover patterns, features and trends from raw data. Based on the knowledge discovered, conclusion and inference are made, and this has been recently termed as data analytics, and business
2011-7-30 22:02:59 阅读205 评论0 302011/07 July30
As the saying goes, there is no such thing as a free lunch, which is the case for most optimization. Optimization is a process that aims to improve the efficiency of an operation, and hence minimizing execution cost and maximizing throughput. The more effort we put in, the better processing cost we get. However, since optimization is a non-negligible
2011-7-21 16:16:57 阅读220 评论0 212011/07 July21
IT has been a change agent in many business models and has transformed them in many ways. It has also transformed our life to some extent, such as we are spending more time on virtual social networking than networking in real life. It no doubt also enhances the connection and the quality of life in many ways. For every new application that is being used in
2011-6-12 11:01:47 阅读236 评论0 122011/06 June12
1) What will the distributed data platform be like when the network speed breaks the current network speed limits by 10 times (eg. the break through in graphene based networking)?
2) Will database archictecture remain the same when large scale PCM is commercially available?
2011-6-11 9:12:31 阅读417 评论0 112011/06 June11
创业从很大程度上来说是系统研究员生活中不可或缺的一部分。我们关注整个系统的研发,而不仅仅是做局部的设计来支撑我们提出的理论。每当完成一个新的系统,我们希望看到它能够在人们的生活中投入使用。这不仅是对自我价值的实现,同时也是对应用驱动型(use-driven)研究的有力验证,以及对个人财富的再生。
我在1992/3年开始从事图像数据管理方面的研究。与我的两位同事一起,我们在1999年发布了用作照片共享的GeoFoto图像管理系统。那时web 2.0 应用和社交网络还尚未兴起。GeoFoto系统允许用户输入“关键词 -- keyword” (即现在大家所熟知的“标签 -- tagging”) 来对照片进行描述,并设定每张照片的访问权限,是否分享它,以及分享
2011-3-30 9:21:06 阅读481 评论0 302011/03 Mar30
在社交网络和微博系统中,数据作为一个整体,都存在一个系 统里,因此,那些数据一旦产生就应当被搜索到。为了给博客以及微博提供实时搜索功能,我们需要即时地更新数据库以及索引。然而在微博系统中,这些微博产生的速度实在是太快了:在一些比较流行的系统中,用户们每天可能会发布超过
5000 万条微博。在用户量大的微博系统中,提供实时检索确实是一个很有挑战性的问题。2010-12-10 10:18:12 阅读327 评论0 102010/12 Dec10
Instead of having individual disks with each node in the cloud cluster, one alternative is to have a cluster file system that handles commodity disks. An argument for such an architecture is that it reduces heat, while at the same time provides SAN-like capabilities.
To be continued...
2010-9-28 10:13:45 阅读505 评论0 282010/09 Sept28
OLTP and OLAP workloads are typically handled separately by two systems with different architectures – RDBMS for OLTP and da
2010-8-28 22:47:58 阅读556 评论0 282010/08 Aug28
尽管半导体技术促进了中央处理器领域突飞猛进的发展,但是存储器的发展却很滞后,直到今天,主存和硬盘所采用的技术和30年前依然基本相同。除了硬盘的容量大幅度提高之外,硬盘技术的基本原理几乎没有改变,静态随机存储器(SRAM)和动态随机存储器(DRAM)信息存储的主要介质仍然是电荷。值得注意的是,近年来一些新兴的存储技术可能带来一场革命性的变化。闪存技术正逐渐成熟,并且将成为硬盘的重要竞争者。放眼望去,相变存储器(PCM),磁阻式随机存储器(MRAM)和电阻式随机存储器(RRAM)等一系列技术也都相继走出实验阶段,进入产品开发阶段。我们把这一类存储技术称为存储级内存(SCM --Storage Class Memory)。SCM是可基于位访问的,速度堪比SRAM和DRAM,并且存储密度至少提升了一个数量级。此外,它们都是非挥发性的,耗能明显少于传统存储技术。毫不夸张地说,我们正处于信息存储变革的浪潮之巅。
2010-7-20 23:22:59 阅读793 评论0 202010/07 July20
MapReduce 广泛应用于处理云端计算中存储的海量数据。该系统具有良好的伸缩性和细粒度的容错能力,但在处理数据库应用时,性能却表现不佳。最近的研究表明,Hadoop(开放源码的MapReduce系统)在处理许多类型的数据分析任务时,比两个最新的并行数据库系统慢3.1到6.5倍。用户固然可以从云端中租用更多的计算节点,加速MapReduce的运行。但是,这种租赁更多节点的方式,在“即用即付”的环境中,性价比不高,也不是一个长期的解决方案。对于数据密集型应用,用户需要高伸缩性且经济的数据处理系统。因而, MapReduce能否同时提供性能和伸缩性是一个重要的研究课题。
2010-4-1 9:58:10 阅读489 评论0 12010/04 Apr1
随着移动设备、无线电通信和定位技术的发展,带摄像头的手机已经在社会中普及——它已经成为人们生活中不可或缺的一个小玩意儿。内嵌在这些移动设备中的摄像头允许人们随意拍摄周边的环境,因为这比花大价钱买个数码相机要便宜很多,而且它的分辨率已经足够好了。它能够丰富每个人的表达能力,记录人们的经历,并且能够简易的总结某个事件。因此,人们可以把手机拍摄的相片(包括商品,表单甚至某个事件)提交给数据库从而进行查询。这种查询功能很容易在现有的智能手机上实现。现在已经有一些商业系统提供了这样的功能:用户可以用手机拍下商场中某个商品,然后将相片提交给数据库系统来查询这个商品的信息。