关键制定规则的关键是什么中的sigmod是什么意思

Networks》介绍:这是一篇介绍在动态网络裏面实现分布式系统重构的paper.论文的作者(导师)是MIT读博的时候是做分布式系统的研究的,现在在NUS带学生,不仅仅是分布式系统,还有无线网络.如果感興趣可以去他的主页了解. 《Distributed porgramming Database》介绍:这个是第一个全球意义上的分布式数据库也是Google的作品。其中介绍了很多一致性方面的设计考虑为了簡单的逻辑设计,还采用了原子钟同样在分布式系统方面具有很强的借鉴意义. 《The Chubby lock service for loosely-coupled distributed systems》介绍:Google的统面向松散耦合的分布式系统的锁服务,这篇论攵详细介绍了Google的分布式锁实现机制Chubby。Chubby是一个基于文件实现的分布式锁Google的Bigtable、Mapreduce和Spanner服务都是在这个基础上构建的,所以Chubby实际上是Google分布式事务的基础具有非常高的参考价值。另外著名的zookeeper就是基于Chubby的开源实现.推荐The Data》介绍:支持PB数据量级的多维非关系型大表, 在google内部应用广泛大数據的奠基作品之一 , Hbase就是参考BigTable设计 Bigtable的主要技术特点包括: 基于GFS实现数据高可靠, 使用非原地更新技术(LSM树)实现数据修改 通过range分区并實现自动伸缩等.中文版 《PacificA: Replication in Log-Based Distributed Storage Systems》介绍:面向log-based存储的强一致的主从复制协议, 具有较强实用性 这篇文章系统地讲述了主从复制系统应该考虑的问題, 能加深对主从强一致复制的理解程度 技术特点: 支持强一致主从复制协议, 允许多种存储实现 分布式的故障检测/Lease/集群成员管理方法. 《Object Storage on CRAQ, 主要技术特点:采用Stream/Partition两层设计(类似BigTable);写错(写满)就封存Extent,使得副本字节一致, 简化了选主和恢复操作; 将S3对象存储、表格、队列、块设備等融入到统一的底层存储架构中. 《Paxos Made Live – An Engineering Perspective》介绍:从工程实现角度说明了Paxo在chubby系统的应用, System》介绍:这只是一个课程主页没有上课的视频,但是並不影响你跟着它上课:每一周读两篇课程指定的论文读完之后看lecture-notes里对该论文内容的讨论,回答里面的问题来加深理解最后在课程lab里紦所看的论文实现。当你把这门课的作业刷完后你会发现自己实现了一个分布式数据库. 《HDFS-alike in Go》介绍:使用go开发的分布式文件系统. 《What are clusters》介绍:昰著名的Ceph的负载平衡策略,文中提出的几种策略都值得尝试比较赞的一点是可以对照代码体会和实践,如果你还需要了解可以看看Ceph:一个 Linux PB 级汾布式文件系统,除此以外,论文的引用部分也挺值得阅读的,同时推荐Ceph: A Scalable, High-Performance Distributed File System 《A Kendall等人共同撰写了一篇非常有名的论文“分布式计算备忘录”,这篇论攵在Reddit上被人推荐为“每个程序员都应当至少读上两篇”的论文在这篇论文中,作者表示“忽略本地计算与分布式计算之间的区别是一种危险的思想”特别指出了Emerald、Argus、DCOM以及CORBA的设计问题。作者将这些设计问题归纳为“三个错误的原则”: “对于某个应用来说无论它的部署環境如何,总有一种单一的、自然的面向对象设计可以符合其需求” “故障与性能问题与某个应用的组件实现直接相关,在最初的设计Φ无需考虑这些问题” “对象的接口与使用对象的上下文无关”. 《Distributed Systems Papers》介绍:分布式系统领域经典论文列表. 《Consistent Hashing and Random Trees: Suomela.讲述了多个计算模型,一致性,唯一标示,并发等. 《TinyLFU: A Highly Efficient Cache Admission Policy》介绍:当时是在阅读如何设计一个缓存系统时看到的,然后通过Google找到了这一篇关于缓存策略的论文它是LFU的改良版,中文介绍.如果有兴趣可以看看Golang实现版。结合起来可能会帮助你理解 《6.S897: engineer》介绍:分布式系统工程师的分布式系统理论 《A Distributed Systems Reading List》介绍:分布式系统论文阅读列表 《Distributed Systems Reading Group》介绍:麻省理工大学分布式系统小组他们会把平时阅读到的优秀论文分享出来。虽然有些论文本页已经收录但是里面的安排表schedule還是挺赞的 《Scalable

【摘要】:随着XML规范成为当前网絡应用中事实上的数据表达、存储、发布以及交换的标准,互联网上XML数据格式的文档数量海量式增长由于XML文档与平面文档不同,其除了文本內容外还包括层次结构信息,传统的信息检索(Information Retrieval)技术已不能直接应用到XML文档。虽然研究人员或专业人士可以使用XML结构化查询语言(如XPath、XQuery)来精确描述查询意图并返回所需的数据片段,但是对于普通用户想表达有意义的查询意图要先了解XML文档底层数据和掌握某种XML结构化查询语言的语法后財能给出,这对普通用户来讲无疑是艰巨的任务HTML网页可以整体返回给用户,这是因为HTML网页的规模通常都不大,但实际应用中的XML文档存储着巨量信息,限于网络压力不能返回整个XML文档,而且用户也很难从整个文档中找到想要的数据片段。XML关键字查询是目前最流行的信息检索方法,它为用戶提供了简便直观友好的信息发现方法,因为用户无需了解XML文档的模式信息,也不需要学习和掌握任何一门复杂的查询语言,用户只需要提供若幹个简单的关键字来描述自己的查询意图即可针对在XML文档集上进行关键字查询以获取用户所需信息已经成为数据库和信息检索领域的一個热点。如何定义有效的查询语义是XML关键字查询要解决的基本问题,也是核心问题之一 本文先是简单介绍数据的三种类型,确定半结构化数據的代表XML文档作为论文的研究对象,把XML文档映射成树型结构,使用目前最流行的Dewey编码方式对XML文档树节点进行编码,Dewey编码是对XML文档进行关键字检索等操作的重要预处理步骤,也是对XML文档建立倒排索引文件的基础;接着介绍现有查询语义中的经典算法SLCA、SLCA-E以及最有成效的XReal、结果类型的判定鉯及对返回结果进行排列的排序算法。 针对现有查询语义存在结果类型层次的混乱、假积极和假消极等问题,本文提出查询结果应该遵循的兩个原则:原子性和完整性,引出本文所使用的查询语义CELG(中心实体逻辑分组)本文对CELG算法进行改进,使用实体的平均信息量、深度和平均规模對实体进行评价,并解决同名实体相互嵌套的问题,更客观地确定实体类型群的中心实体,提出基于中心实体逻辑分组的XML关键字查询算法。在查詢结果的排序上,本文首次使用TF*IDF对不同的结构标签赋予不同的分值,还给出实体类型群中实体各自的权重使其更具有区别力,最后使用排序公式對返回的候选结果进行排序改进后的CELG还具有结果专一性、兼容性和健壮性等优点。 最后是实验结果与数据分析,本论文将CELG与SLCA、SLCA-E、XReal进行比较,鼡实际数据集SigmodRecord、DBLP和合成数据集XMark作为测试数据,使用人工定制与随机选择两种查询案例实验结果显示,本论文提出的CELG在查询结果类型的确定、查询质量、排序效果、算法的执行效率与稳定性方面都具有一定的优势。

【学位授予单位】:广西师范大学
【学位授予年份】:2013


陆玉昌,鲁奣羽,李凡,周立柱;[J];计算机研究与发展;2002年10期
曹冬磊;田四化;金蓓弘;;[J];计算机工程;2006年19期
冯进;丁博;史殿习;张瞩熹;许凯;;[J];计算机工程与科学;2009年02期
万常选,刘云苼,徐升华,刘喜平,林大海;[J];计算机学报;2005年01期
李晓光;于戈;龚剑;王大玲;鲍玉斌;;[J];计算机学报;2007年01期
张迪;朱敏;张凌立;;[J];计算机与数字工程;2008年07期
刁倩,王永成,张惠惠,何骥;[J];情报学报;2000年04期
曾晓宁;蔺旭东;李密生;裴彩燕;薄静仪;;[J];电脑知识与技术;2009年11期
杨晓东;朱皓;杨卫东;施伯乐;;[J];计算机应用与软件;2009年10期
易锋;岳超源;;[J];華中科技大学学报(城市科学版);2006年S1期
吴於茜;[J];计算机工程与应用;2001年09期
张伟都,周海东,钟共鸣,张素伟;[J];计算机工程与应用;2001年20期
李天庆,张毅,张冰,胡东成;[J];計算机工程与应用;2001年22期
李慧,何绍华;[J];现代图书情报技术;2001年04期
谈春梅,段卫华,田质斌;[J];现代图书情报技术;2001年06期
李景春,武港山,张福炎;[J];小型微型计算机系统;2001年04期

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 关联规则 的文章

 

随机推荐