上一页 1 2 3 4 5 6 7 8 ··· 26 下一页
摘要: 在早期,应用要使用TFS,需要知道TFS名字服务器的地址才能访问TFS,然后调用读写接口存取文件,当应用比较少时,这种方式不会引发什么问题,但目前在淘宝内部,有200多个应用使用TFS做为后端的存储系统,必须要对应用的存储资源进行统一的管理与运维。 TFS做为一个应用存储平台,缺乏统一管理至少存在如下问题: 多集群管理:多集群访问控制、切换、容灾等。 访问控制:应用只要... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(381) 评论(0) 推荐(0)
摘要: 集群数据对比功能的添加对TFS DS做了修改,在把DS上到日常测试环境前对其进行了一次回归测试,测试用例都通过,但checkserver检查到有大量block未同步到辅集群,查看dataserver的日志发现同步队列已经阻塞住了,一直重复retry。 主备集群的数据同步是由主集群的DS在后台进行,其将成功的写、删等操作记录在本地日志,并启动后台线程将日志重放到备集群,DS没重放一条日志,如果失败... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(530) 评论(0) 推荐(0)
摘要: 本地文件系统如ext3,reiserfs等(这里不讨论基于内存的文件系统),它们管理本地的磁盘存储资源、提供文件到存储位置的映射,并抽象出一套文件访问接口供用户使用。但随着互联网企业的高速发展,这些企业对数据存储的要求越来越高,而且模式各异,如淘宝主站的大量商品图片,其特点是文件较小,但数量巨大;而类似于youtube,优酷这样的视频服务网站,其后台存储着大量的视频文件,尺寸大多在数十兆到数吉... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(369) 评论(0) 推荐(0)
摘要: TFS没有采用目前流行的3副本策略,而是使用集群内配置2个副本,并把数据同步到一个辅集群,辅集群同样配置2个副本;这种方式对于实现异地机房容灾很方便,辅集群的数据同步是由主集群的数据服务器在后台发起的;目前主集群可读写,辅集群只读,双集群同时读写功能已开发完成,但没有在线上使用。 由于数据同步到辅集群是异步操作,当某次读文件的操作落到辅集群上时,可能该文件的同步尚未完成,此时在辅集群上读不到数据... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(406) 评论(0) 推荐(0)
摘要: 当你的系统发布时,你需要告诉用户如何去使用,通常你会写一份示例代码放在文档中,让用户能通过这个例子快速知道该如何使用,这个实例代码对用户会有多大影响呢? TFS是淘宝的分布式文件系统,主要用于小对象的存储(如图片、交易快照等),在TFS的开源wiki上,也有一个简单的实例。具体的说,TFS客户端提供了基本的open、read、write、close接口,用户在读写前,需要先根据对应的模式open... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(258) 评论(0) 推荐(0)
摘要: 学习篇 1.科研方面基本没接触新的内容,仍然把学习重点定在分布式技术及应用方面。把经典的几篇论文(GFS、Bigtable、Dynamo、Zookeeper …)重新研读了几次,结合网上技术博客的分析,对分布式系统的理解稍稍有些加深。 2.项目方面根据Spyglass和Meggllan两篇论文的思路,实现了一个元数据检索系统原型,后将其扩展并作为我毕业论文的课题。 3.持续关注Nosql方面... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(235) 评论(0) 推荐(0)
摘要: 昨日线上一台机器上的nginx rt飙高,@明俨 调查发现这台机器上的metaserver内存占用很高,同时还有个奇怪的现象,df发现/home的空间占用在增长飞快,但metaserver和nginx的日志文件增长都很慢,通过du -sh /home统计home下文件的总大小,发现跟df命令/home占用的空间小10+g,到底谁占用了我的磁盘空间? 后来把nginx进程都停掉后(当时应该先通过ls... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(3952) 评论(0) 推荐(0)
摘要: 配置参数 在工程实践中,我们通常把一些需要测量才能确定最佳取值的参数以可配置的形式处理,但实际上大部分的参数可能只是一个可行值,而不是一个最佳值。 1. DS与NS之间的心跳间隔设置:NS通过心跳来确定DS的状态,心跳间隔太短,NS容易出现误判,有时短暂的网络断开也会被NS认定为DS宕机;而心跳间隔过长,NS就不能及时发现宕机的DS,导致的问题是,NS复制丢失block的时间点会被延迟,影响系... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(545) 评论(1) 推荐(0)
摘要: 系统架构师大会分享 View more presentations or Upload your own. 管理员在2009年8月13日编辑了该文章文章。 --> --> 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(120) 评论(0) 推荐(0)
摘要: 英文原文:http://www.theserverside.com/tip/A-return-to-Good-Code 中文译文:http://www.aqee.net/a-return-to-good-code/ 文章作者认为,函数应该是单出口的,即只在结束时return;读书期间,我写代码的风格是多return的,使代码尽量简短。在百度和淘宝工作期间,我们的代码规范都是要求函数单出口,刚开始写... 阅读全文
posted @ 2013-04-19 14:13 ydzhang 阅读(1140) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 26 下一页