jeff dean的主页

上面有他的很多论文和ppt
很不错

我于1999年中期加入Google，目前是研究小组的Google高级研究员，负责Google Brain项目。我感兴趣的领域包括大型分布式系统，性能监控，压缩技术，信息检索，机器学习在搜索和其他相关问题中的应用，微处理器体系结构，编译器优化以及新产品的开发，这些新产品以新颖有趣的方式组织了现有信息。方法。在Google期间，我从事以下项目：
Google广告服务系统初始版本的设计和实现。
我们五代爬网，索引和查询服务系统的设计和实现，涵盖了搜索文档数量，每秒处理的查询数量以及系统更新频率的两个和三个数量级的增长。我最近在WSDM'09上发表了有关构建大型检索系统（幻灯片）的一些问题的演讲。
Google的AdSense内容广告产品的初步开发（涉及生产服务系统的设计和实施，以及基于页面内容开发和提高广告选择质量的工作）。
协议缓冲区的开发，一种以有效但可扩展的格式对结构化数据进行编码的方法，以及一种可生成方便的包装器以使用多种语言处理对象的编译器。Google几乎在所有RPC协议中广泛使用协议缓冲区，并在各种持久性存储系统中存储结构化信息。协议缓冲区实现的一个版本已开源，可从http://code.google.com/p/protobuf/获得。
Google新闻产品的某些初始生产服务系统可以与克里希纳·巴拉特（Krishna Bharat）合作，将他组装的原型系统移至已部署的系统中。我们的搜索排名算法的某些方面，尤其是改进了处理诸如锚文本之类的页面外信号的处理。
我们第一代用于管理机器集群的自动化作业调度系统的设计和实现。
快速开发和试验新排名算法的原型基础架构的设计和实现。
MapReduce的设计和实现，该系统可简化大规模数据处理应用程序的开发。关于MapReduce的论文出现在OSDI'04中。
BigTable的设计和实现，BigTable是在许多Google产品之下使用的大型半结构化存储系统。关于BigTable的论文发表在OSDI'06中。
Google Translate（我们的统计机器翻译系统）的一些生产系统设计。特别是，我设计并实现了一个用于分布式高速访问非常大的语言模型（太大而无法容纳在一台机器上的内存）的系统。
一些内部工具可简化快速搜索我们内部源代码存储库的过程。这个内部工具产生的许多想法都整合到了我们的Google代码搜索产品中，其中包括使用正则表达式搜索大量源代码的功能。
用于大规模培训和部署深度学习模型的两代系统的设计和实现：DistBelief和TensorFlow。TensorFlow现在是一个开源项目，托管在GitHub上。

posted on 2019-10-13 18:42 cutepig 阅读(366) 评论(0) 收藏举报

刷新页面返回顶部

jeff dean的主页

导航

公告