浙江省高等学校教师教育理论培训

微信搜索“毛凌志岗前心得”小程序

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 ··· 302 303 304 305 306 307 308 309 310 ··· 630 下一页

2012年9月22日

摘要: 百度技术沙龙宗旨“畅想•交流•争鸣•聚会”是百度技术沙龙的宗旨。 百度技术沙龙是由百度与InfoQ中文站定期组织的线下技术交流活动。目的是让中高端技术人员有一个相对自由的思想交流和交友沟通的平台。主要分讲师分享和OpenSpace两个关键环节,每期只关注一个焦点话题。讲师分享和现场Q&A让大家了解百度和其他知名网站技术支持的先进实践经验,OpenSpace环节是百度技术沙龙主题的升华和展开,提供一... 阅读全文
posted @ 2012-09-22 10:34 lexus 阅读(332) 评论(0) 推荐(0)

摘要: thrift安装 - xiaoshe的专栏 - 博客频道 - CSDN.NET thrift安装 分类: thrift 2011-06-21 09:05 876人阅读 评论(1) 收藏 举报 Thrift是Facebook开发出的一个软件库和一组代码生成工具,以加快高效率、可扩展的后端服务的开发与实现的速度。它通过对各语言最常用的部分加以抽象,把它们放进一个通用库里,再用各个语言实现,来实现跨... 阅读全文
posted @ 2012-09-22 10:32 lexus 阅读(313) 评论(0) 推荐(0)

摘要: 相似数据检测算法szzhao的日记szzhao的主页广播相册喜欢二手活动发豆邮相似数据检测算法2011-10-26 14:47:46相似数据检测算法对给定的一对数据序列计算两者之间的相似度([0,1], 1表示完全相同)或距离([0, ), 0表示完全相同),从而度量数据之间的相似程度。相似数据检测在信息科学领域具有非常重要的应用价值,比如搜索引擎检索结果的聚类与排序、数据聚类与分类、Spam检测... 阅读全文
posted @ 2012-09-22 09:56 lexus 阅读(479) 评论(0) 推荐(0)

2012年9月21日

摘要: Min-Hash和推荐系统 | IT瘾Min-Hash和推荐系统标签: 未分类 | 发表时间:2012-06-22 12:56 | 作者:xlvector分享到:出处:http://xlvector.net/blog前几年看Google News Recommendation的那篇Paper,对里面提到的MinHash的算法基本没有注意,因为之前的习惯都是只注意论文的模型那块,至于怎么优化模型... 阅读全文
posted @ 2012-09-21 22:48 lexus 阅读(378) 评论(0) 推荐(0)

摘要: Simhash算法原理和网页查重应用_黄言之_新浪博客Simhash算法原理和网页查重应用 传统的hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别极大。从这个意义上来说,要设计一个ha... 阅读全文
posted @ 2012-09-21 22:39 lexus 阅读(459) 评论(0) 推荐(0)

摘要: 网页排重算法-信息指纹算法_dobit的个人空间_百度空间2009-11-13 11:04网页排重算法-信息指纹算法1.1 信息指纹算法判断重复网页的思想:为每个网页计算出一组信息指纹(Fingerprint),若两个网页有一定数量相同的信息指纹,则认为这两个网页的内容重叠性很高,也就是说两个网页是内容复制的。判断内容复制的方法中最关键的两点:1、计算信息指纹(Fingerprint)的算法;2、... 阅读全文
posted @ 2012-09-21 22:07 lexus 阅读(1076) 评论(1) 推荐(0)

摘要: 搜索研发部官方博客 » Blog Archive » 相似度计算常用方法综述相似度计算常用方法综述(2012-7-05 09:07:59)标签: 主题相似度 , 向量空间模型 , 相似度计算分类:数据挖掘引言 相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉... 阅读全文
posted @ 2012-09-21 20:58 lexus 阅读(276) 评论(0) 推荐(0)

摘要: 海量文档查同或聚类问题 -- Locality Sensitive Hash 算法 - fxjtoday的专栏 - 博客频道 - CSDN.NET海量文档查同或聚类问题 -- Locality Sensitive Hash 算法 分类: Web Data Mining Algorithm 2011-02-22 15:56 736人阅读 评论(0) 收藏 举报 Normal 0 ... 阅读全文
posted @ 2012-09-21 20:56 lexus 阅读(299) 评论(0) 推荐(0)

摘要: nilsimsa的大概算法 - redgreen_x的日志 - 网易博客nilsimsa的大概算法2009-12-02 12:51:03|分类: 默认分类 |标签: |字号大中小订阅1. 有一个5个字节的window,沿着文本向右滑动,每次滑动一个字节2. 每一个window里面的5个字节,分别可以N个组成3元组。 例如igram,可以分为:igr iga igm iga igm gra grm... 阅读全文
posted @ 2012-09-21 20:45 lexus 阅读(523) 评论(0) 推荐(0)

摘要: python 应用thrift---- thrift的监控fb303 - import coding_dog ---- by 坚毅的刀刀 - 博客大巴ython 应用thrift---- thrift的监控fb303 - [coding]2011-08-18版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://shenguanpu.blogbus.com/logs/1567... 阅读全文
posted @ 2012-09-21 18:31 lexus 阅读(424) 评论(0) 推荐(0)

摘要: HiveServer - Apache Hive - Apache Software Foundation HiveServerSkip to end of metadata Page restrictions apply Added by Confluence Administrator, last edited by Carl Steinbach on Apr 17, 2012 (view c... 阅读全文
posted @ 2012-09-21 18:28 lexus 阅读(496) 评论(0) 推荐(0)

摘要: hive并发调用的运行方式-个人经验篇 - ggjucheng - 博客园前言使用hive,我们很多情况下会并发调用hive程序,将sql任务转换成mapreuce提交到hadoop集群中,而在本人使用hive的过程中,发现并发调用hive有几个问题,在这个和大家分享下.正文默认安装hive,hive是使用derby内存数据库保存hive的元数据,这样是不可以并发调用hive的,需要配置为使用my... 阅读全文
posted @ 2012-09-21 18:24 lexus 阅读(525) 评论(0) 推荐(0)

摘要: HiveClient - Apache Hive - Apache Software FoundationPythonOperates only on a standalone server. Set (and export) PYTHONPATH to build/dist/lib/py.The python modules imported in the code below are gene... 阅读全文
posted @ 2012-09-21 18:22 lexus 阅读(297) 评论(0) 推荐(0)

摘要: Hive and Hadoop version - Stack Overflowhive -e "set hive.hwi.war.file;" | cut -d'-' -f3 阅读全文
posted @ 2012-09-21 18:19 lexus 阅读(294) 评论(0) 推荐(0)

摘要: thrift在hive中的应用 » ORATEAthrift在hive中的应用hadoop 添加评论六 272011thrift是一种可伸缩的跨语言服务的发展软件框架。 它结合了功能强大的软件堆栈的代码生成引擎,以建设服务,工作效率和无缝地与C + +,C#,Java,Python和PHP和Ruby结合。 thrift是facebook开发的,我们现在把它作为开源软件使用。thrift允许你定义一... 阅读全文
posted @ 2012-09-21 18:12 lexus 阅读(1268) 评论(0) 推荐(0)

摘要: python访问Hive配置 - jmydream的专栏 - 博客频道 - CSDN.NET python访问Hive配置 分类: hive 2012-09-04 15:41 36人阅读 评论(0) 收藏 举报目录(?)[+]hive有三种启动方式:hive命令行模式,直接输入/hive/bin/hive的执行程序,或者输入 hive –service cli 用于linux平台命令行查询,查... 阅读全文
posted @ 2012-09-21 18:09 lexus 阅读(918) 评论(0) 推荐(0)

摘要: Hive的访问接口 | Allen's WorldHive的访问接口Hive提供了三种客户端访问接口:1)Hive CLI(Hive Command Line,Hive命令行),客户端可以直接在命令行模式下进行操作。2)hwi(Hive Web Interface,Hive Web接口),Hive提供了更直观的Web界面3)hiveserver,Hive提供了Thrift服务,Thrift客户端目... 阅读全文
posted @ 2012-09-21 18:06 lexus 阅读(1722) 评论(0) 推荐(0)

摘要: [7] 编写Python脚本将Hive的运算结果保存到MySQL数据库中(1) - 摩西莫西 - ITeye技术网站[7] 编写Python脚本将Hive的运算结果保存到MySQL数据库中(1) 博客分类:Hive脚本MySQLPythonSQL编写Python脚本将Hive的运算结果保存到MySQL数据库中(1)很多情况下,需要将Hive中的运算结果保存到MySQL数据库中,可以通过简单的Py... 阅读全文
posted @ 2012-09-21 18:03 lexus 阅读(601) 评论(0) 推荐(0)

摘要: thrift使用小记_CUDev-ChinaUnix博客thrift使用小记 (2011-09-19 21:28)标签: 客户端 接口 Facebook transport protocol 分类: 程序设计 Thrift是一个跨语言的服务部署框架,最初由Facebook于2007年开发,2008年进入Apache开源项目。Thrift通过一个中间语言(IDL, 接口定义语言)来定义RPC的接口... 阅读全文
posted @ 2012-09-21 17:50 lexus 阅读(475) 评论(0) 推荐(0)

摘要: HiveDB | Open Source framework for horizontally partitioning MySQL systemsHiveDB is an open source framework for horizontally partitioning MySQL systems. Building scalable and high performance MySQL-b... 阅读全文
posted @ 2012-09-21 17:41 lexus 阅读(271) 评论(0) 推荐(0)

上一页 1 ··· 302 303 304 305 306 307 308 309 310 ··· 630 下一页