摘要:
如何确定网页和查询的相关性本文分为两部分搜索关键词权重的科学度量TF-IDF利用python的工具包计算文本的IF-IDF1. 搜索关键词权重的科学度量TF-IDF查询:原子能的应用首先进行分词:原子能、的、应用根据直觉知道:包含这三个词较多的网页比包含少的网页与我们的需求相关性更好漏洞:内容多的比内容少的占优势改进:归一化。即用关键词的个数除以网页总的词数,商称为”单文本词频“TF(Term Frequency)。比如”原子能、的、应用“三个词出现的词数分别为2、35、5,网页中一共有1000个词,那么三个词的TF分别为:0.002、0.035、0.005。查询与网页的相关度即总词频公式如下 阅读全文
posted @ 2013-09-19 00:22
HackerVirus
阅读(250)
评论(0)
推荐(0)
摘要:
javascript full screen 全屏显示 页面元素要想让页面的某个元素全屏显示,就像在网页上看视频的时候,可以全屏观看一样,该怎么实现呢?一种最简单的方式,就是动态改变你想要全屏显示的部件的style,例如position变成absolute,height和width都设置成窗口大小,并且把背景颜色改成全白(为了遮住页面上其余的元素)。这样网页上就只能看到你要突出的部件了,视觉上就等同于全屏。同时利用javascript监听键盘事件,一旦用户按了ESc退出键,就恢复原来的样子。部分代码如下:document.onkeydown = function (event) { ... 阅读全文
posted @ 2013-09-19 00:19
HackerVirus
阅读(475)
评论(0)
推荐(0)
摘要:
WinDBG中加载SOS和CLR最近产品环境出现了部分服务器当机情况,虽然重启之后问题就不出现了。但本着彻底解决问题的态度,想要找到root cause。多次尝试Visual Studio失败(可能是代码惊醒了优化和签名)之后,决定使用WinDBG来调试。于是。。。灾难发生了。 想要一次性成功搭建测试环境,那得靠人品。看来我近来人品积累的不够,不断的有小问题出现。比如加载SOS和CLR,就让我不胜其烦。必须得记下来,分享出来,以节省大家的时间。 问题一:WinDBG分X86和X64两个版本 如果你用的是32位的WinDBG,那直接打开就行;你如果用的是64位的版本,那么如果调试64位代码... 阅读全文
posted @ 2013-09-19 00:15
HackerVirus
阅读(1430)
评论(0)
推荐(0)
摘要:
翻译:使用 ASP.NET MVC 4, EF, Knockoutjs and Bootstrap 设计和开发站点 - 6 - 业务逻辑Part 3: 设计逻辑层:核心开发如前所述,我们的解决方案如下所示:下面我们讨论整个应用的结构,根据应用中不同组件的逻辑相关性,分离到不同的层中,层与层之间的通讯通过或者不通过限制。分层属于架构风格,在应用的长时间生命周期中,解决维护和扩展问题。所以,让我们在解决方案中添加一个类库项目,命名为 Application.Common.Application.Common :这是一个类库项目, 提供公共功能,可以被不同的业务逻辑层使用。例如:安全,日志,跟踪,验 阅读全文
posted @ 2013-09-19 00:14
HackerVirus
阅读(246)
评论(0)
推荐(0)
摘要:
NoSQL之Cassandra 9月初听了一个讲座,演讲者是张月同学,他给我们分享了Cassandra nosql数据库,讲得很精彩,听完之后收益良多。 Cassandra是一个noSQL数据库,在国外被广泛使用,比如FaceBook、Twitter、Intel等,国内用的较少,只有奇虎360等公司在大规模使用。张月首先讲了Cassandra怎么来的,之后讲了Cassandra的一些具体细节,让我印象比较深刻的有数据分布以及通讯协议两个部分,最后讲了Cassandra的效率以及使用情况。1. Cassandra怎么来的 他山之石可以攻玉,Cassandra从Dynamo和BigTab... 阅读全文
posted @ 2013-09-19 00:09
HackerVirus
阅读(347)
评论(0)
推荐(0)
摘要:
Python基础:模块一、概述二、导入语句1、基本语法2、推荐风格三、模块1、模块名2、模块属性3、可导出的公有属性4、直接执行四、包1、包名2、包属性3、可导出的公有属性4、其他五、导入原理1、导入依赖2、导入过程3、更多细节4、sys.path六、重新加载七、相对导入1、导入语句2、导入原理3、直接执行一、概述模块(module)和 包(package)是Python用于组织大型程序的利器。模块是一个由变量、函数、类等基本元素组成的功能单元,设计良好的模块通常是高内聚、低耦合、可复用、易维护的。包是管理模块的容器,它具有可嵌套性:一个包可以包含模块和其他包。从文件系统的视角来看,包就是目录 阅读全文
posted @ 2013-09-19 00:07
HackerVirus
阅读(245)
评论(0)
推荐(0)
摘要:
storm源码之storm代码结构【译】说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正在基于Storm进行源码级学习和研究的朋友有所帮助。Storm的源码共分为三个不同的层次。首先,Storm在设计之初就考虑到了兼容多语言开发。Nimbus是一个thrift服务,topologies被定义为Thrift结构体.Thrift的运用使得Storm可以被任意开发语言使用。其次,Storm的所有接口都是Java语言来定义的。因此,尽管Storm中的很多功能实现都是Clojure代码,但是使用这些功能 阅读全文
posted @ 2013-09-19 00:06
HackerVirus
阅读(1252)
评论(0)
推荐(0)
摘要:
避免每次输入bundler Exec命令bundle在ruby的世界里是个好东西,它可以用来管理应用程序的依赖库。它能自动的下载和安装指定的gem,也可以随时更新指定的gem。rvm则是一个命令行工具,能帮助你轻松的安装,管理多个ruby环境。每个环境可以指定一系列的gem。它允许你为每一个项目指定其ruby的版本,需要的gem的版本。这能最大限度的避免由于ruby环境的差异,或者不同版本的gem造成的各种问题。当我在项目中引入了rvm后,使用rake命令时,每次都会出现这样的异常。12345678rake aborted!You have already activated rake 10. 阅读全文
posted @ 2013-09-19 00:04
HackerVirus
阅读(1387)
评论(0)
推荐(0)
浙公网安备 33010602011771号