max_xbw

2015年10月27日

摘要： 1 \documentclass[conference]{IEEEtran} 2 \usepackage{cite} 3 \usepackage{graphicx} 4 \usepackage{CJKutf8} 5 6 \begin{document} 7 \begin{CJK*}{UTF8}{gbsn} 8 9 %中文 10 中文 11 12 \clearpage 13... 阅读全文

posted @ 2015-10-27 09:53 max_xbw 阅读(1412) 评论(0) 推荐(1)

2015年10月13日

［JAVA词形还原工具］Snowball

摘要： demo:http://snowball.tartarus.org/demo.phpjar download:http://snowball.tartarus.org/download.php (JAVA version里面有一处语法错误，自行修改后，自己动手生成jar包) 1 /** 2 * P... 阅读全文

posted @ 2015-10-13 14:43 max_xbw 阅读(762) 评论(0) 推荐(0)

2015年8月31日

［fun code - 模拟］孤独的“7”

摘要：今天看到朋友圈里有人发了一张孤独的7的题目，第一反应就是模拟后计算出结果，而女朋友则更爱推理，手算。😄java code:import java.io.ObjectInputStream.GetField;/** * Project Name:fun * File Name:Main.java *... 阅读全文

posted @ 2015-08-31 09:56 max_xbw 阅读(461) 评论(0) 推荐(0)

2015年8月21日

［转］让搜索跨越语言的鸿沟—谈跨语言信息检索技术

摘要：跨语言信息检索，是信息检索领域中的一个研究课题。近10几年来，由于互联网的飞速发展，这方面的研究受到了学术界的广泛重视。将这项技术应用于搜索，可以帮助我们查找到更多的有用信息，例如外语相关页面、多语言页面以及语言无关的资源(如图片)等等。这些信息可以大大丰富搜索的结果，满足用户多样的需求。在跨语言信... 阅读全文

posted @ 2015-08-21 17:25 max_xbw 阅读(528) 评论(0) 推荐(0)

2015年8月18日

【PRML读书笔记-Chapter1-Introduction】1.6 Information Theory

摘要：熵给定一个离散变量，我们观察它的每一个取值所包含的信息量的大小，因此，我们用来表示信息量的大小，概率分布为。当p(x)=1时，说明这个事件一定会发生，因此，它带给我的信息为0.（因为一定会发生，毫无悬念）如果x和y独立无关，那么：他们之间的关系为：（p(x)=1时，h(x)=0，负号为了确保h(x)... 阅读全文

posted @ 2015-08-18 11:04 max_xbw 阅读(744) 评论(0) 推荐(0)

2015年8月14日

【PRML读书笔记-Chapter1-Introduction】1.5 Decision Theory

摘要：初体验：概率论为我们提供了一个衡量和控制不确定性的统一的框架，也就是说计算出了一大堆的概率。那么，如何根据这些计算出的概率得到较好的结果，就是决策论要做的事情。一个例子：文中举了一个例子：给定一个X射线图x，目标是如何判断这个病人是否得癌症(C1或C2).我们把它看作是一个二分类问题,根据bayes的概率理论模型，我们可以得到：因此，就是的先验概率；（假设Ck表示患病，那么就表示普通人患病的概率）... 阅读全文

posted @ 2015-08-14 14:17 max_xbw 阅读(819) 评论(0) 推荐(0)

2015年8月6日

［科研小记］

摘要：何毓琦教授访谈：年轻人如何做科研关于选题方向选题方向，在这个特定的问题上，我印象很深刻。在刚刚开始接触研究的时候，何老师就指导我们说，选题目有三个问题你要先问一问自己，因为我们是工程学科，是做应用基础研究的，第一个问题是有没有一些实际的工程人员真正关心你要研究的这个问题；第二，你是不是不完全了解这个... 阅读全文

posted @ 2015-08-06 21:51 max_xbw 阅读(234) 评论(0) 推荐(0)

2015年7月24日

【JAVA】"骗人"的“replaceAll”

摘要： Java String类中有个方法叫：replaceAll，从表面上看，他的意思是把所有的regex替换成replacement。1 public String replaceAll(String regex, String replacement) {2 return Pa... 阅读全文

posted @ 2015-07-24 17:49 max_xbw 阅读(286) 评论(0) 推荐(0)

2015年7月8日

【PRML读书笔记-Chapter1-Introduction】1.4 The Curse of Dimensionality

摘要：维数灾难给定如下分类问题：其中x6和x7表示横轴和竖轴（即两个measurements），怎么分？方法一（simple）：把整个图分成；16个格，当给定一个新的点的时候，就数他所在的格子中，哪种颜色的点最多，最多的点就是最有可能的。如图：显然，这种方法是有缺陷的：例子给出的是2维的，那么3维的话，就... 阅读全文

posted @ 2015-07-08 18:52 max_xbw 阅读(549) 评论(0) 推荐(0)

2015年7月7日

聊一聊google的Knowledge Graph

摘要：什么是Knowledge Graph？它是google用于增强它的搜索引擎的功能和提高搜索结果质量的一种技术。在2012年5月16日提出，除了提供基本的与主题相关的链接服务之外，它还能结构化与主题相关的信息。这样做的目的就是让用户无需通过点击多个相关链接自己手动去搜索相关信息，而是google直接把... 阅读全文

posted @ 2015-07-07 17:10 max_xbw 阅读(5773) 评论(0) 推荐(1)

2015年6月18日

【Machine Learning】wekaの特征选择简介

摘要：看过这篇博客的都应该明白，特征选择代码实现应该包括3个部分：因此，代码的一般形式为： AttributeSelection attsel = new AttributeSelection(); // create and initiate a new AttributeSelection inst 阅读全文

posted @ 2015-06-18 15:25 max_xbw 阅读(1334) 评论(0) 推荐(0)

2015年6月16日

【PRML读书笔记-Chapter1-Introduction】1.3 Model Selection

摘要：在训练集上有个好的效果不见得在测试集中效果就好，因为可能存在过拟合(over-fitting)的问题。如果训练集的数据质量很好，那我们只需对这些有效数据训练处一堆模型，或者对一个模型给定系列的参数值，然后再根据测试集进行验证，选择效果最好的即可；大多数情况下，数据集大小是有限的或质量不高，那么需阅读全文

posted @ 2015-06-16 15:30 max_xbw 阅读(365) 评论(0) 推荐(0)

2015年6月11日

【迁移学习】2010-A Survey on Transfer Learning

摘要：资源:http://www.cse.ust.hk/TL/简介:一个例子: 关于照片的情感分析. 源:比如你之前已经搜集了大量N种类型物品的图片进行了大量的人工标记(label),耗费了巨大的人力物力,构建了源情感分类器(即输入一张照片,可以分析出照片的情感).注:这里的情感不是指人物的情感,而是指照... 阅读全文

posted @ 2015-06-11 16:36 max_xbw 阅读(4033) 评论(1) 推荐(0)

2015年6月9日

【Machine Learning】机器学习の特征

摘要：绘制了一张导图,有不对的地方欢迎指正: 下载地址机器学习中,特征是很关键的.其中包括,特征的提取和特征的选择.他们是降维的两种方法,但又有所不同: 特征抽取（Feature Extraction）:Creatting a subset of new features by combinations 阅读全文

posted @ 2015-06-09 12:12 max_xbw 阅读(5121) 评论(0) 推荐(0)

2015年6月5日

【PRML读书笔记-Chapter1-Introduction】1.2 Probability Theory

摘要：一个例子: 两个盒子: 一个红色:2个苹果,6个橘子; 一个蓝色:3个苹果,1个橘子; 如下图: 现在假设随机选取1个盒子,从中.取一个水果,观察它是属于哪一种水果之后,我们把它从原来的盒子中替换掉.重复多次. 假设我们40%的概率选到红盒子,60%的概率选到蓝盒子.并且当我们把取出的水果拿掉时,选择盒子中任何一个水果还是等可能的. 问题: 1.整个过程中,取得苹果的概率有多大? 2.假设已经... 阅读全文

posted @ 2015-06-05 12:15 max_xbw 阅读(1498) 评论(0) 推荐(0)

2015年5月22日

【Software Clone】2014-IEEE-Towards a Big Data Curated Benchmark of Inter-Project Code Clones

摘要： Abstract大数据的克隆检测和搜索算法已经作为嵌入在应用中的一部分.本文推出一个代码检测基准.包含一些已知的真假克隆代码.其中包括600万条真克隆(包含type-1,type-2,type-3,type-4).S1 IntroductionIJaDataset 2.0包含25,000个系统,36... 阅读全文

posted @ 2015-05-22 11:21 max_xbw 阅读(826) 评论(4) 推荐(0)

2015年5月21日

【转】数学之美番外篇：平凡而又神奇的贝叶斯方法----刘未鹏

摘要：概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候，最喜欢到城里的计算机书店里面去闲逛，一逛就是好几个小时；有一次，在书店看到一本书，名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想，一个方法能够专门写出一本书来，肯定很牛逼。后来，我发现当初的那个朴素归纳推理成立了——... 阅读全文

posted @ 2015-05-21 09:13 max_xbw 阅读(498) 评论(0) 推荐(0)

2015年5月20日

【PRML读书笔记-Chapter1-Introduction】1.1 Example:Polynomial Curve Fitting

摘要：书中给出了一个典型的曲线拟合的例子,给定一定量的x以及对应的t值,要你判断新的x对应的t值多少.任务就是要我们去发现潜在的曲线方程:sin(2πx)这时就需要概率论的帮忙,对于这种不确定给t赋何值的情况,它可以通过一种精确和量化的方式来提供一种框架,而对于决策理论,为了根据适当的度量方式来获取最优的... 阅读全文

posted @ 2015-05-20 17:36 max_xbw 阅读(713) 评论(0) 推荐(0)

2015年5月15日

【PRML读书笔记-Chapter1-Introduction】引言

摘要：模式识别领域主要关注的就是如何通过算法让计算机自动去发现数据中的规则,并利用这些规则来做一些有意义的事情,比如说,分类.以数字识别为例,我们可以根据笔画规则启发式教学去解决,但这样效果并不理想.我们一般的做法是: 1,统一尺寸; 2,简化色彩; 3,计算灰度平均值; 4,计算哈希值(生成指纹);当有... 阅读全文

posted @ 2015-05-15 18:17 max_xbw 阅读(311) 评论(0) 推荐(0)

【weka应用技术与实践】过滤器

摘要： weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。今天简单地使用一下过滤器：首先打开一个自带数据集weather.numeric.arff，这是一个关于通过天气条件，气温以及风力等因素来判断是否要play。可以看到：看一下数据的大致情况：红色代表no，蓝色代表yes。问题一：假设我现在要添... 阅读全文

posted @ 2015-05-15 11:39 max_xbw 阅读(1709) 评论(0) 推荐(0)

公告