会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
编程浪子-Yiutto
月落乌啼霜满天,江枫渔火对愁眠
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
8
9
下一页
2016年6月2日
Python科学计算(二)windows下开发环境搭建(当用pip安装出现Unable to find vcvarsall.bat)
摘要: 用于科学计算Python语言真的是amazing! 方法一:直接安装集成好的软件 刚开始使用numpy、scipy这些模块的时候,图个方便直接使用了一个叫做Enthought的软件。Enthought是一家位于美国得克萨斯州首府奥斯汀的软件公司,主要使用Python从事科学计算工具的开发。Entho
阅读全文
posted @ 2016-06-02 20:39 编程浪子Yiutto
阅读(1335)
评论(0)
推荐(0)
2016年5月26日
贝叶斯学习1
摘要: 一、什么是贝叶斯推断 贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质。 它是贝叶斯定理(Bayes' theorem)的应用。英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。 贝叶斯推断与其他统计学推
阅读全文
posted @ 2016-05-26 15:11 编程浪子Yiutto
阅读(2914)
评论(0)
推荐(0)
2016年4月27日
Python下科学计算包numpy和SciPy的安装
摘要: Python下大多数工具包的安装都很简单,只需要执行 “python setup.py install”命令即可。然而,由于SciPy和numpy这两个科学计算包的依赖关系较多,安装过程较为复杂。网上教程较为混乱,而且照着做基本都不能用。在仔细研读各个包里的README和INSTALL之后,终于安装
阅读全文
posted @ 2016-04-27 14:16 编程浪子Yiutto
阅读(2187)
评论(2)
推荐(0)
2016年4月14日
从网上或者哪里拷贝下来的代码前面总有编号,如何去掉(原创)
摘要: 从网上或者哪里拷贝下来的代码前面总有编号,如何去掉呢,网上有说用程序的太麻烦,于是,我找到了下面两种方法,share 一下~ 1.使用正则表达式:在editorplus(notepad++)里按ctrl+h,弹出框里勾选上“正则表达式(regular expression)”,然后第一个框里写 ^[
阅读全文
posted @ 2016-04-14 21:15 编程浪子Yiutto
阅读(2307)
评论(0)
推荐(0)
2016年4月13日
python解析xml之lxml
摘要: 虽然python解析xml的库很多,但是,由于lxml在底层是用C语言实现的,所以lxml在速度上有明显优势。除了速度上的优势,lxml在使用方面,易用性也非常好。这里将以下面的xml数据为例,介绍lxml的简单使用。 1、将xml解析为树结构,并得到该树的根。 为了将xml解析为树结构,并得到该树
阅读全文
posted @ 2016-04-13 14:25 编程浪子Yiutto
阅读(13743)
评论(0)
推荐(0)
2016年3月10日
TF/IDF(term frequency/inverse document frequency)
摘要: TF/IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。一. TF/IDF描述单个term与特定document的相关性TF(Term Frequency): 表示一个term与某个document的相关性。公式为:
阅读全文
posted @ 2016-03-10 14:35 编程浪子Yiutto
阅读(1019)
评论(0)
推荐(0)
TF-IDF与余弦相似性的应用(三):自动摘要
摘要: 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。 今天,依然继续这个主题。讨论如何通过词频,对文章进行自动摘要(Automatic summarization)。
阅读全文
posted @ 2016-03-10 11:08 编程浪子Yiutto
阅读(403)
评论(0)
推荐(0)
TF-IDF与余弦相似性的应用(二):找出相似文章
摘要: 上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,
阅读全文
posted @ 2016-03-10 11:07 编程浪子Yiutto
阅读(293)
评论(0)
推荐(0)
TF-IDF与余弦相似性的应用(一):自动提取关键词
摘要: 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一
阅读全文
posted @ 2016-03-10 11:04 编程浪子Yiutto
阅读(320)
评论(0)
推荐(0)
2016年3月8日
R语言绘图002-页面布局
摘要: par()、layout()、split.screen()函数 1. par()函数的参数详解 函数par()可以用来设置或者获取图形参数,par()本身(括号中不写任何参数)返回当前的图形参数设置(一个list);若要设置图形参数,则可用par(tag = value)的形式,其中tag的详细说明参见下面的列,value就是参数值,例如: par(mar = c(4, 4, 1, 0.5)...
阅读全文
posted @ 2016-03-08 20:25 编程浪子Yiutto
阅读(2956)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
下一页
公告