摘要: 写在前面 最近在写论文过程中,研究了一些关于概率统计的算法,也从网上收集了不少资料,在此整理一下与各位朋友分享。 隐马尔可夫模型,简称HMM(Hidden Markov Model), 是一种基于概率的统计分析模型,用来描述一个系统隐性状态的转移和隐性状态的表现概率。 本文适用于对HMM感兴趣的入门阅读全文
posted @ 2017-03-05 12:56 北岛知寒 阅读(3450) 评论(3) 编辑
摘要: 数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境。 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡。 比较了常用的读写分离方式,推荐mycat,社区活跃,性能稳定。 测试环境 MYSQL版本:Server vers阅读全文
posted @ 2016-10-16 17:53 北岛知寒 阅读(4012) 评论(22) 编辑
摘要: Jetty 基本架构 Jetty目前的是一个比较被看好的 Servlet 引擎,它的架构比较简单,也是一个可扩展性和非常灵活的应用服务器。它有一个基本数据模型,这个数据模型就是 Handler(处理器),所有可以被扩展的组件都可以作为一个 Handler,添加到 Server 中,Jetty 就是帮阅读全文
posted @ 2016-08-03 22:38 北岛知寒 阅读(16853) 评论(3) 编辑
摘要: 当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息。 模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容。 实现微博登录的方法有很多,一般我们在模拟登录时首选WAP版。 因为PC版网页源码中包括很多的js代码,提交的内容也更多,不适合机器模拟登录阅读全文
posted @ 2016-03-01 19:49 北岛知寒 阅读(6735) 评论(13) 编辑
摘要: 一.反向代理 我们都知道,80端口是web服务的默认端口,其他主机访问web服务器也是默认和80端口进行web交互,而一台服务器也只有一个80端口,这是约定俗成的标准. 我们来看下面两个场景: 1.服务器的80端口被占用了,我们想实现服务器的其他端口(比如port:2368)web服务. 2.我们想阅读全文
posted @ 2016-01-18 00:43 北岛知寒 阅读(7611) 评论(0) 编辑
摘要: 写在前面 自入手KWP3以来,倒是抽出不少时间阅读。在写这篇笔记的时候,我已经是第二次拜读此书。与这本书的邂逅是暑假在微博上看到李开复老师推荐此书,正好金山网络的曹钦学长要我帮了一个小忙,硬说要谢谢我,推辞不成就和他说送我这套书吧,他爽快的答应了。 拿到书后看到学长写在前页的叙言,很受鼓励,自此一发阅读全文
posted @ 2016-01-13 16:15 北岛知寒 阅读(3752) 评论(0) 编辑
摘要: 泛型编程就是以独立于任何特定类型的方式编写代码,而模板是C++泛型编程的基础. 所谓template,是针对“一个或多个尚未明确的类型”所编写的函数或类. 使用template时,可以显示的或隐示的将类型当作参数来传递. 下面是一个典型的例子,传回两数中的较大者: 在这里,第一行将T定义为任意数据类阅读全文
posted @ 2015-11-26 13:06 北岛知寒 阅读(3174) 评论(0) 编辑
摘要: 写在前面 所谓异常处理,即让一个程序运行时遇到自己无法处理的错误时抛出一个异常,希望调用者可以发现处理问题. 异常处理的基本思想是简化程序的错误代码,为程序键壮性提供一个标准检测机制. 也许我们已经使用过异常,但是你习惯使用异常了吗? 现在很多软件都是n*365*24小时运行,软件的健壮性至关重要.阅读全文
posted @ 2015-11-09 23:33 北岛知寒 阅读(5922) 评论(4) 编辑
摘要: CRB and Candies Problem's Link Mean: 给定一个数n,求LCM(C(n,0),C(n,1),C(n,2)...C(n,n))的值,(n<=1e6). analyse: 很有趣的一道数论题! 看了下网上别人的做法,什么Kummer定理我还真没听说过,仔细研究一下那个鬼阅读全文
posted @ 2015-08-21 16:41 北岛知寒 阅读(2245) 评论(6) 编辑
摘要: 写在前面 最近无意中看到了这个数据结构,顺便也就学习了一下。 而且发现网上关于这个算法的描述有很多地方是错的,在这里做了一些更正。 处理字符串的算法很多: KMP,E-KMP,AC自动机,后缀三兄弟:后缀树、后缀数组、后缀自动机,Trie树、Trie图,符串hash... 但以上数据结构在处理回文串阅读全文
posted @ 2015-08-19 15:38 北岛知寒 阅读(6507) 评论(3) 编辑
摘要: What's Aho-Corasick automaton? 一种多模式串匹配算法,该算法在1975年产生于贝尔实验室,是著名的多模式匹配算法之一。 简单的说,KMP用来在一篇文章中匹配一个模式串;但如果有多个模式串,需要在一篇文章中把出现过的模式串都匹配出来,就需要Aho-Corasick aut阅读全文
posted @ 2014-09-30 23:18 北岛知寒 阅读(4331) 评论(0) 编辑
摘要: 写在前面 在字符串处理当中,后缀树和后缀数组都是非常有力的工具。 其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料。 其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现, 能够实现后缀树的很多功能而时间复杂度也不太逊色,并且,它比后缀树所占用的空间小很多。 可以说,在信息阅读全文
posted @ 2014-09-23 16:23 北岛知寒 阅读(6554) 评论(0) 编辑
摘要: 概述 在机器学习领域,主要有三类不同的学习方法: 监督学习(Supervised learning) 非监督学习(Unsupervised learning) 半监督学习(Semi-supervised learning) 定义 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函阅读全文
posted @ 2017-05-03 23:31 北岛知寒 阅读(293) 评论(0) 编辑
摘要: 前言 在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。 本质区别 分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。 定量输出称为回归,或者说是连续变量预测; 定性输出称为分类,或者说是离散阅读全文
posted @ 2017-05-03 17:02 北岛知寒 阅读(167) 评论(0) 编辑
摘要: 训练集、验证集和测试集这三个名词在机器学习领域极其常见,但很多人并不是特别清楚,尤其是后两个经常被人混用。 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set),验证集(validation set),测试集(test set)。 Ripley, B.阅读全文
posted @ 2017-04-20 11:48 北岛知寒 阅读(2338) 评论(0) 编辑
摘要: `python notebook`是一个基于浏览器的python数据分析工具,使用起来非常方便,具有极强的交互方式和富文本的展示效果。jupyter是它的升级版,它的安装也非常方便,一般`Anaconda`安装包中会自带。安装好以后直接输入`jupyter notebook`便可以在浏览器中使用。但阅读全文
posted @ 2017-04-19 22:03 北岛知寒 阅读(62) 评论(0) 编辑
摘要: 今天做项目,发现了一个问题,当String作为参数传递的时候,在函数内部改变值对外部的变量值无影响,如下代码: 一开始很不解,后来想明白了,遂去对java参数传递做一个总结,以加深自己的基础知识. 1.基本类型传递 对于: 整型: byte short int long 浮点型 float doub阅读全文
posted @ 2017-03-29 20:14 北岛知寒 阅读(88) 评论(1) 编辑
摘要: 1. git help:帮助 git help xxx git xxx --help 2. git init:初始化 git init 3. git config:配置 常见用法 git config --system:系统级,对所有用户所有项目生效 git config --global:全局级,阅读全文
posted @ 2017-03-26 15:34 北岛知寒 阅读(60) 评论(0) 编辑
摘要: 继Weex之后,阿里在移动技术领域又有开源大动作。 3月13日,手机淘宝安卓客户端容器化框架Atlas正式宣布开源( https://github.com/alibaba/atlas )。Atlas由阿里巴巴移动团队自研,以容器化思路解决大规模团队协作问题,实现并行开发、快速迭代和动态部署,适用于A阅读全文
posted @ 2017-03-13 12:38 北岛知寒 阅读(4112) 评论(6) 编辑
摘要: 据国外网站Ibtimes报道,知名网络安全公司FireEye日前警告称,由于一款名为“JSPatch”、可帮助开发者修改应用程序的软件上存在安全漏洞,导致苹果应用商店内1000多款使用了该框架的iOS应用处于黑客攻击危险之中。FireEye称,在苹果iOS应用商店内有1220款应用可能会受此影响。F阅读全文
posted @ 2017-03-08 12:08 北岛知寒 阅读(404) 评论(4) 编辑
摘要: 写在前面 最近在写论文过程中,研究了一些关于概率统计的算法,也从网上收集了不少资料,在此整理一下与各位朋友分享。 隐马尔可夫模型,简称HMM(Hidden Markov Model), 是一种基于概率的统计分析模型,用来描述一个系统隐性状态的转移和隐性状态的表现概率。 本文适用于对HMM感兴趣的入门阅读全文
posted @ 2017-03-05 12:56 北岛知寒 阅读(3450) 评论(3) 编辑
摘要: struts2的框架结构图 工作流程 1、客户端请求一个HttpServletRequest的请求,如在浏览器中输入http://localhost: 8080/bookcode/Reg.action就是提交一个(HttpServletRequest)请求。2、这个请求经过一系列的过滤器(Filte阅读全文
posted @ 2016-12-06 10:10 北岛知寒 阅读(156) 评论(0) 编辑
摘要: 最近项目中遇到不少NIO相关知识,之前对这块接触得较少,算是我的一个盲区,打算花点时间学习,简单做一点个人学习总结。 简介 NIO(New IO)是JDK1.4以后推出的全新IO API,相比传统IO方式NIO采用了全新的底层I/O模型。传统IO的设计概念是面向流,而NIO则是面向块。简单点说,传统阅读全文
posted @ 2016-10-29 15:25 北岛知寒 阅读(498) 评论(7) 编辑
摘要: 数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境。 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡。 比较了常用的读写分离方式,推荐mycat,社区活跃,性能稳定。 测试环境 MYSQL版本:Server vers阅读全文
posted @ 2016-10-16 17:53 北岛知寒 阅读(4012) 评论(22) 编辑
摘要: 阅读前提 了解JUnit 对JUnit的内部实现有兴趣 不妨看看[深入JUnit] @Before, @After, @Test的秘密] 了解JUnit 对JUnit的内部实现有兴趣 不妨看看[深入JUnit] @Before, @After, @Test的秘密] 代码版本: junit 4.12代阅读全文
posted @ 2016-10-08 21:04 北岛知寒 阅读(210) 评论(0) 编辑
摘要: 项目名称:HandyJSON 项目地址:https://github.com/alibaba/handyjson 背景 JSON是移动端开发常用的应用层数据交换协议。最常见的场景便是,客户端向服务端发起网络请求,服务端返回JSON文本,然后客户端解析这个JSON文本,再把对应数据展现到页面上。 但在阅读全文
posted @ 2016-10-02 18:40 北岛知寒 阅读(3655) 评论(0) 编辑
摘要: 由于业务逻辑的需要,必须对数据表的一行或多行加入行锁,举个最简单的例子,图书借阅系统:假设id=1的这本书库存为1,但是有2个人同时来借这本书,此处的逻辑为: SELECT restnum FROM book WHERE id =1 ; --如果restnum大于0,执行update UPDATE 阅读全文
posted @ 2016-09-29 20:49 北岛知寒 阅读(186) 评论(0) 编辑