摘要: Python 黑魔法(持续收录) zip 对矩阵进行转置 zip 反转字典 将list分成n份 all & any 函数 all :如果iterable的所有元素不为0、''、False或者iterable为空,all(iterable)返回True,否则返回False any : 如果所有元素中有阅读全文
posted @ 2017-03-31 17:26 狂徒归来 阅读(180) 评论(1) 编辑
摘要: CodeBlocks X64 SVN 编译版 采用官方最新的SVN源码编译而来,纯64位的,所以32位系统是不能使用的。字体使用的是微软的YaHei UI字体,如果有更好的字节建议,可以留言。由于直接使用最新的SVN源码,故版本往往会比官方的Nightly Build版还要新。请在家长的陪同下...阅读全文
posted @ 2015-05-19 13:52 狂徒归来 阅读(472) 评论(2) 编辑
摘要: Build Code::Blocks源码 ---By 狂徒归来 CodeBlocks是一款非常优秀的IDE!可惜的是没有64位的版本,而且本来是轻量级别的IDE就应该够轻,能够像记事本工具一样,迅速启动!更悲催的是Code::Blocks的正式版更新周期太长了,这一点比起...阅读全文
posted @ 2015-05-06 17:15 狂徒归来 阅读(530) 评论(3) 编辑
摘要: 使用UltraEdit搭建自己的C/C++ IDE CodeBlocks的13.12版本啊,主要缺点是启动慢,而且在Windows上容易假死,写着写着就无响应了,然后死活活不过来。所以没办法,只好干脆使用UltraEdit搭建自己的轻量级IDE。 需要的软件有GCC 5.0 、Astyle和Ul...阅读全文
posted @ 2015-04-16 13:51 狂徒归来 阅读(111) 评论(0) 编辑
摘要: GCC 6.1x Compilers 下载地址1: Mingw gcc 6.30下载 这个是某微软员工编译的版本 MinGW is a port of GCC to Windows. It is free of charge and simple to use (well, as simple as阅读全文
posted @ 2014-08-14 17:04 狂徒归来 阅读(2021) 评论(5) 编辑
摘要: MCMC 浅谈 1. 采样(sampling)是什么 MCMC在采样算法中有着举足轻重的地位,那么什么是采样? 采样就是根据某种分布生成样本 。举个例子,线性同余发生器就是根据均匀分布生成样本,这就很简单的采样了。 2. 蒙特卡罗算法 假设现在我们有个如下所示的定积分需要进行计算, $$ \thet阅读全文
posted @ 2018-12-14 12:27 狂徒归来 阅读(2) 评论(0) 编辑
摘要: MapReduce 使用案例 MapReduce在面试过程中出现的频率还是挺高的,尤其是数据挖掘等岗位。通常面试官会出一个大数据题目,需要被试者根据题目设计基于MapReduce的算法来解答。我在一个大神的博客中找到相关的MapReduce使用案例,下面将链接分享出来。鉴于目前自身对MapReduc阅读全文
posted @ 2018-12-06 16:37 狂徒归来 阅读(9) 评论(0) 编辑
摘要: 常见数据结构和算法的操作时空复杂度 本篇中的图片截取自其他网站 http://www.bigocheatsheet.com/ ,非自制 首先是各种排序算法的时空复杂度 然后是其他数据结构的各种操作的时间复杂度以及各自的空间复杂度阅读全文
posted @ 2018-12-05 14:50 狂徒归来 阅读(8) 评论(0) 编辑
摘要: Adaboost和GBDT的区别以及xgboost和GBDT的区别 以下内容转自 https://blog.csdn.net/chengfulukou/article/details/76906710 ,本文主要用作记录收藏 AdaBoost VS GBDT 和AdaBoost一样,Gradient阅读全文
posted @ 2018-12-04 20:49 狂徒归来 阅读(14) 评论(0) 编辑
摘要: 布隆过滤器 布隆过滤器在海量数据的处理应用较为广泛,比如,怎么判断一亿个url里面是不是有重复的。布隆过滤器结合了bitmap和hash的思想,bitmap的做法是使用一个bit来表示某个对象是否有出现,但是其所需要的空间跟所处理对象的最大值有关。 布隆过滤器采用$k$个hash函数将对象hash成阅读全文
posted @ 2018-12-03 15:46 狂徒归来 阅读(10) 评论(0) 编辑
摘要: 混淆矩阵、准确率、召回率、ROC曲线、AUC 假设有一个用来对猫(cats)、狗(dogs)、兔子(rabbits)进行分类的系统,混淆矩阵就是为了进一步分析性能而对该算法测试结果做出的总结。假设总共有 27 只动物:8只猫, 6条狗,13只兔子。结果的混淆矩阵如上图所示,我们可以发现,只有主对角线阅读全文
posted @ 2018-11-30 15:29 狂徒归来 阅读(21) 评论(0) 编辑
摘要: backpropagation算法示例 下面举个例子,假设在某个mini batch的有样本X和标签Y,其中$X\in R^{m\times 2}, Y\in R^{m\times 1}$,现在有个两层的网络,对应的计算如下: $$ \begin{split} i_1 &= XW_1+ b_1\\ 阅读全文
posted @ 2018-11-27 21:01 狂徒归来 阅读(11) 评论(0) 编辑
摘要: spaCy 并行分词 在使用spacy的时候,感觉比nltk慢了许多,一直在寻找并行化的方案,好在找到了,下面给出spaCy并行化的分词方法使用示例:阅读全文
posted @ 2018-11-23 16:11 狂徒归来 阅读(22) 评论(0) 编辑
摘要: 点到平面的距离计算 如上图所示,假设现在有一平面$S$ $$ WX+b = 0 $$ 其中$W,X$都是向量,现有平面外一点$Q$,求$Q$到平面的距离。 我们假设平面内有一点$P$,并且平面的法向量为$\overrightarrow{n}=(W_1, W_2, \cdots, W_n)$,那么有$阅读全文
posted @ 2018-11-14 14:04 狂徒归来 阅读(13) 评论(0) 编辑
摘要: Backpropagation Through Time (BPTT) 梯度消失与梯度爆炸 下面的图显示的是RNN的结果以及数据前向流动方向 假设有 $$ \begin{split} h_t &= \tanh W\begin{pmatrix}x_t \\ h_{t 1}\end{pmatrix}\\阅读全文
posted @ 2018-11-14 10:57 狂徒归来 阅读(6) 评论(0) 编辑