博客园 - 胡立峰
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=1814
2020-06-02T01:52:21Z
胡立峰
https://www.cnblogs.com/data2value/
feed.cnblogs.com
https://www.cnblogs.com/data2value/p/9760034.html
解析文本文件 "r" 与 "rb" 模式的区别(Python) - 胡立峰
r,rb 那么在读文件时,有无b标识的的主要区别在哪里呢? 1、文件使用方式标识 'r':默认值,表示从文件读取数据。'b':表示要读写二进制数据 2、读文件 进行读文件操作时,直到读到文档结束符(EOF)才算读取到文件最后,Python会认为字节\x1A(26)转换成的字符为文档结束符(EOF),
2018-10-09T06:15:00Z
2018-10-09T06:15:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】r,rb 那么在读文件时,有无b标识的的主要区别在哪里呢? 1、文件使用方式标识 'r':默认值,表示从文件读取数据。'b':表示要读写二进制数据 2、读文件 进行读文件操作时,直到读到文档结束符(EOF)才算读取到文件最后,Python会认为字节\x1A(26)转换成的字符为文档结束符(EOF), <a href="https://www.cnblogs.com/data2value/p/9760034.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/9336572.html
Keras中RNN不定长输入的处理--padding and masking - 胡立峰
在使用RNN based model处理序列的应用中,如果使用并行运算batch sample,我们几乎一定会遇到变长序列的问题。 通常解决变长的方法主要是将过长的序列截断,将过短序列用0补齐到一个固定长度(例如max_length)。 最后由n个sample组成的dataset能形成一个shape
2018-07-19T08:26:00Z
2018-07-19T08:26:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】在使用RNN based model处理序列的应用中,如果使用并行运算batch sample,我们几乎一定会遇到变长序列的问题。 通常解决变长的方法主要是将过长的序列截断,将过短序列用0补齐到一个固定长度(例如max_length)。 最后由n个sample组成的dataset能形成一个shape <a href="https://www.cnblogs.com/data2value/p/9336572.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/9335470.html
实现nlp文本生成中的beam search解码器 - 胡立峰
自然语言处理任务,比如caption generation(图片描述文本生成)、机器翻译中,都需要进行词或者字符序列的生成。常见于seq2seq模型或者RNNLM模型中。 这篇博文主要介绍文本生成解码过程中用的greedy search 和beam search算法实现。其中,greedy sear
2018-07-19T06:36:00Z
2018-07-19T06:36:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】自然语言处理任务,比如caption generation(图片描述文本生成)、机器翻译中,都需要进行词或者字符序列的生成。常见于seq2seq模型或者RNNLM模型中。 这篇博文主要介绍文本生成解码过程中用的greedy search 和beam search算法实现。其中,greedy sear <a href="https://www.cnblogs.com/data2value/p/9335470.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/9327861.html
keras Variable set_value错误解决 - 胡立峰
问题: 如: 报错: AttributeError: 'Variable' object has no attribute 'set_value' 解决办法:
2018-07-18T02:44:00Z
2018-07-18T02:44:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】问题: 如: 报错: AttributeError: 'Variable' object has no attribute 'set_value' 解决办法: <a href="https://www.cnblogs.com/data2value/p/9327861.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6612775.html
centos6.7安装openblas错误 - 胡立峰
# Install OpenBLAS at /usr/local/openblas git clone https://github.com/xianyi/OpenBLAS cd OpenBLAS make -j $(($(nproc) + 1)) sudo make PREFIX=/usr/loc
2017-03-24T10:01:00Z
2017-03-24T10:01:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】# Install OpenBLAS at /usr/local/openblas git clone https://github.com/xianyi/OpenBLAS cd OpenBLAS make -j $(($(nproc) + 1)) sudo make PREFIX=/usr/loc <a href="https://www.cnblogs.com/data2value/p/6612775.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6223188.html
mysql之ALTER COLUMN、CHANGE COLUMN、MODIFY COLUMN的区别 - 胡立峰
ALTER COLUMN:设置或删除列的默认值(操作速度非常快) 例子: CHANGE COLUMN:列的重命名、列类型的变更以及列位置的移动 例子: MODIFY COLUMN:除了不能给列重命名之外,他干的活和CHANGE COLUMN是一样的 例子:
2016-12-26T09:50:00Z
2016-12-26T09:50:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】ALTER COLUMN:设置或删除列的默认值(操作速度非常快) 例子: CHANGE COLUMN:列的重命名、列类型的变更以及列位置的移动 例子: MODIFY COLUMN:除了不能给列重命名之外,他干的活和CHANGE COLUMN是一样的 例子: <a href="https://www.cnblogs.com/data2value/p/6223188.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6220859.html
吞吐量(TPS)、QPS、并发数、响应时间(RT)概念 - 胡立峰
开发的原因,需要对吞吐量(TPS)、QPS、并发数、响应时间(RT)几个概念做下了解,查自百度百科,记录如下:1. 响应时间(RT) 响应时间是指系统对请求作出响应的时间。直观上看,这个指标与人对软件性能的主观感受是非常一致的,因为它完整地记录了整个计算机系统处理请求的时间。由于一个系统通常会提供许
2016-12-25T14:55:00Z
2016-12-25T14:55:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】开发的原因,需要对吞吐量(TPS)、QPS、并发数、响应时间(RT)几个概念做下了解,查自百度百科,记录如下:1. 响应时间(RT) 响应时间是指系统对请求作出响应的时间。直观上看,这个指标与人对软件性能的主观感受是非常一致的,因为它完整地记录了整个计算机系统处理请求的时间。由于一个系统通常会提供许 <a href="https://www.cnblogs.com/data2value/p/6220859.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6107653.html
负载均衡算法的几种常用方案 - 胡立峰
总结下负载均衡的常用方案及适用场景 轮询调度 以轮询的方式依次请求调度不同的服务器;实现时,一般为服务器带上权重;这样有两个好处: 优点:实现简单、高效;易水平扩展; 缺点:请求到目的结点的不确定,造成其无法适用于有写的场景(缓存,数据库写) 应用场景:数据库或应用服务层中只有读的场景; 优点:实现
2016-11-27T14:16:00Z
2016-11-27T14:16:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】总结下负载均衡的常用方案及适用场景 轮询调度 以轮询的方式依次请求调度不同的服务器;实现时,一般为服务器带上权重;这样有两个好处: 优点:实现简单、高效;易水平扩展; 缺点:请求到目的结点的不确定,造成其无法适用于有写的场景(缓存,数据库写) 应用场景:数据库或应用服务层中只有读的场景; 优点:实现 <a href="https://www.cnblogs.com/data2value/p/6107653.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6107450.html
负载均衡算法及手段 - 胡立峰
负载均衡器 可以是专用设备,也可以是在通用服务器上运行的应用程序。 分散请求到拥有相同内容或提供相同服务的服务器。 专用设备一般只有以太网接口,可以说是多层交换机的一种。 负载均衡器一般会被分配虚拟IP地址,所有来自客户端的请求都是针对虚拟IP地址完成的。负载均衡器通过负载均衡算法将来自客户端的请求
2016-11-27T13:32:00Z
2016-11-27T13:32:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】负载均衡器 可以是专用设备,也可以是在通用服务器上运行的应用程序。 分散请求到拥有相同内容或提供相同服务的服务器。 专用设备一般只有以太网接口,可以说是多层交换机的一种。 负载均衡器一般会被分配虚拟IP地址,所有来自客户端的请求都是针对虚拟IP地址完成的。负载均衡器通过负载均衡算法将来自客户端的请求 <a href="https://www.cnblogs.com/data2value/p/6107450.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6107380.html
负载均衡手段之DNS轮询 - 胡立峰
大多数域名注册商都支持对统一主机添加多条A记录,这就是DNS轮询,DNS服务器将解析请求按照A记录的顺序,随机分配到不同的IP上,这样就完成了简单的负载均衡。下图的例子是:有3台联通服务器、3台电信服务器,要实现“联通用户流量分摊到3台联通服务器、其他用户流量分摊到电信服务器”这个效果的设置。 DN
2016-11-27T13:15:00Z
2016-11-27T13:15:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】大多数域名注册商都支持对统一主机添加多条A记录,这就是DNS轮询,DNS服务器将解析请求按照A记录的顺序,随机分配到不同的IP上,这样就完成了简单的负载均衡。下图的例子是:有3台联通服务器、3台电信服务器,要实现“联通用户流量分摊到3台联通服务器、其他用户流量分摊到电信服务器”这个效果的设置。 DN <a href="https://www.cnblogs.com/data2value/p/6107380.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/6106965.html
快速了解负载均衡 - 胡立峰
负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。常见互联网分布式架构如上,分为客户端层、反向代理nginx层、站点层、服务层、数据层。 什么是负载均衡 负载均衡(Load Balanc
2016-11-27T10:37:00Z
2016-11-27T10:37:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。常见互联网分布式架构如上,分为客户端层、反向代理nginx层、站点层、服务层、数据层。 什么是负载均衡 负载均衡(Load Balanc <a href="https://www.cnblogs.com/data2value/p/6106965.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5707973.html
拼写纠错的利器,BK树算法 - 胡立峰
BK树或者称为Burkhard-Keller树,是一种基于树的数据结构,被设计于快速查找近似字符串匹配,比方说拼写纠错,或模糊查找,当搜索”aeek”时能返回”seek”和”peek”。 本文首先剖析了基本原理,并在后面给出了Java源码实现。 BK树在1973年由Burkhard和Keller第一
2016-07-26T13:02:00Z
2016-07-26T13:02:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】BK树或者称为Burkhard-Keller树,是一种基于树的数据结构,被设计于快速查找近似字符串匹配,比方说拼写纠错,或模糊查找,当搜索”aeek”时能返回”seek”和”peek”。 本文首先剖析了基本原理,并在后面给出了Java源码实现。 BK树在1973年由Burkhard和Keller第一 <a href="https://www.cnblogs.com/data2value/p/5707973.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5579472.html
解决No enclosing instance of type * is accessible - 胡立峰
写一个内部类,并在构造函数中初始化时,遇到报错,搜索问题后发现,有网友出现过类似的问题,下面这个是说的浅显明白的,并确实解决了问题。于是,以下内容照搬过来,不再多费键盘了。 上面两个语句报错信息如下: 在overflow上面查找到了类似的问题:http://stackoverflow.com/que
2016-06-13T01:15:00Z
2016-06-13T01:15:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】写一个内部类,并在构造函数中初始化时,遇到报错,搜索问题后发现,有网友出现过类似的问题,下面这个是说的浅显明白的,并确实解决了问题。于是,以下内容照搬过来,不再多费键盘了。 上面两个语句报错信息如下: 在overflow上面查找到了类似的问题:http://stackoverflow.com/que <a href="https://www.cnblogs.com/data2value/p/5579472.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5553641.html
文本聚类算法总结 - 胡立峰
以下内容为聚类介绍,除了红色的部分,其他来源百度百科,如果已经了解,可以直接忽略跳到下一部分。 聚类概念 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Mea
2016-06-02T08:54:00Z
2016-06-02T08:54:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】以下内容为聚类介绍,除了红色的部分,其他来源百度百科,如果已经了解,可以直接忽略跳到下一部分。 聚类概念 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Mea <a href="https://www.cnblogs.com/data2value/p/5553641.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5504201.html
一篇不错的Gibbs Sampling解释文章,通俗易懂 - 胡立峰
http://cos.name/2013/01/lda-math-mcmc-and-gibbs-sampling/ 直接原文的链接了。原文写的不错,是中文博客中说的比较明白的了。 但为了保留文章,随转载如下(图片格式)。
2016-05-18T02:11:00Z
2016-05-18T02:11:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】http://cos.name/2013/01/lda-math-mcmc-and-gibbs-sampling/ 直接原文的链接了。原文写的不错,是中文博客中说的比较明白的了。 但为了保留文章,随转载如下(图片格式)。 <a href="https://www.cnblogs.com/data2value/p/5504201.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5468541.html
Science发表的超赞聚类算法 - 胡立峰
作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定. 算法思想 该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大. 首先定义两个值: 局部密度
2016-05-07T08:09:00Z
2016-05-07T08:09:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定. 算法思想 该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大. 首先定义两个值: 局部密度 <a href="https://www.cnblogs.com/data2value/p/5468541.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5457366.html
Kaggle Challenge简要介绍 - 胡立峰
https://en.wikipedia.org/wiki/Kaggle 以下内容,直接摘自维基百科,主要起到一个记录的作用,提醒自己有时间关注关注这个竞赛。 Kaggle is a platform for predictive modelling and analytics competitio
2016-05-04T01:49:00Z
2016-05-04T01:49:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】https://en.wikipedia.org/wiki/Kaggle 以下内容,直接摘自维基百科,主要起到一个记录的作用,提醒自己有时间关注关注这个竞赛。 Kaggle is a platform for predictive modelling and analytics competitio <a href="https://www.cnblogs.com/data2value/p/5457366.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5435686.html
LSA和pLSA的比较 - 胡立峰
Comparison 1. LSA stems from Linear Algebra as it is nothing more than a Singular Value Decomposition. On the other hand, pLSA has a strong probabilis
2016-04-26T08:47:00Z
2016-04-26T08:47:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】Comparison 1. LSA stems from Linear Algebra as it is nothing more than a Singular Value Decomposition. On the other hand, pLSA has a strong probabilis <a href="https://www.cnblogs.com/data2value/p/5435686.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5432293.html
深度学习入门方法讨论--摘自知乎 - 胡立峰
专业主义,test 知乎用户、P.Chao、岳聪 等人赞同 Github 上有同学总结了一份 机器学习和深度学习资料列表 ,共两篇,总计接近 1000 条。原文第一篇如下:Qix/dl.md at master · ty4z2008/Qix · GitHub 机器学习(Machine Learnin
2016-04-25T10:50:00Z
2016-04-25T10:50:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】专业主义,test 知乎用户、P.Chao、岳聪 等人赞同 Github 上有同学总结了一份 机器学习和深度学习资料列表 ,共两篇,总计接近 1000 条。原文第一篇如下:Qix/dl.md at master · ty4z2008/Qix · GitHub 机器学习(Machine Learnin <a href="https://www.cnblogs.com/data2value/p/5432293.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/data2value/p/5419927.html
Python机器学习库和深度学习库总结 - 胡立峰
我们在Github上的贡献者和提交者之中检查了用Python语言进行机器学习的开源项目,并挑选出最受欢迎和最活跃的项目。 1. Scikit-learn(重点推荐) www.github.com/scikit-learn/scikit-learn Scikit-learn 是基于Scipy为机器学习
2016-04-22T01:00:00Z
2016-04-22T01:00:00Z
胡立峰
https://www.cnblogs.com/data2value/
【摘要】我们在Github上的贡献者和提交者之中检查了用Python语言进行机器学习的开源项目,并挑选出最受欢迎和最活跃的项目。 1. Scikit-learn(重点推荐) www.github.com/scikit-learn/scikit-learn Scikit-learn 是基于Scipy为机器学习 <a href="https://www.cnblogs.com/data2value/p/5419927.html" target="_blank">阅读全文</a>