上一页 1 ··· 62 63 64 65 66 67 68 69 70 ··· 73 下一页
摘要: PCA算法 主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理等。PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为主成分。主成分能够尽可能保留原始数据的信息。PCA的计算涉及 阅读全文
posted @ 2020-04-14 20:23 Picassooo 阅读(5330) 评论(2) 推荐(0)
摘要: numpy array之间可以直接相减: numpy array之间可以直接相加,numpy array也可以和一个标量直接相加: import numpy as np a = np.ones((2, 3)) b = np.array([[5]]) print(a+b) # array([[6., 阅读全文
posted @ 2020-04-14 12:06 Picassooo 阅读(8662) 评论(0) 推荐(0)
摘要: 数据什么时候需要做中心化和标准化处理? 阅读全文
posted @ 2020-04-14 11:41 Picassooo 阅读(563) 评论(0) 推荐(0)
摘要: 在上一篇博客中,我们介绍了爬高校排名的爬虫程序,本篇博客我们将介绍爬股票数据的程序。 程序来源:中国大学MOOC网《网络爬虫与信息提取课程》。 程序目的:获取上交所和深交所的部分股票信息,输出到文件。 读懂以下程序需提前了解requests库、BeautifulSoup库和re库,在《网络爬虫与信息 阅读全文
posted @ 2020-04-10 01:17 Picassooo 阅读(2622) 评论(0) 推荐(0)
摘要: 本文摘自《Python网络爬虫与信息提取》第十一单元的第二个视频 阅读全文
posted @ 2020-04-09 12:53 Picassooo 阅读(148) 评论(0) 推荐(0)
摘要: 程序来源:中国大学MOOC网《网络爬虫与信息提取课程》。 程序目的:获取大学排名网页内容,并格式化输出。 读懂以下程序需提前了解requests库和BeautifulSoup库,在《网络爬虫与信息提取课程》有提供相关知识。 from bs4 import BeautifulSoup import b 阅读全文
posted @ 2020-04-06 19:19 Picassooo 阅读(595) 评论(0) 推荐(0)
摘要: 1. 什么是正则表达式 正则表达式是用来简洁表达一组字符串的表达式,常用于检查文本中是否含有指定的特征词、找出文中匹配特征词的位置、从文本中提取信息。Python中的re库是用来实现正则表达式操作的,并且该库采用raw string来表达正则表达式。 1.1. re.findall()将符合规则的字 阅读全文
posted @ 2020-04-03 11:37 Picassooo 阅读(574) 评论(0) 推荐(0)
摘要: unicodedata python unicodedata用法 阅读全文
posted @ 2020-04-02 22:38 Picassooo 阅读(599) 评论(0) 推荐(0)
摘要: 信息量,熵,KL散度,交叉熵,JS散度,Wasserstein距离,WGAN中对KL散度和JS散度的描述 阅读全文
posted @ 2020-03-31 11:28 Picassooo 阅读(277) 评论(0) 推荐(0)
摘要: 生成对抗网络是一个关于数据的生成模型:即给定训练数据,GANs能够估计数据的概率分布,基于这个概率分布产生数据样本(这些样本可能并没有出现在训练集中)。 GAN中,两个神经网络互相竞争。给定训练集X,假设是几千张猫的图片。将一个随机向量输入给生成器G(x),让G(x)生成和训练集类似的图片。判别器D 阅读全文
posted @ 2020-03-30 22:44 Picassooo 阅读(5966) 评论(0) 推荐(0)
上一页 1 ··· 62 63 64 65 66 67 68 69 70 ··· 73 下一页