Picassooo

2020年4月14日

摘要： PCA算法主成分分析（Principal Component Analysis，PCA）是最常用的一种降维方法，通常用于高维数据集的探索与可视化，还可以用作数据压缩和预处理等。PCA可以把具有相关性的高维变量合成为线性无关的低维变量，称为主成分。主成分能够尽可能保留原始数据的信息。PCA的计算涉及阅读全文

posted @ 2020-04-14 20:23 Picassooo 阅读(5330) 评论(2) 推荐(0)

numpy array之间直接相减和相加

摘要： numpy array之间可以直接相减： numpy array之间可以直接相加，numpy array也可以和一个标量直接相加： import numpy as np a = np.ones((2, 3)) b = np.array([[5]]) print(a+b) # array([[6., 阅读全文

posted @ 2020-04-14 12:06 Picassooo 阅读(8662) 评论(0) 推荐(0)

转：数据为什么要中心化和标准化？

摘要：数据什么时候需要做中心化和标准化处理？阅读全文

posted @ 2020-04-14 11:41 Picassooo 阅读(563) 评论(0) 推荐(0)

2020年4月10日

Python爬虫小实例：爬股票数据

摘要：在上一篇博客中，我们介绍了爬高校排名的爬虫程序，本篇博客我们将介绍爬股票数据的程序。程序来源：中国大学MOOC网《网络爬虫与信息提取课程》。程序目的：获取上交所和深交所的部分股票信息，输出到文件。读懂以下程序需提前了解requests库、BeautifulSoup库和re库，在《网络爬虫与信息阅读全文

posted @ 2020-04-10 01:17 Picassooo 阅读(2622) 评论(0) 推荐(0)

2020年4月9日

Python yield关键字和生成器

摘要：本文摘自《Python网络爬虫与信息提取》第十一单元的第二个视频阅读全文

posted @ 2020-04-09 12:53 Picassooo 阅读(148) 评论(0) 推荐(0)

2020年4月6日

Python爬虫小实例：爬高校排名

摘要：程序来源：中国大学MOOC网《网络爬虫与信息提取课程》。程序目的：获取大学排名网页内容，并格式化输出。读懂以下程序需提前了解requests库和BeautifulSoup库，在《网络爬虫与信息提取课程》有提供相关知识。 from bs4 import BeautifulSoup import b 阅读全文

posted @ 2020-04-06 19:19 Picassooo 阅读(595) 评论(0) 推荐(0)

2020年4月3日

re库和正则表达式

摘要： 1. 什么是正则表达式正则表达式是用来简洁表达一组字符串的表达式，常用于检查文本中是否含有指定的特征词、找出文中匹配特征词的位置、从文本中提取信息。Python中的re库是用来实现正则表达式操作的，并且该库采用raw string来表达正则表达式。 1.1. re.findall()将符合规则的字阅读全文

posted @ 2020-04-03 11:37 Picassooo 阅读(574) 评论(0) 推荐(0)

2020年4月2日

转：python unicodedata用法

摘要： unicodedata python unicodedata用法阅读全文

posted @ 2020-04-02 22:38 Picassooo 阅读(599) 评论(0) 推荐(0)

2020年3月31日

转：信息量，熵，KL散度，交叉熵，JS散度，Wasserstein距离，WGAN中对KL散度和JS散度的描述

摘要：信息量，熵，KL散度，交叉熵，JS散度，Wasserstein距离，WGAN中对KL散度和JS散度的描述阅读全文

posted @ 2020-03-31 11:28 Picassooo 阅读(277) 评论(0) 推荐(0)

2020年3月30日

PyTorch实现简单的生成对抗网络GAN

摘要：生成对抗网络是一个关于数据的生成模型：即给定训练数据，GANs能够估计数据的概率分布，基于这个概率分布产生数据样本（这些样本可能并没有出现在训练集中）。 GAN中，两个神经网络互相竞争。给定训练集X，假设是几千张猫的图片。将一个随机向量输入给生成器G(x)，让G(x)生成和训练集类似的图片。判别器D 阅读全文

posted @ 2020-03-30 22:44 Picassooo 阅读(5966) 评论(0) 推荐(0)

公告