2019 年 12月 30 日随笔档案 - JasonPeng1

2019年12月30日

摘要： pandas入门—基本功能 138页排序和排名根据条件对数据集排序也是一种重要的内置运算。要对行或列索引进行排序（按字典顺序)（a,b,c,d)，可使用sort_index()方法，它将返回一个已排序的新对象：而对于DataFrame，则可以根据任意一个轴上的索引进行排序：数据默认是按升序排阅读全文

posted @ 2019-12-30 11:45 JasonPeng1 阅读(201) 评论(0) 推荐(0)

数据分析入门——探索型数据分析：绘制统计图形展示数据分布

摘要：更详细的资料请看课程的课程资料哦！数据分析的三大类型：探索型：简单点说就是画图验证型预测型探索型：数据收集—>数据处理—>数据清理数据处理和数据清理是通过探索型的图表来进行相互对照，可以进行多次的探索型数据分析作用：通过探索型数据分析可以对下一步进行验证型数据分析以及预测型数据分析起阅读全文

posted @ 2019-12-30 11:44 JasonPeng1 阅读(939) 评论(0) 推荐(0)

数据分析师入门——用 Pandas 进行数据预处理：数据清洗与可视化

摘要：这里只选取视频中的部分，详细资料还是去Datacastle下载看吧数据清理的一些内容：格式转换：比如Excel和数据库中关于时间的记录；它是字符串的格式来进行保存的，如果想对时间进行一些运算的话，就必须利用Python里的一些包。缺失数据：可以说是数据清理的最重要的一个问题。那么，如何应阅读全文

posted @ 2019-12-30 11:43 JasonPeng1 阅读(552) 评论(0) 推荐(0)

《利用Python进行数据分析》---pandas入门

摘要： pandas的数据结构介绍要使用pandas,你首先要熟悉它的两个主要数据结构：Series和DataFrame。虽然它们并不能解决所有问题，但它们为大多数应用提供了一种可靠的、易于使用的基础 Series Series的字符串表现形式为：索引在左，值在右。由于我们没有为数据指定索引，于是会自动创阅读全文

posted @ 2019-12-30 11:42 JasonPeng1 阅读(762) 评论(0) 推荐(0)

《利用Python进行数据分析》---Numpy基础：数组和矢量运算 2

摘要：布尔型索引将使用numpy.random中randn函数来生成一些正态分布的随机数据此外，还可以将布尔型数组跟切片、整数混合使用选取这三个名字中的两个需要组合应用多个布尔条件：使用&、|、之类的布尔运算符即可通过布尔类型索引选取数组中的元素，将总是创建数据的副本，即使返回一模一样的数组也是如阅读全文

posted @ 2019-12-30 11:41 JasonPeng1 阅读(689) 评论(0) 推荐(0)

《利用Python进行数据分析》---Numpy基础：数组和矢量运算

摘要： NumPy的ndarray:一种多维数组对象本章会介绍Numpy的基本用法，虽然大多数数据分析工作不需要深入理解NumPy，但是精通面向数组的编程和思维方式是成为Python科学计算牛人的一大关键步骤创建ndarray 创建数组最简单的方法就是使用array函数。它接受一切序列型的对象（包括其他阅读全文

posted @ 2019-12-30 11:40 JasonPeng1 阅读(332) 评论(0) 推荐(0)

leetCode 穷竭搜索（结合实验楼）

摘要： DFS递归实现：递归的终止条件多种多样。可以用条件语句，也可以用while(),for()循环，本题中是在for()循环中。递归只是单纯的自己调用自己。在DFS中需要回溯。如何确定回溯的表达式很重要。 class Solution { public: vector<vector<int>> sub 阅读全文

posted @ 2019-12-30 11:37 JasonPeng1 阅读(159) 评论(0) 推荐(0)

leetcode 二分查找

摘要：最简单的二分查找。最基层！ class Solution { public: int search(vector<int>& nums, int target) { int left=0; int right=nums.size()-1; while(left<=right){ int mid=le 阅读全文

posted @ 2019-12-30 11:36 JasonPeng1 阅读(382) 评论(0) 推荐(0)

leetcode 字符串

摘要：动态规划问题还不是很会，需要再加深解法1：思路：双指针。两个方法很重要！ isalnum(char c):判断字符变量c是否为字母或数字，若是则返回非零，否则返回零。 tolower(char c):把字母字符转换成小写,非字母字符不做出处理。 class Solution { public: 阅读全文

posted @ 2019-12-30 11:34 JasonPeng1 阅读(256) 评论(0) 推荐(0)

leetcode matrix专题

摘要：参考题解：https://leetcode-cn.com/problems/rotate-image/solution/xuan-zhuan-tu-xiang-by-leetcode/ 解法1：最容易理解 JAVA版 class Solution { public void rotate(int[ 阅读全文

posted @ 2019-12-30 11:32 JasonPeng1 阅读(255) 评论(0) 推荐(0)

jieba 分词+gensim Word2Vec

摘要： https://blog.csdn.net/amao1998/article/details/80366286 #encoding=utf-8 import jieba import jieba.posseg as pseg import re filename='result.txt' filen 阅读全文

posted @ 2019-12-30 11:29 JasonPeng1 阅读(475) 评论(0) 推荐(0)

《机器学习进阶》Udacity 机器学习基础回归

摘要：这样的话，误差就会相等详细的公式本课程不详细介绍。阅读全文

posted @ 2019-12-30 11:28 JasonPeng1 阅读(131) 评论(0) 推荐(0)

《机器学习进阶》Udacity 机器学习基础数据集与问题

摘要：迷你项目：阅读全文

posted @ 2019-12-30 11:27 JasonPeng1 阅读(161) 评论(0) 推荐(0)

《机器学习进阶》Udacity 机器学习基础决策树+迷你项目

摘要： https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier 调整min_samples_split参数可以阅读全文

posted @ 2019-12-30 11:26 JasonPeng1 阅读(239) 评论(0) 推荐(0)

《机器学习进阶》Udacity 机器学习基础异常值+交叉验证

摘要：一般是去除10%左右的数据。 GridSearchCV 用于系统地遍历多种参数组合，通过交叉验证确定最佳效果参数。它的好处是，只需增加几行代码，就能遍历多种组合。下面是来自 sklearn 文档的一个示例： parameters = {'kernel':('linear', 'rbf'), 'C 阅读全文

posted @ 2019-12-30 11:25 JasonPeng1 阅读(190) 评论(0) 推荐(0)

《机器学习进阶》Udacity 机器学习基础评估指标

摘要：选择合适的指标在构建机器学习模型时，我们首先要选择性能指标，然后测试模型的表现如何。相关的指标有多个，具体取决于我们要尝试解决的问题。在可以选择性能指标之前，首先务必要认识到，机器学习研究的是如何学习根据数据进行预测。对于本课程和后续的“监督式机器学习”课程，我们将重点关注那些创建分类或创建预测阅读全文

posted @ 2019-12-30 11:24 JasonPeng1 阅读(150) 评论(0) 推荐(0)

《机器学习进阶》Udacity 监督学习决策树

摘要：这个课程中没有介绍到的：剪枝如何操作？ID3的算法的缺点是什么？如何改进？还有其他的算法没有？什么是基尼系数？和熵，信息增益有什么关系？Sklearn决策树算法中可以调节的参数有哪些？吴恩达：机器学习：https://www.bilibili.com/video/av9912938/?p=60 阅读全文

posted @ 2019-12-30 11:21 JasonPeng1 阅读(194) 评论(0) 推荐(0)

《机器学习进阶》Udacity 监督学习 SVM支持向量机

摘要：为什么要化成这种形式？这就是说明：所以， = = SVM中最重要的是间隔！。阅读全文

posted @ 2019-12-30 11:20 JasonPeng1 阅读(181) 评论(0) 推荐(0)

《机器学习进阶》Udacity 监督学习回归和分类

摘要：阅读全文

posted @ 2019-12-30 11:18 JasonPeng1 阅读(118) 评论(0) 推荐(0)

入门模拟（图形输出）——B1036.跟奥巴马一起编程（注意行数为偶数或奇数的情况）

摘要：注意行数为偶数或奇数的情况 #include <bits/stdc++.h> #include<math.h> using namespace std; const int MAX_LEN = 100005; int main(){ int n; cin>>n; char temp; cin>>te 阅读全文

posted @ 2019-12-30 10:17 JasonPeng1 阅读(221) 评论(0) 推荐(0)

入门模拟——A1036.Boys vs Girls

摘要： #include <bits/stdc++.h> #include<math.h> using namespace std; struct Student{ char name[10]; char gender; char number[10]; int grade; }man,woman; con 阅读全文

posted @ 2019-12-30 09:30 JasonPeng1 阅读(164) 评论(0) 推荐(0)

JasonPeng1

公告