2020年2月24日

【ML】从Titannic说起一个完整机器学习的7步骤

摘要: 一个机器学习主要要经过如下几步: 这么一讲比较抽象,我拿Kaggle比赛中的泰坦尼克生存率预测为例子: 收集数据:https://github.com/cystanford/Titanic_Data 该数据集一共有俩个文件: train.csv:训练集,包含特征信息,分类结果(存活与否) test. 阅读全文

posted @ 2020-02-24 21:36 雪原那么远 阅读(344) 评论(0) 推荐(0)

【MF】SVD

摘要: 矩阵分解是推荐系统的主流思想之一,它的思想是把矩阵拆解为多个矩阵的乘积。 矩阵分解有俩种方法,分别是 EVD(特征值分解) 和 SVD(奇异值分解),在推荐系统中许多矩阵是非对称的,而且不是方阵,所以通常在应用过程中采用SVD。 如图所示,我们可以认为A是uer/iterm矩阵,通过矩阵分解,我们可 阅读全文

posted @ 2020-02-24 10:44 雪原那么远 阅读(377) 评论(0) 推荐(0)

2020年2月14日

【Java】内存

摘要: 1.当使用直接赋值的方式实例化一个字符串对象的时候,他的引用是保存在哪里的? 首先要明确一点,只要是引用对象就保存在堆内存里面,而我们所有能够进行的内存控制,也只有堆内存。 JVM内存优化: 1.JVM内存优化的第一个问题,取消掉伸缩区,让total = max -CMS问题,频繁的CMD会导致性能 阅读全文

posted @ 2020-02-14 20:18 雪原那么远 阅读(137) 评论(0) 推荐(0)

2020年2月13日

【数据库】Mysql压缩包安装

摘要: 下载地址: https://dev.mysql.com/downloads/mysql/ 在我下载了mysql以后,我发现我下载的是zip文件,并不能直接使用,则需要做一些额外操作。 1.解压到你希望安装的mysql的目录下,进入mysql文件夹,在文件夹下创建“ 一个文件夹 data 一个配置文件 阅读全文

posted @ 2020-02-13 19:43 雪原那么远 阅读(149) 评论(0) 推荐(0)

2020年1月12日

【Pythoin】Flask简单教程

摘要: Flask是一个简单的Python Web开发框架,比Django小巧许多。写这一篇的目的是存一个以后能够快速上线的baseline。 下面是一个简单的Demo演示,附上注释。 #-*- coding:utf-8 -*- #导入Flask扩展 from flask import Flask #创建F 阅读全文

posted @ 2020-01-12 22:41 雪原那么远 阅读(261) 评论(0) 推荐(0)

2020年1月3日

【算法】动态规划

摘要: 在开始学习动态规划的时候我总有这些问题:动态规划能解决什么问题?解决动态规划的思考过程是怎么样的?贪心、分治、回溯、动态规划这四种算法之间有什么区别和联系? 在解决这些问题之前,我要提一个理论:“一个模型三个特征”,即“多阶段决策最优解”模型,“最优子结构”、“无后效性”、“重复子问题”特征。 1. 阅读全文

posted @ 2020-01-03 09:44 雪原那么远 阅读(132) 评论(0) 推荐(0)

2019年12月19日

【算法】红黑树

摘要: 在学习红黑树的时候,我发现很多博客都没有把红黑树讲清楚,于是我就去wikipedia看红黑树的定义。中文网站(链接)介绍的红黑树总有机翻的味道,介绍的不是特别清楚,我在这里拿英文网站(链接)配套的做一下介绍。可能会有大段文字絮絮叨叨,但是我都是尽可能地把思路理了出来。 红黑树: 是一种自平衡的二叉查 阅读全文

posted @ 2019-12-19 23:15 雪原那么远 阅读(250) 评论(0) 推荐(0)

2019年11月29日

【Python】read() readline() readlines() 的比较

摘要: Python内置的读写文件的函数,底层实现还是C。 读文件函数结构: 要用读文件模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标识符。 "r"表示读文件,如果文件不存在,就会抛出错误码和详细的信息。 如果文件打开成功,可以使用读取)函数一次读取文件的全部内容,以read( 阅读全文

posted @ 2019-11-29 16:04 雪原那么远 阅读(1722) 评论(0) 推荐(0)

【Python】DataFrame 查看数据

摘要: DataFrame 是 Python 中的一种数据结构,类似 excel,是一种二维表,其单元个可以存放各种数据类型的数据。同时 DataFrame 可以设置列名 columns 和行名 index 对数据进行定位。 现以xlsx表为例: 读取参数为: DataFrame 数据如下: 以下代码供参考 阅读全文

posted @ 2019-11-29 12:10 雪原那么远 阅读(8130) 评论(0) 推荐(0)

【Python】Pandas读取 excel

摘要: CSV和EXCEL: excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 "," 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英 阅读全文

posted @ 2019-11-29 11:35 雪原那么远 阅读(934) 评论(0) 推荐(0)

导航