随笔分类 - 机器学习
摘要:引入: 抛硬币1: 有A,B,C三枚硬币,我们想要估计A,B,C三枚硬币抛出正面的概率πA,θB,θC。我们按如下流程进行实验100次: 记录100次实验的结果如下: 抛硬币2: 有些同学可能会提出,虽然我们无法得到三个硬币各自产生的样本,但是我们依然可以得到每个观测值出现的概率。比如在第一次实验中
阅读全文
摘要:XGBoost自动读取数据,判断蘑菇是否有毒 二分类 # /usr/bin/python # -*- encoding:utf-8 -*- # 判断蘑菇是否有毒二分类 import xgboost as xgb import numpy as np # 1、xgBoost的基本使用 # 2、自定义损
阅读全文
摘要:选不同特征建立决策树 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl from sklearn.tree impo
阅读全文
摘要:#!/usr/bin/python # -*- coding:utf-8 -*- # 导入NumPy函数库,一般都是用这样的形式(包括别名np,几乎是约定俗成的) import numpy as np import matplotlib from mpl_toolkits.mplot3d import Axes3D from matplotlib import cm import time f...
阅读全文
摘要:#!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np from sklearn.linear_model import LinearRegression, RidgeCV from sklearn.preprocessing import PolynomialFeatures import matplotlib.pyplot a...
阅读全文
摘要:#!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np from sklearn.linear_model import LogisticRegression import matplotlib.pyplot as plt import matplotlib as mpl from sklearn import preproces...
阅读全文
摘要:#!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import ...
阅读全文
摘要:# -*- coding:utf-8 -*- import numpy as np from scipy import stats import math import matplotlib as mpl import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from matplotlib import ...
阅读全文
摘要:import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl import math #e^x = 1 + x + x^2/2!+... def calc_e_small(x): n = 10 #累乘 cumsum是求和 #1! 2! 3! 4! 5!...10! f =...
阅读全文
摘要:import numpy as np import math #直到主对角线上的值变化很小时,结束循环 def is_same(a,b): print(a) print(b) n = len(a) for i in range(n): if(math.fabs(a[i]-b[i]) > 1e-9): return Fals...
阅读全文
摘要:# -*- coding: utf-8 -*- # Filename : Boltzmann.py import operator from numpy import * import copy import matplotlib.pyplot as plt class BoltzmannNet(object): def __init__(self): self.d...
阅读全文
摘要:1 推荐系统概述 1.1 从亚马逊网站认识推荐系统 首先,推荐系统的算法并不复杂。 从需求的定位上来看,在大多数的情况下,用户的需求很难用简单的关键字来表述,需求通常是来源于不完整的记忆,或者是道听途说等,很少有人能记住不熟悉的产品名称。在这种情况下,如果用传统的搜索引擎技术,基于关键字的查询信息很
阅读全文
摘要:决策树是最早的机器学习算法之一。在1966年提出的CLS学习系统中有了决策树算法的概念,直到1979年才有了ID3算法的原型,1983-1986,ID3算法被进行了总结和简化,正式确立了决策树学习的理论,从机器学习的角度来看,这是决策树算法的起点,1986年,科学家在此基础上进行了改造,引入了节点缓
阅读全文
摘要:前面一个博客我们用Scikit-Learn实现了中文文本分类的全过程,这篇博客,着重分析项目最核心的部分分类算法:朴素贝叶斯算法以及KNN算法的基本原理和简单python实现。 3.1 贝叶斯公式的推导 简单介绍一下什么是贝叶斯: 让我们从一个故事开始。 1 看着后视镜往前开车 想象这么一个场景,我
阅读全文
摘要:这这一篇博客中,将系统介绍中文文本分类的流程和相关算法。先从文本挖掘的大背景开始,以文本分类算法为中心,介绍中文文本分类项目的流程以及相关知识,知识点涉及中文分词,向量空间模型,TF-IDF方法,几个典型的文本分类算法和评价指标等。 本篇主要有: 朴素的贝叶斯算法 KNN最近邻算法。 2.1 文本挖
阅读全文

浙公网安备 33010602011771号