随笔分类 - Python
learning
摘要:一个非常常见的问题就是遇到的数据是多维度数据,维度过高会导致模型极度的复杂,折衷的法案就是降维,然后再Q聚类、分类、回归。降维强调在不损失准确性的前提下来降低维度(选出最优特征) PCA是最常见降维算法,它寻找线性不相关的特征子集(主要因子),另外还有LDA(Linear Discriminant
阅读全文
摘要:Python:电商产品评论数据情感分析,jieba分词,LDA模型
阅读全文
摘要:Python,聚类分析算法介绍,层次聚类算法、Kmeans聚类算法,sklearn模块中聚类方法、scipy模块中聚类方法介绍
阅读全文
摘要:Python:电子商务网站用户行为分析及服务推荐,数据库操作、协同过滤算法
本文主要研究对象是北京某家法律网站,这是家电子商务类大型法律资讯网站,致力为用户提供丰富的法律信息与专业咨询服务,也为律师与律所提供有效的互联网整合营销解决方案,访问量剧增,数据信息量也大幅增长,面对大量信息用户无法及时从中获得自己需要的信息,信息使用效率越来越低;低效的信息供给是无法满足用户需求的,容易流失客户,基于此背景寻求用户行为分析及服务推荐系统开发。
阅读全文
摘要:tensorflow,Kernel died, restarting,解决方案
阅读全文
摘要:基于Python:Lasso方法、GM预测模型、神经网络预测模型之财政收入影响因素分析及预测
阅读全文
摘要:《服务器系统负载分析及磁盘容量预测》,附带代码的学习、注释: 从该问题的分析思路看(有问题找方案):建立磁盘容量使用的预警系统(避免宕机等)——>(问题背景:总容量大小基本不变,使用量根据负载情况变化)预测出某时刻的使用量——>预测使用量占比是否达到预警系统阈值——>根据阈值输出判断信号 从给出的数
阅读全文
摘要:书中介绍太绕,甚至是不清楚的,在此记录一下学习体会! 该例主要讲的是用户洗浴用水事件的识别问题(热水器数据),归结为0-1分类问题——这是全局观 按分析问题大的步骤: 数据探索性分析——>数据规约——>一次用水事件划分及阈值寻优——>特征工程/属性构造——>筛选洗浴事件(?)——>NN-Model
阅读全文
摘要:JQData数据提取及MySQL简单操作——基于Python
阅读全文
摘要:本文代码来之《数据分析与挖掘实战》,在此基础上补充完善了一下~ 代码是基于SVM的分类器Python实现,原文章节题目和code关系不大,或者说给出已处理好数据的方法缺失、源是图像数据更是不见踪影,一句话就是练习分类器(▼㉨▼メ) 源代码直接给好了K=30,就试了试怎么选的,挑选规则设定比较单一,有
阅读全文
摘要:《Python数据分析与挖掘实战》这本书槽点慢慢,代码不全、错误、......此类种种。 文章思路还是有点意思的,稍微折腾、补充练习一下,在此分享一下,希望不吝赐教呢~ REF:在源代码基础上,合并补充,主要供了解函数用。 源代码及数据需要可自取:https://github.com/Luove/D
阅读全文
浙公网安备 33010602011771号