摘要: 以下文章来源于Python编程时光 ,作者Peter 今天给大家推荐一个可视化神器 - Plotly_express ,上手非常的简单,基本所有的图都只要一行代码就能绘出一张非常酷炫的可视化图。以下是这个神器的详细使用方法,文中附含大量的 GIF 动图示例图。 1. 环境准备 本文的是在如下环境下测 阅读全文
posted @ 2021-01-21 15:49 Mangnolia 阅读(2240) 评论(0) 推荐(0) 编辑
摘要: 这周接到任务,要爬取CSDN论坛的各种信息,解析URL的时间花了很久,还改了好多乱七八糟的BUG。csdn的页面也有问题,比如可以转到帖子的下一页,但是页面为空;以及用户页面404等等。林林总总改了许多,代码如下。 有些调试的时候注释掉的代码,大家看看就行,懒得再改了哈哈哈 首先是用peewee建立 阅读全文
posted @ 2020-11-20 17:00 Mangnolia 阅读(192) 评论(0) 推荐(1) 编辑
摘要: Reference: [1] Mean shift: A robust approach toward feature space analysis, PAMI, 2002 [2] mean shift,非常好的ppt ,百度文库链接 [3] Pattern Recognition and Mach 阅读全文
posted @ 2020-11-03 14:00 Mangnolia 阅读(528) 评论(0) 推荐(0) 编辑
摘要: """ *************************** @Project :正则 @Author :majun @Date : 2020/10/29 10:41 ******************************* """ import re #1.匹配 aaa.aaa.aaa.a 阅读全文
posted @ 2020-11-02 09:17 Mangnolia 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 在机器学习中,无监督学习一直是我们追求的方向,而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段,它们能利用大量的未标注数据构建强大的主题聚类。本文从最基础的 K 均值聚类到基于密度的强大方法介绍了 6 类主流方法,它们各有擅长领域与情景,且 阅读全文
posted @ 2020-10-14 16:58 Mangnolia 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 背景 在外实习的时候接到了公司给的毕业设计题目,其中数据由我们组老大帮忙爬取并存入数据库中,我负责做聚类算法分析。 花了24h将所有图片下载完成后,我提取其中200份(现阶段先运行一遍后可能会增加一些)并使用labellmg为图片打上标签,作为训练集。 前置需求 1、首先安装配置好TensorFlo 阅读全文
posted @ 2020-09-24 17:49 Mangnolia 阅读(736) 评论(1) 推荐(2) 编辑
摘要: import random from random import choice as choice import mysql.connector import string def Create_Name(): first_name = ['赵',"钱","孙","李","王","林"] secon 阅读全文
posted @ 2020-09-14 16:10 Mangnolia 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 机器学习TensorFlow TensorFlow是用于机器学习的端到端开源平台。它具有工具, 库和 社区资源的全面,灵活的生态系统 ,可让研究人员推动ML领域的最新发展,并使开发人员轻松构建和部署ML支持的应用程序。 TensorFlow最初是由Google机器智能研究组织内Google Brai 阅读全文
posted @ 2020-09-14 15:21 Mangnolia 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 这个作业属于哪个课程软件工程 这个作业要求在哪里 个人总结 作业正文 如下 回首过往,以往鉴来。 四个月前,还未正式开学的我接到了第一次正式的软件工程的作业,也就是让好多同学叫苦不迭的《中文编程实践》。这个作业同样也让我颇为头疼,在综合查询多方代码以及各位同学的思路后,还是琢磨出了一点门道,如果有兴 阅读全文
posted @ 2020-06-14 20:29 Mangnolia 阅读(637) 评论(8) 推荐(3) 编辑
摘要: 实验目标 对数据集做数据预处理以便可以进行后续的机器学习。具体包括通过多种方式处理缺失值、将变量转为数值类型,使用机器学习模型填充缺失值,数据shuffle和持久化。 实验要求 完成对数据集缺失值的处理 完成对数据集非数值变量的转换 完成对数据集的标准化 保存预处理后的数据集 实验过程 变量介绍 银 阅读全文
posted @ 2020-06-14 13:12 Mangnolia 阅读(4194) 评论(8) 推荐(1) 编辑
摘要: 实验2:数据探索与分析 实验目标:对葡萄牙银行数据集的特征之间的关联关系进行分析和探索,对于现有营销方案给出建议。 完成时间:1.5小时(实验),0.5小时(实验报告) 实验要求: 分析不同因素取值对营销结果的影响。 相关度矩阵以热力图方式观察不同变量对于营销结果的影响高低 通过观察两个相关变量与营 阅读全文
posted @ 2020-04-22 00:03 Mangnolia 阅读(4348) 评论(0) 推荐(0) 编辑
摘要: 实验 实验目标:对葡萄牙银行数据集做简单的观察与探索 完成时间:1小时(实验),0.5小时(实验报告) 实验要求: 查看数据的基本情况。 观察所有分类变量的取值情况,并且进行数据可视化 观察所有数值变量的数值分布情况,并且进行数据可视化 项目背景 本项目背景是基于葡萄牙银行电话营销数据的基础上,通过 阅读全文
posted @ 2020-04-14 17:30 Mangnolia 阅读(4995) 评论(3) 推荐(3) 编辑