会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
尤克拉
博客园
首页
新随笔
联系
订阅
管理
2020年11月24日
SQL经典45题+答案
摘要: 一、数据准备: 1、创建相关列表 学生表 Student: create table Student(SId varchar(10) ,Sname varchar(10),Sage datetime,Ssex varchar(10)); 教师表 Teacher: create table Teach
阅读全文
posted @ 2020-11-24 12:43 尤克拉
阅读(587)
评论(0)
推荐(0)
2020年11月18日
APP Store用户下载分析
摘要: 分析目的:通过现有APP Store用户下载相关信息分析:1、各类型应用程序数量分布占比;2、各类型App评论人数,哪种类型热评度最高;3、各类型应用中哪款App用户评论人数最多,查看整体TOP3应用App;4、不同价位不同类型App分布情况;5、游戏类App分析;6、腾讯旗下的App表现如何。 分
阅读全文
posted @ 2020-11-18 21:11 尤克拉
阅读(172)
评论(0)
推荐(0)
2020年11月12日
facebook签到位置预测(KNN算法)
摘要: 1、读取数据 所使用数据集来源Kaggle平台,文件大小有1.2G,包含2918万条数据,数据量太大,电脑配置不高,跑不动要卡死机。所以我这边只选取60万条数据,进行本次模型训练分析。 2、数据清洗 时间列转为时间格式,提取周、日、小时这三个有效信息,签到次数<5次的签到地点直接筛除,对于本次不具有
阅读全文
posted @ 2020-11-12 21:03 尤克拉
阅读(450)
评论(0)
推荐(0)
2020年11月11日
KNN算法---鸢尾花数据集分类
摘要: 1、获取数据(sklearn库自带数据集) 获取鸢尾花数据集,进行简单了解 2、数据集划分 划分训练集与测试集 3、特征工程(标准化) 特征值无量纲化处理 4、KNN算法预估器流程 加入网格搜索与交叉验证,提高模型准确性 5、模型评估 最终使用KNN算法,进行相应调参后,最佳参数K值为7,模型预测准
阅读全文
posted @ 2020-11-11 21:44 尤克拉
阅读(846)
评论(0)
推荐(0)
2020年11月10日
1985-2016年全球自杀数据分析(Kaggle)
摘要: 1、分析背景 伴随人们的生活压力日益增大,引发了许多心理疾病。由于没有及时的沟通与制止,导致很多自杀的悲剧,例如去年韩国艺人崔雪莉、具荷拉离世。本次数据分析是利用Kaggle平台上一份1985-2016年部分国家的自杀概述数据集,了解自杀和年龄、性别、国家经济实力、社会环境等因素的关系,探究人们选择
阅读全文
posted @ 2020-11-10 20:29 尤克拉
阅读(2917)
评论(0)
推荐(0)
pandas常用函数
摘要: 数据分析中我们进行数据清洗,常用的工具为pandas库,本文为个人整理的pandas常用函数,希望对您学习pandas有帮助。 一、生成数据表 导入应用模块: import pandas as pd Import numpy as np #numpy 通常搭配使用 (一)创建数据表 ①df=pd.D
阅读全文
posted @ 2020-11-10 18:15 尤克拉
阅读(1288)
评论(0)
推荐(0)
公告