会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
止一
博客园
首页
新随笔
管理
上一页
1
2
3
4
5
6
···
17
下一页
2021年3月6日
Python thread
摘要: python 多线程 进程:是程序的一次运行 process 线程:是进程当中的分支 import os print(os.getpid())#返回进程号 对多线程的需求 1、提高我们程序的运行效率 2、追求并发 我们现在使用的计算机大部分都是单cpu的计算机, 单CPU计算机在一个时间点上,只能处
阅读全文
posted @ 2021-03-06 19:34 止一
阅读(766)
评论(0)
推荐(0)
2021年3月1日
混淆矩阵
摘要: 10000条交易数据中,有100条欺诈交易,比例为1%,现在需要创建模型,识别出这些欺诈数据。 准确率:判断正确的数量/全部数量 = (TN+TP) / (TN+FP+FN+TP) 召回率:100条欺诈数据中,正确识别出来的比例 = TP / (FN+TP) 精确率:在识别正确的数量中,欺诈数据的比
阅读全文
posted @ 2021-03-01 21:51 止一
阅读(172)
评论(0)
推荐(0)
2021年2月27日
利用 Python 处理PDF文件,进行关键词的识别与提取
摘要: 【项目目标】 对大量的公司年报(PDF文件)进行关键词的识别与提取,判断文件是否含有“增值税留抵税额:XXXX”,并将这份文件的名字和此内容写入表格 【项目实现】 1.导入处理PDF的python库 1 import pdfplumber 2 import PyPDF2 3 import re 4
阅读全文
posted @ 2021-02-27 22:47 止一
阅读(5834)
评论(0)
推荐(0)
【爬虫】必应图片按关键词进行图片下载
摘要: 1 """ 2 关键是找到正确的url,然后判断组成url的参数的规律,多观察几个url即可得出规律 3 """ 4 5 import requests 6 from fake_useragent import UserAgent 7 import os 8 from lxml import etr
阅读全文
posted @ 2021-02-27 17:44 止一
阅读(195)
评论(0)
推荐(0)
Scrapy_糗事百科
摘要: 1.进入桌面 1 cd C:\Users\Mr_wa\Desktop 2.新建项目 scrapy startproject qsbk 3.新建爬虫 cd qsbk scrapy genspider qsbk_spider qiushibaike.com 4.修改settings.py 1 ROBOT
阅读全文
posted @ 2021-02-27 17:42 止一
阅读(84)
评论(0)
推荐(0)
2021年2月26日
知乎数据清洗整理与结论研究
摘要: 【项目名称】 知乎数据清洗整理和结论研究 【项目要求】 1、数据清洗 - 去除空值 要求:创建函数 2、问题1:知友全国地域分布情况,分析出TOP20 要求: ① 按照地域统计 知友数量、知友密度(知友数量/城市常住人口) ② 知友数量,知友密度,标准化处理,取值0-100,要求创建函数 ③ 通过多
阅读全文
posted @ 2021-02-26 23:25 止一
阅读(571)
评论(0)
推荐(0)
2021年2月23日
【SVM】kaggle之澳大利亚天气预测
摘要: 项目目标 由于大气运动极为复杂,影响天气的因素较多,而人们认识大气本身运动的能力极为有限,因此天气预报水平较低,预报员在预报实践中,每次预报的过程都极为复杂,需要综合分析,并预报各气象要素,比如温度、降水等。本项目需要训练一个二分类模型,来预测在给定天气因素下,城市是否下雨。 数据说明 本数据包含了
阅读全文
posted @ 2021-02-23 01:32 止一
阅读(2622)
评论(2)
推荐(0)
2021年2月21日
【决策树】泰坦尼克号幸存者预测项目
摘要: 项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化模型并进行交叉验证 模型预测
阅读全文
posted @ 2021-02-21 14:24 止一
阅读(949)
评论(0)
推荐(0)
2021年2月20日
关于交叉验证
摘要: 在机器学习中,我们一般会把数据集分为训练集和测试集,训练集用于创建模型,测试集用于评估模型的好坏。如果效果不好,我们就进行调参,继续在测试集上进行测试。实际上这有可能使得模型对于测试集过拟合,进而在面对新的未知数据时预测效果不好。 为了尽量避免针对测试集和训练集过拟合的问题,一般在数据量少的情况下,
阅读全文
posted @ 2021-02-20 22:07 止一
阅读(36)
评论(0)
推荐(0)
2021年2月7日
互斥事件与独立事件的区别
摘要: 以抛一枚硬币为例,一次试验只有两种可能,Ω = {正面,反面},这两种可能是互斥的,不可能同时发生,一种可能也可以说一个事件发生了,就湮灭了另一个事件发生的可能性。 所以,说两个事件互斥,也就意味着在一次试验当中,这两个事件不会同时发生,即P(AB) = 0,两者没有交集。 但是两个事件相互独立吗?
阅读全文
posted @ 2021-02-07 14:35 止一
阅读(3805)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
17
下一页