止一 - 博客园

2021年3月6日

摘要： python 多线程进程:是程序的一次运行 process 线程:是进程当中的分支 import os print(os.getpid())#返回进程号对多线程的需求 1、提高我们程序的运行效率 2、追求并发我们现在使用的计算机大部分都是单cpu的计算机，单CPU计算机在一个时间点上，只能处阅读全文

posted @ 2021-03-06 19:34 止一阅读(774) 评论(0) 推荐(0)

2021年3月1日

混淆矩阵

摘要： 10000条交易数据中，有100条欺诈交易，比例为1%，现在需要创建模型，识别出这些欺诈数据。准确率：判断正确的数量/全部数量 = (TN+TP) / (TN+FP+FN+TP) 召回率：100条欺诈数据中，正确识别出来的比例 = TP / (FN+TP) 精确率：在识别正确的数量中，欺诈数据的比阅读全文

posted @ 2021-03-01 21:51 止一阅读(179) 评论(0) 推荐(0)

2021年2月27日

利用 Python 处理PDF文件，进行关键词的识别与提取

摘要：【项目目标】对大量的公司年报（PDF文件）进行关键词的识别与提取，判断文件是否含有“增值税留抵税额：XXXX”，并将这份文件的名字和此内容写入表格【项目实现】 1.导入处理PDF的python库 1 import pdfplumber 2 import PyPDF2 3 import re 4 阅读全文

posted @ 2021-02-27 22:47 止一阅读(5851) 评论(0) 推荐(0)

【爬虫】必应图片按关键词进行图片下载

摘要： 1 """ 2 关键是找到正确的url，然后判断组成url的参数的规律，多观察几个url即可得出规律 3 """ 4 5 import requests 6 from fake_useragent import UserAgent 7 import os 8 from lxml import etr 阅读全文

posted @ 2021-02-27 17:44 止一阅读(201) 评论(0) 推荐(0)

Scrapy_糗事百科

摘要： 1.进入桌面 1 cd C:\Users\Mr_wa\Desktop 2.新建项目 scrapy startproject qsbk 3.新建爬虫 cd qsbk scrapy genspider qsbk_spider qiushibaike.com 4.修改settings.py 1 ROBOT 阅读全文

posted @ 2021-02-27 17:42 止一阅读(85) 评论(0) 推荐(0)

2021年2月26日

知乎数据清洗整理与结论研究

摘要：【项目名称】知乎数据清洗整理和结论研究【项目要求】 1、数据清洗 - 去除空值要求：创建函数 2、问题1：知友全国地域分布情况，分析出TOP20 要求： ① 按照地域统计知友数量、知友密度（知友数量/城市常住人口） ② 知友数量，知友密度，标准化处理，取值0-100，要求创建函数 ③ 通过多阅读全文

posted @ 2021-02-26 23:25 止一阅读(574) 评论(0) 推荐(0)

2021年2月23日

【SVM】kaggle之澳大利亚天气预测

摘要：项目目标由于大气运动极为复杂，影响天气的因素较多，而人们认识大气本身运动的能力极为有限，因此天气预报水平较低，预报员在预报实践中，每次预报的过程都极为复杂，需要综合分析，并预报各气象要素，比如温度、降水等。本项目需要训练一个二分类模型，来预测在给定天气因素下，城市是否下雨。数据说明本数据包含了阅读全文

posted @ 2021-02-23 01:32 止一阅读(2647) 评论(2) 推荐(0)

2021年2月21日

【决策树】泰坦尼克号幸存者预测项目

摘要：项目目标泰坦尼克号的沉没是历史上最著名的还难事件之一，在船上的2224名乘客和机组人员中，共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。项目过程导入并探索数据处理缺失值，删除与预测无关的特征将分类变量转换为数值型变量实例化模型并进行交叉验证模型预测阅读全文

posted @ 2021-02-21 14:24 止一阅读(959) 评论(0) 推荐(0)

2021年2月20日

关于交叉验证

摘要：在机器学习中，我们一般会把数据集分为训练集和测试集，训练集用于创建模型，测试集用于评估模型的好坏。如果效果不好，我们就进行调参，继续在测试集上进行测试。实际上这有可能使得模型对于测试集过拟合，进而在面对新的未知数据时预测效果不好。为了尽量避免针对测试集和训练集过拟合的问题，一般在数据量少的情况下，阅读全文

posted @ 2021-02-20 22:07 止一阅读(39) 评论(0) 推荐(0)

2021年2月7日

互斥事件与独立事件的区别

摘要：以抛一枚硬币为例，一次试验只有两种可能，Ω = {正面，反面}，这两种可能是互斥的，不可能同时发生，一种可能也可以说一个事件发生了，就湮灭了另一个事件发生的可能性。所以，说两个事件互斥，也就意味着在一次试验当中，这两个事件不会同时发生，即P(AB) = 0，两者没有交集。但是两个事件相互独立吗？阅读全文

posted @ 2021-02-07 14:35 止一阅读(3830) 评论(0) 推荐(0)