Loading

摘要: NLP多标签多分类使用样例 因为是医学数据,涉及最大的问题,类别不均衡问题,提供三种解决方案: 重采样:原数据集设置为X,划分好训练集,测试集;以训练集为例如果需要1000个,训练集一共5类,每类中随机取一次,取200次。这样训练时的数据是均衡的,但是不适合多标签。 调整训练过程的权重分配,数量少的 阅读全文
posted @ 2024-09-19 14:26 绯色鱼 阅读(380) 评论(0) 推荐(0)
摘要: 涵盖了keras,tensorflow,torch,ms多框架的LSTM模型。 4 torch+NPU-Ai core模型训练 从这开始真正调用昇腾平台NPU-Ai core资源,加速训练 在3的基础上面修改 # 1. 创建模型,最后加了.npu() model = AttentionLSTM(in 阅读全文
posted @ 2024-09-19 14:25 绯色鱼 阅读(81) 评论(0) 推荐(0)
摘要: 涵盖了keras,tensorflow,torch,ms多框架的LSTM模型。 原始开发环境:华为云昇腾Ascend下mindspore1.8下 可使用资源:CPU,NPU-Ai core,NPU-HBM 个人使用流程:【NPU-HBM和NPU-Ai core的关系类似CPU和GPU】 ①keras 阅读全文
posted @ 2024-09-19 14:24 绯色鱼 阅读(117) 评论(0) 推荐(0)
摘要: npm install -g cnpm --registry=https://registry.npm.taobao.org npm install -g @vue/cli mkdir xxx cd xxx vue init webpack vue-app 【上面慢,git clone https: 阅读全文
posted @ 2024-09-19 14:23 绯色鱼 阅读(12) 评论(0) 推荐(0)
摘要: Selenium【Version: 4.9.1】爬虫使用中阶攻略,包含一些其他博客可能没有的经验 一共涉及三个模块:Selenium控件控制,OCR识别,pyinstaller打包+ini配置 from selenium import webdriver from selenium.webdrive 阅读全文
posted @ 2024-09-19 14:21 绯色鱼 阅读(99) 评论(0) 推荐(0)
摘要: Git/Gitee仓库代码拉取与上推 1 确保你的git与你的账号相连【可以直接2,如果出问题再回来验证】 1.1 查看git config # 查看全局配置 git config --global -l 1.2 查看gitee的凭证 如果不对应,手动修改即可 1.3 github不对应,git c 阅读全文
posted @ 2024-09-19 14:20 绯色鱼 阅读(23) 评论(0) 推荐(0)
摘要: cv2间隔指定秒抓取视频 以上为一些常见编码格式: I420,YUV编码,视频格式为.avi PIM1,MPEG-1编码,视频格式为.avi XVID,MPEG-4编码,视频格式为.avi THEO,Ogg Vorbis,视频格式为.ogv FLV1,Flash视频,视频格式为.flv AVC1,H 阅读全文
posted @ 2024-09-19 14:17 绯色鱼 阅读(25) 评论(0) 推荐(0)
摘要: 手动QDUOJ部署 [更推荐官网一键部署,手动有失败率,但是能更深入理解部署过程] 目录 ★标记的部分很重要 一、需求环境 Docker,Docker-compose,python=3.8[推荐] # 查看版本 docker -v docker-compose -v 环境配置[Ubuntu20.04 阅读全文
posted @ 2024-09-19 14:15 绯色鱼 阅读(315) 评论(0) 推荐(0)
摘要: git clone无法连接了,个人经验分享 # npm ubuntu系统中 子系统报错可能因为ssh连接问题, # 邮箱填自己github的 ssh-keygen -t rsa -C "11111@qq.com" # github打开设置里面的ssh配置 # 将 ~/.ssh/id_rsa.pub 阅读全文
posted @ 2024-09-19 14:14 绯色鱼 阅读(282) 评论(0) 推荐(0)
摘要: docker是啥: 类似虚拟机一样,有单独的接口管理,可以将要运行的服务放到一个单独的环境中,主机只需要对docker的端口和资源进行管理即可。以一个我实际操作的项目为例: 红色为主机,docker运行在主机上,docker里面可以单独配置容器存放我们需要运行的程序,如果容器内服务运行在8000端口 阅读全文
posted @ 2024-09-19 14:12 绯色鱼 阅读(9) 评论(0) 推荐(0)
摘要: 试了三遍,终于挂载成功了DMOJ,随笔记录 Ubuntu20.04、Ubuntu20.04【WSL】适用 官方提供的开发文档 DMOJ官网 GitHub地址 1.环境配置 apt update # 大前置 apt install git gcc g++ make python3-dev python 阅读全文
posted @ 2024-09-19 14:10 绯色鱼 阅读(196) 评论(0) 推荐(0)
摘要: 以下均在django版本2.2以下: 这里解决两个django问题,如标题所见,这里在详细说明一下,网上教程版本层次不齐。迷惑之处url 究竟要怎么安排,怎么写,不同url文件之间关系;另一个问题,静态文件static和templates两个文件怎么弄。 1. 路由问题 先来理解路由,简单来说就是站 阅读全文
posted @ 2024-09-19 14:04 绯色鱼 阅读(93) 评论(0) 推荐(0)
摘要: 随笔记录django在阿里云服务器部署 环境 前提准备: ①django2.2的一个本地项目,本地部署没有问题 ②阿里云的Ubuntu18的轻量级应用服务器 ③了解linux都有什么目录(/usr,/root...),会使用vim和ls、rm、mkdir等常见文件操作命令 方便对比自己环境 ,这里详 阅读全文
posted @ 2024-09-19 14:03 绯色鱼 阅读(103) 评论(0) 推荐(0)
摘要: 对于货物派送问题,白文解释原理,并通过matlab和python分别实现。 问题: 文献: https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2021&filename=WLJS202104028&v=1m 阅读全文
posted @ 2024-09-19 14:02 绯色鱼 阅读(110) 评论(0) 推荐(0)
摘要: 对于PCA和MDS降维两种方法,在数据分析,还是建模中我用到了很多次,很多时候都是直接在sklearn中调函数,或者直接网上找现成的,现在终于到了分析它的处理原理(数学角度)。 PCA降维 PCA可谓是我用的第二多的,我知道的要晚一些,(我看好多人都是先知道PCA,然后知道MDS,我竟然是反的)这里 阅读全文
posted @ 2024-09-19 14:00 绯色鱼 阅读(93) 评论(0) 推荐(0)
摘要: 介绍了一些标题方法的求解过程。 关键词:估计方差 估计偏差 McNemar检验 Friedman检验 Nemenyi后续检验 一、评估假设 估计偏差和估计方差 估计偏差 我们知道训练误差和测试误差,如果只有一个数据集,拿着它去喂我们的模型,然后拿它再去测试模型会出现一种看上去指标很高,但是很假的情况 阅读全文
posted @ 2024-09-19 13:58 绯色鱼 阅读(88) 评论(0) 推荐(0)
摘要: 详细案例解释ROC与AUC过程。 1.ROC与AUC评价 前面对ROC和AUC简单有了了解,只知道了他是用来评价学习器优劣的指标,这里来更详细记录下具体意义和求法。 图中曲线为ROC曲线,曲线下的面积的具体数值为AUC指标。 α越接近α0,分类器性能越好,当ROC曲线降到红线以下时,说明用这个分类器 阅读全文
posted @ 2024-09-19 12:17 绯色鱼 阅读(63) 评论(0) 推荐(0)
摘要: 三种评估方法:留出法,交叉验证,自助法。和一些性能度量知识。 02模型评估与选择 2.2 模型选择 2.1.1 评估方法 首先什么是评估方法,你可以简单理解为我的模型建好了,用什么数据去评估它。理论来说应该是用未来的数据去评估,但是实际我们是没有未来数据的,那么我们就要从总数据中拿出一部分来当做‘未 阅读全文
posted @ 2024-09-19 12:16 绯色鱼 阅读(52) 评论(0) 推荐(0)
摘要: 经验误差、过拟合。 学习书籍是周志华老师的《机器学习》听课后记录笔记。 02模型评估与选择 2.1 经验误差与过拟合 主要几个个概念:泛化误差,经验误差,损失函数,过拟合 泛化误差:未来样本的误差 经验误差:训练样本的误差(非常小会过拟合) 然后我们认识一下Loss函数(损失函数),他一般用来判断模 阅读全文
posted @ 2024-09-19 12:15 绯色鱼 阅读(27) 评论(0) 推荐(0)
摘要: 问题来源: 本身在Al studio的环境训练是没问题的,由于某些问题在平台不好弄,于是copy了项目,anconda建立了paddle-gpu的虚拟环境也搭建了,但是在跑项目的时候出现了如下错误: 网上了查看了许多方法,参考着试了不少 测试方法一: 缺少的dll文件补上了,失败告终 测试方法二:虚 阅读全文
posted @ 2024-09-19 12:12 绯色鱼 阅读(473) 评论(0) 推荐(0)
摘要: 使用bat命令,创建TXT直接强制改后缀BAT,这导致一个中文编码问题。 问题 使用bat命令,我习惯于创建TXT直接强制改后缀BAT,这导致一个中文编码问题,TXT的默认一般UTF-8编码,而DOS是ASCII编码。 解决方案 在写BAT命令内容之前加一行: chcp 65001 我的感觉,这和p 阅读全文
posted @ 2024-09-19 12:06 绯色鱼 阅读(87) 评论(0) 推荐(0)
摘要: python3.7 环境window10 64位 cv2包问题。 问题 做图片处理用opencv-python做模板匹配的时候会用个sift模型,就会用到cv2.xfeatures2d_SIFT.create()这个函数,在我正要用它增加自己知识,巴拉巴啦....的时候,咦?! 这是个什么鬼哦,没有 阅读全文
posted @ 2024-09-19 12:05 绯色鱼 阅读(138) 评论(0) 推荐(0)
摘要: 使用anonymous-microsoft web.data的多维数据集的时候,因为该数据集没有标签,在自己打标签的过程中遇到了一些问题。 问题 最近做聚类的时候发现在做一个名为anonymous-microsoft web.data的多维数据集的时候,因为该数据集没有标签,在自己打标签的过程中遇到 阅读全文
posted @ 2024-09-19 12:03 绯色鱼 阅读(31) 评论(0) 推荐(0)
摘要: 案例学习多元线性拟合。 从案例中学习新知识是比较快的,所以我们直接上例子: (本文为基础学习,以理解为主) 案例一:拟合一元一次 x = [143,145,146,148] y = [11,13,14,15] # 我们现在拟合这个y = bx+a 这里要介绍一个写好的包,regress()使用参数如 阅读全文
posted @ 2024-09-19 12:02 绯色鱼 阅读(74) 评论(0) 推荐(0)
摘要: MATLAB的基本操作不做介绍,直接开始感知器的学习,学会制作单层感知器和多层感知器 一、单层感知器 1、结构图如下:(懂得直接跳到2、) 单层感知器,即只有一层神经元节点,上图为一个神经元的示意图。 多个输入经过加权求和之后得到一个值,这个值再加上一个b(有点类似y=ax+b)经过激活函数后就可以 阅读全文
posted @ 2024-09-19 12:01 绯色鱼 阅读(53) 评论(0) 推荐(0)
摘要: 简单介绍了一些常用的特殊矩阵,矩阵的变换,特征值和特征向量。 一、特殊矩阵 1、zeros() ①y = zeros(m):创建m×m的元素全为0的矩阵传递给y。 ②y = zeros(m,n):创建m×n的元素全为0的矩阵传递给y。 ③y = zeros(size(x)):创建一个和x大小一样的元 阅读全文
posted @ 2024-09-19 12:00 绯色鱼 阅读(84) 评论(0) 推荐(0)
摘要: 随手记录,第一次用爬虫 首先说一下环境部分 我的环境: python3.7 Anconda虚拟环境 所应用库:pandas,json,requests,time(time库因为要爬取数据类型而用的,非必须库) 环境不同不会影响太大(似乎基本没啥影响) 爬虫开始 这里只说一些基础中的基础,适合pyth 阅读全文
posted @ 2024-09-19 11:58 绯色鱼 阅读(32) 评论(0) 推荐(0)
摘要: 简单介绍了系统聚类/层次聚类。 算法篇——系统聚类(或层次聚类) 一、使用前 问:系统聚类为啥用的不多? 答:系统聚类适合小样本数据集,对于大样本系统聚类的运算复杂度成倍叠加,这导致这个方法用的时候不多。现在大多数都是在分析中等量样本集和大数据样本集。 二、系统聚类 系统聚类的原理,比如在一个平面, 阅读全文
posted @ 2024-09-19 11:54 绯色鱼 阅读(16) 评论(0) 推荐(0)
摘要: 简单介绍了剩余的评价指标,接上文 关键词:Jaccard系数 FM指数(FMI) Rand指数(RI)DBI DI 介绍篇——评价指标 补充 : 上一篇为针对二分类,如果为三类以上的分类时,对每一类单独分析,即分析A类: A类为正类,其他均为负类,然后按某方法综合分析: 某方法: 1.宏平均(mac 阅读全文
posted @ 2024-09-19 11:51 绯色鱼 阅读(73) 评论(0) 推荐(0)
摘要: 本篇介绍常用的评价指标,并介绍其原理,加上一些自己的理解。 关键词:NFL Accuracy Precision Recall F1 ROC+AUC 介绍篇——评价指标 评价指标用来评价一个学习器的好坏。 评价模型我们始终要明白一个道理NFL:没有免费的午餐! 学习器的评价不是绝对的,它取决于你使用 阅读全文
posted @ 2024-09-19 11:50 绯色鱼 阅读(25) 评论(0) 推荐(0)
摘要: 对于什么是聚类做了一个简单的介绍,方便理解(适合刚入门机器学习的小白食用)。 开一个板块介绍聚类(周更/5-30) 分为3大部分(介绍篇,算法篇,实战篇) 介绍篇:聚类介绍+聚类指标详解 算法篇:聚类有很多种,以介绍算法为主,每一种都会给一个目前用的较多的算法 实战篇:2个二分类+2个多分类 介绍篇 阅读全文
posted @ 2024-09-19 11:47 绯色鱼 阅读(15) 评论(0) 推荐(0)