随笔分类 - PYTHON
摘要:Mac reference https://blog.csdn.net/qq_32590631/article/details/80509741 reference https://blog.csdn.net/kl28978113/article/details/91047633 不用下载字体
阅读全文
摘要:敲黑板,敲黑板,知乎验证码除了上面的实体,还有艺术字体的空心字体,空心字体要不要也模仿呢,不用,为啥啊,因为我们只是需要一个“别的类似的场景训练好的模型”,不需要包括那么全,只需要在迁移学习的时候少量包含空心字体的训练样本进行迁移学习就可以了,这也是迁移学习的强大体现
阅读全文
摘要:对于没有足够已标记验证码的情况下,你可以想到GANs,迁移学习,甚至是打通内部工作人员给你足够的已标记验证码或者规则...,这里,我们就迁移学习来解决这个问题
对于爬虫对抗验证码,我们只要拥有上面验证码识别的深度学习模型就可以了,而其他反爬虫对抗手段,我们在扩展部分结合scrapy进行实战演练
阅读全文
摘要:正负样本比率失衡SMOTE [TOC] 背景 这几天测试天池的优惠券预测数据在dnn上面会不会比集成树有较好的效果,但是正负样本差距太大,而处理这种情况的一般有欠抽样和过抽样,这里主要讲过抽样,过抽样有一种简单的方法叫随机过抽样,但是随机过抽样只是随机的复制,很容易过拟合,所以SMOTE比较好,SM
阅读全文

浙公网安备 33010602011771号