摘要: python3写的清洗文本代码在python2用不了,会出现各种编码问题,经过痛苦的一晚上加班终于搞完了,记录一下。 python2 def clean_text(content): """去除话题词,链接,@用户,图标,emoji,标点符号,空白符""" query = re.sub(u"#[^# 阅读全文
posted @ 2022-10-14 11:16 __斯年 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 搬一些我平时随手记的提高效率小技巧。 百度高级搜索 这个绝对是我最近才发现的超实用技巧,平时机场常掉链子,Google三天两头用不了,而且很多英文内容懒得看。我天朝第一搜索引擎广告又太多,还经常出现拆分关键词,或者两个关键词只识别一个的情况,检索效率大大降低,让本来就不情愿的科研生活更加苦不堪言。 阅读全文
posted @ 2022-10-09 16:31 __斯年 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 目标:忽略python项目中log文件夹下所有文件和项目中所有*.pyc文件 经过实验,用下列命令再忽略其他文件会失效 svn propset svn:ignore '*' log 按如下顺序操作可以成功 先在项目根目录忽略*.pyc文件,-R表示目录递归 svn propset svn:ignor 阅读全文
posted @ 2022-10-09 16:06 __斯年 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 中午11点54分,队长把MD5码提交上去在群里发了截图,我对着屏幕上刚检查完的论文,感觉整个人都轻松起来了,又有点恍惚,可能是这几天都没睡好觉。去楼下吃了顿饭,本来打算回来倒头就睡,睡到几点算几点,醒来再去上班,过六点就不去了,连翘一天班。结果躺在床上怎么也睡不着。 三点多爬起来到公司,心情很好,干 阅读全文
posted @ 2019-09-23 17:39 __斯年 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 感知机是二类分类的线性分类模型,利用随机梯度下降法对基于误分类的损失函数进行极小化。 书中算法可以将所有样本和系数向量写成增广向量的形式,并将所有负样本乘以 1,统一形式,方便计算。 (1)训练数据集线性可分时,感知机学习算法原始形式迭代收敛 (2)算法存在许多解 感知机学习算法的对偶形式使得训练过 阅读全文
posted @ 2019-08-29 17:06 __斯年 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 记录了自定义博客园的过程。 阅读全文
posted @ 2019-08-29 16:48 __斯年 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 本文实现了李航教授的《统计学习方法》一书中第4章朴素贝叶斯法中的算法,包括算法4.1(朴素贝叶斯算法)和在此基础上改进的贝叶斯估计。文末整理了在实现算法过程中遇到问题记录的笔记。 阅读全文
posted @ 2019-07-25 12:52 __斯年 阅读(615) 评论(0) 推荐(0) 编辑
摘要: 代码: 错误信息: 用WebService测试软件测过了接口没有问题,代码也应该没有问题,因为调用另外一个方法是成功的。我把url打码了。考虑到python版本问题我试了python3.6和python3.7都是这个错误。 在网络上目前没有找到这个问题,StackOverflow上有一个和我一样的问 阅读全文
posted @ 2018-08-03 16:00 __斯年 阅读(406) 评论(0) 推荐(0) 编辑