会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
斯年
+
主 页
归 档
标 签
关 于
管 理
__斯年
管理
2022年10月14日
python2 | python3 | 文本清洗正则匹配
摘要: python3写的清洗文本代码在python2用不了,会出现各种编码问题,经过痛苦的一晚上加班终于搞完了,记录一下。 python2 def clean_text(content): """去除话题词,链接,@用户,图标,emoji,标点符号,空白符""" query = re.sub(u"#[^#
阅读全文
posted @ 2022-10-14 11:15 __斯年
阅读(162)
评论(0)
推荐(0)
2022年10月9日
提高效率的一些技巧
摘要: 搬一些我平时随手记的提高效率小技巧。 百度高级搜索 这个绝对是我最近才发现的超实用技巧,平时机场常掉链子,Google三天两头用不了,而且很多英文内容懒得看。我天朝第一搜索引擎广告又太多,还经常出现拆分关键词,或者两个关键词只识别一个的情况,检索效率大大降低,让本来就不情愿的科研生活更加苦不堪言。
阅读全文
posted @ 2022-10-09 16:30 __斯年
阅读(28)
评论(0)
推荐(0)
Linux | SVN添加忽略文件
摘要: 目标:忽略python项目中log文件夹下所有文件和项目中所有*.pyc文件 经过实验,用下列命令再忽略其他文件会失效 svn propset svn:ignore '*' log 按如下顺序操作可以成功 先在项目根目录忽略*.pyc文件,-R表示目录递归 svn propset svn:ignor
阅读全文
posted @ 2022-10-09 16:06 __斯年
阅读(148)
评论(0)
推荐(0)
2019年9月23日
SHE姐妹建模记录
摘要: 中午11点54分,队长把MD5码提交上去在群里发了截图,我对着屏幕上刚检查完的论文,感觉整个人都轻松起来了,又有点恍惚,可能是这几天都没睡好觉。去楼下吃了顿饭,本来打算回来倒头就睡,睡到几点算几点,醒来再去上班,过六点就不去了,连翘一天班。结果躺在床上怎么也睡不着。 三点多爬起来到公司,心情很好,干
阅读全文
posted @ 2019-09-23 17:39 __斯年
阅读(196)
评论(0)
推荐(0)
2019年8月29日
统计学习方法 | 感知机 | python实现
摘要: 感知机是二类分类的线性分类模型,利用随机梯度下降法对基于误分类的损失函数进行极小化。 书中算法可以将所有样本和系数向量写成增广向量的形式,并将所有负样本乘以 1,统一形式,方便计算。 (1)训练数据集线性可分时,感知机学习算法原始形式迭代收敛 (2)算法存在许多解 感知机学习算法的对偶形式使得训练过
阅读全文
posted @ 2019-08-29 17:06 __斯年
阅读(150)
评论(0)
推荐(0)
博客园自定义记录
摘要: 记录了自定义博客园的过程。
阅读全文
posted @ 2019-08-29 16:48 __斯年
阅读(270)
评论(0)
推荐(0)
2019年7月25日
统计学习方法 | 朴素贝叶斯 | python实现
摘要: 本文实现了李航教授的《统计学习方法》一书中第4章朴素贝叶斯法中的算法,包括算法4.1(朴素贝叶斯算法)和在此基础上改进的贝叶斯估计。文末整理了在实现算法过程中遇到问题记录的笔记。
阅读全文
posted @ 2019-07-25 12:52 __斯年
阅读(642)
评论(0)
推荐(0)
2018年8月3日
python调用WebService遇到的问题'Document' object has no attribute 'set'
摘要: 代码: 错误信息: 用WebService测试软件测过了接口没有问题,代码也应该没有问题,因为调用另外一个方法是成功的。我把url打码了。考虑到python版本问题我试了python3.6和python3.7都是这个错误。 在网络上目前没有找到这个问题,StackOverflow上有一个和我一样的问
阅读全文
posted @ 2018-08-03 16:00 __斯年
阅读(436)
评论(0)
推荐(0)
公告