巴拉巴拉程序猿

2018年10月10日

1.训练词向量代码如下：#训练词语为向量表示def w2v_train(self): ques = self.cu.execute('select question from activity')#将所有问题内容作为预料训练一个w2v模型 da_all = [] for d in ques: da_ Read More

posted @ 2018-10-10 19:42 巴拉巴拉程序猿 Views(2151) Comments(2) Diggs(0)

2018年9月30日

关于话题模型（topic model）的一些思考

最近在分析知乎的‘问题’文本所属的话题，用python提取，实现了LSTM和LDA模型在这个方面的应用，但是效果不是很理想，一个是这些文本属于短文本，另外用来分析的文本本身包含多个领域的问题，并且数量较少，很有可能只有几条。所以最后得到的话题模型即使分了很多主题仍然在同一个主题会出现多种词汇。尝试 Read More

posted @ 2018-09-30 17:19 巴拉巴拉程序猿 Views(2115) Comments(0) Diggs(0)

密度峰值聚类实验代码修正

由Alex Rodriguez和Alessandro Laio发表的《Clustering by fast search and find of density peaks》提出基于密度峰值聚类的算法，作者还给出了实验代码及案例数据，链接在这http://people.sissa.it/~laio/ Read More

posted @ 2018-09-30 10:54 巴拉巴拉程序猿 Views(2032) Comments(0) Diggs(1)

2018年7月12日

实践-通过matlab操作sqlite数据库

1.下载sqlite-jdbc连接数据库地址 https://bitbucket.org/xerial/sqlite-jdbc/downloads/ 2.将该jar包的绝对路径写入matlab的classpath.txt文件。该文件一般在D:\Program Files\MATLAB\R2010b\ Read More

posted @ 2018-07-12 16:12 巴拉巴拉程序猿 Views(1996) Comments(0) Diggs(0)

2018年6月27日

绘制ROC曲线

绘制ROC曲线首选肯定是查阅sklearn.metrics.roc_curve(y_true, y_score, pos_label=None, sample_weight=None, drop_intermediate=True)但是所谓y_score到底指的是什么？查找网上相关经验时，发现几乎所 Read More

posted @ 2018-06-27 17:15 巴拉巴拉程序猿 Views(1666) Comments(0) Diggs(0)

2018年5月14日

修改某路径下的文件名

#处理有问题的文件名file_name=os.listdir('./2018.5.3')#得到该路径下的所有文件字符串对象for temp in file_name: try: #if '.0_followers' in temp: if '.0.xls' in temp: new_name=tem Read More

posted @ 2018-05-14 09:55 巴拉巴拉程序猿 Views(319) Comments(0) Diggs(0)

2018年5月11日

关于提取字符串中数字

import rew=writeXLS.WriteXLS('result_adaboost1.xls')#写入表格的方法，可以随意换一种方法f=open('result_adaboost.txt')#数据格式为Predicted: 802.1875, Target: 1083.0 #Predicte Read More

posted @ 2018-05-11 17:47 巴拉巴拉程序猿 Views(246) Comments(0) Diggs(0)

2018年5月7日

解决采集知乎数据时由于账号被封遗漏的账号重爬问题（python代码）

'''一、最笨的办法了################################################################为了处理由于账号被封而没跑到的问题id进行以下两步：################################################# Read More

posted @ 2018-05-07 16:48 巴拉巴拉程序猿 Views(629) Comments(0) Diggs(0)

2018年4月16日

project proposal写作框架

主要有八个因素：背景（Your Background）：对于proposal有意义的要点,如国家职业证书、技能、经验、能力和实习经历等。大纲（Outline Proposal）：描述你明确的感兴趣的领域，研究和方向；你希望能够通过学习来承接过去的知识并启发未来的职业道路。用3，4句话阐释你的pr Read More

posted @ 2018-04-16 22:24 巴拉巴拉程序猿 Views(602) Comments(0) Diggs(0)

巴拉巴拉程序猿

公告