1.训练词向量代码如下:#训练词语为向量表示def w2v_train(self): ques = self.cu.execute('select question from activity')#将所有问题内容作为预料训练一个w2v模型 da_all = [] for d in ques: da_ Read More
posted @ 2018-10-10 19:42 巴拉巴拉程序猿 Views(2147) Comments(2) Diggs(0)
最近在分析知乎的‘问题’文本所属的话题,用python提取,实现了LSTM和LDA模型在这个方面的应用,但是效果不是很理想,一个是这些文本属于短文本,另外用来分析的文本本身包含多个领域的问题,并且数量较少,很有可能只有几条。所以最后得到的话题模型即使分了很多主题仍然在同一个主题会出现多种词汇。 尝试 Read More
posted @ 2018-09-30 17:19 巴拉巴拉程序猿 Views(2111) Comments(0) Diggs(0)
由Alex Rodriguez和Alessandro Laio发表的《Clustering by fast search and find of density peaks》提出基于密度峰值聚类的算法,作者还给出了实验代码及案例数据,链接在这http://people.sissa.it/~laio/ Read More
posted @ 2018-09-30 10:54 巴拉巴拉程序猿 Views(2025) Comments(0) Diggs(1)
1.下载sqlite-jdbc连接数据库地址 https://bitbucket.org/xerial/sqlite-jdbc/downloads/ 2.将该jar包的绝对路径写入matlab的classpath.txt文件。该文件一般在D:\Program Files\MATLAB\R2010b\ Read More
posted @ 2018-07-12 16:12 巴拉巴拉程序猿 Views(1983) Comments(0) Diggs(0)
绘制ROC曲线首选肯定是查阅sklearn.metrics.roc_curve(y_true, y_score, pos_label=None, sample_weight=None, drop_intermediate=True)但是所谓y_score到底指的是什么?查找网上相关经验时,发现几乎所 Read More
posted @ 2018-06-27 17:15 巴拉巴拉程序猿 Views(1638) Comments(0) Diggs(0)
#处理有问题的文件名file_name=os.listdir('./2018.5.3')#得到该路径下的所有文件字符串对象for temp in file_name: try: #if '.0_followers' in temp: if '.0.xls' in temp: new_name=tem Read More
posted @ 2018-05-14 09:55 巴拉巴拉程序猿 Views(317) Comments(0) Diggs(0)
import rew=writeXLS.WriteXLS('result_adaboost1.xls')#写入表格的方法,可以随意换一种方法f=open('result_adaboost.txt')#数据格式为Predicted: 802.1875, Target: 1083.0 #Predicte Read More
posted @ 2018-05-11 17:47 巴拉巴拉程序猿 Views(244) Comments(0) Diggs(0)
'''一、最笨的办法了################################################################为了处理由于账号被封而没跑到的问题id进行以下两步:################################################# Read More
posted @ 2018-05-07 16:48 巴拉巴拉程序猿 Views(626) Comments(0) Diggs(0)
主要有八个因素: 背景(Your Background):对于proposal有意义的要点,如国家职业证书、技能、经验、能力和实习经历等。 大纲(Outline Proposal):描述你明确的感兴趣的领域,研究和方向;你希望能够通过学习来承接过去的知识并启发未来的职业道路。用3,4句话阐释你的pr Read More
posted @ 2018-04-16 22:24 巴拉巴拉程序猿 Views(586) Comments(0) Diggs(0)