07 2015 档案
摘要:现有一个列表:list=["h","e","l","l","o"]需要将列表里的所有元素合并为一个字符串 “hello”,Python没有内置函数可以将列表的所有元素连接起来,类似于String的join函数。可以采用另一种方法 importitertools >>>s="".join(itert...
阅读全文
摘要:列表 元组 字典 集合的区别是python面试中最常见的一个问题。这个问题虽然很基础,但确实能反映出面试者的基础水平。 (1)列表 什么是列表呢?我觉得列表就是我们日常生活中经常见到的清单。比如,统计过去一周我们买过的东西,把这些东西列出来,就是清单。由于我们买一种东西可能不止一次,所以清单中...
阅读全文
摘要:算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个...
阅读全文
摘要:python中文输出乱码问题困扰了多少初学者,我在这方面栽了不知道多少跟头。现在我把我碰到的问题和解决的方法写出来与大家分享一下:1输出乱码所谓的乱码是指“鎴戞槸涓枃瀛楃涓”这样的内容。为什么会输出这样的结果呢?因为python的输入和输入讲究“出入不一致”的原则。所谓“出入不一致”指的什么样的...
阅读全文
摘要:互联网行业自发展以来,以其专业性和使用的普及性这两个矛盾特性,对于广大受众来说,成了最熟悉的陌生人。五十岁以下几乎都是网民,也有个别的高龄网民年龄在七八十岁。而受众对于网络的熟悉仅仅在于使用,上网功能应用、各种软件的使用等,对于互联网的运营以及开发等相关行业内部管理及生态,却碍于互联网本身高度的专业...
阅读全文
摘要:接着上一篇的撒~上一篇提到了微博的几个特点,下面继续说一下微博的第三个特点:(3)表达情感强烈而理性评价淡化由于传播空间的相对自由和匿名评论的相对隐秘,因而网友在表达观点时会采用一些比较极端和激烈的形式,又因微博字数的限制,无法以逻辑鲜明的论述方式进行理性表达,所以在话题型微博中,观点句的表达往往感...
阅读全文
摘要:什么是敏捷开发? 敏捷开发(Agile Development)是一种以人为核心、迭代、循序渐进的开发方法。怎么理解呢?首先,我们要理解它不是一门技术,它是一种开发方法,也就是一种软件开发的流程,它会指导我们用规定的环节去一步一步完成项目的开发;而这种开发方式的主要驱动核心是人;它采用的是迭代式开...
阅读全文
摘要:上一篇提到了情感分析几个疑问,也许这些疑问可以给大家带来些启发,不过在研究这些疑问之前,我们还是需要详细了解一下微博的特征是怎么样的,会不会对我们对其进行情感分析产生影响。 除了一些很牛X的人,其实大多数的微博用户都是草根,甚至像笔者一样,草根都算不上,只是个小屌丝~微博的主人很少有用真名字的...
阅读全文
摘要:话说微博面世已经很久了,但对于微博信息的挖掘却才刚刚起步,这其中的原因当然有信息挖掘的技术还不成熟,但我觉得主要问题还是在于中文信息处理的技术还处于萌芽的阶段。中文语言本身信息量就很大,歧义性词汇多,再加上微博语言语义不整、微博媒介本体中夹杂着大量的标签,导致微博技术发展缓慢。在现在的网络上,用...
阅读全文
摘要:语言模型的作用在于构建为字符串s的概率分布p(s),也即是一个字符串作为一个句子出现的概率。语言模型与句子是否合法没有关系,即便一句话是符合逻辑的,但仍可以认为其出现的概率为零。但反过来不成立,即如果一句话不符合逻辑,那么直接认为这句话出现的概率为零。 对于一个有m个词的句子s=sw1w2w...
阅读全文

浙公网安备 33010602011771号