上一页 1 ··· 8 9 10 11 12 13 14 15 16 下一页

将python中的dict按值排序

摘要: 这几天仍在做社交圈子挖掘,实验将会整理整理再与大家分享,分析中,遇到一个问题,就对是python的dict的value进行排序:有什么好的方法么?我搜了一下,找到以下几种,分享:假设有dict如下:x = {1: 2, 3: 4, 4:3, 2:1, 0:0} import operatorsorted_x = sorted(x.iteritems(), key=operator.itemgett... 阅读全文
posted @ 2012-03-12 19:44 sing1ee 阅读(486) 评论(0) 推荐(0)

问道python

摘要: 做好某些领域的研究,做好某些领域的工程。这是我对自己的要求,研究就是做社交网络挖掘,现在很火,我也跟着凑热闹。一连发了几篇社交圈子挖掘的博客,越来越有心得。这是个好的兆头,再接再厉。 在做社交圈子挖掘的过程中,我需要不断的做实验,试验论文中的想法,自己的想法,要求效果好,而且coding要快。我比较熟悉java,c++也会一些,但是我都没有选择,我选择了我不熟悉的python,一方面,networkx是pyhton写的。另一方面,想见识一下python的魅力。 我目前用得都比较简单,但是也明显感觉开发速度快,方便的特点,使用python我感觉很随意,觉得自己好像触碰到自由的边沿。java也是开 阅读全文
posted @ 2012-03-03 00:43 sing1ee 阅读(358) 评论(0) 推荐(0)

微博社交圈子挖掘的一种有趣的思路

摘要: 这是我在一篇论文中看到的思路,与之前的一些思路有比较大的不同。论文没有通篇看完,只看到算法描述部分,我就迫不及待的实验,对于同学,同事圈子的挖掘有一定的效果。我之前了解的一些算法的思路可以总结如下:从节点开始,每个节点作为一个社团圈子进行合并从整个网络开始,通过某些算法选取某些边,进行分割从最大团开始,选择合适的相似度计算的方法,对最大团进行合并我比较关注圈子之间有重叠的情况。前两种,我目前实验做得少,主要集中在第三种,及其扩展。第三种思路目前比较经典的就是k-clique算法,相似度计算的依据很强,很直接,就是要有k-1公共节点。后来有几篇文章,也是从最大团开始做的。我个人认为,是一个很好的 阅读全文
posted @ 2012-03-02 16:25 sing1ee 阅读(1078) 评论(8) 推荐(0)

微博社交圈子的评价

摘要: 这几天不断尝试社交圈子挖掘的算法,不断改进算法,产生了很多的结果。对于我自己的圈子,我人工评价即可知道效果如何,但是如果测试其他人的数据,总是请同学帮忙验证,有些过于麻烦,而且,这样的人工评价,不利于比较。所以,我需要一个相对准确的方法来评价我挖掘出的圈子的效果如何。 我经常听有人说圈子的“准确率”,“召回率”如何如何。但是,我觉得这个也不是很直观,因为这个需要标注数据,来进行测评。那我们能否从网络拓扑结构本身入手,进行判断呢?当然可以,就是:quality function。 这个思路很早就提出来了。要分析这个思路,还要先说说社团结构的定义。对于社团结构,一直没有很好的定义,尤其是量化的定义 阅读全文
posted @ 2012-02-29 16:21 sing1ee 阅读(303) 评论(0) 推荐(0)

微博社交圈子挖掘所面临的困难

摘要: 我很喜欢《亮剑》这部电视剧,李云龙经常说:我们不能打了半天,不知道敌人是谁。所以 ,这一篇文章,我简单分析一下,微博社交圈子挖掘目前遇到的问题是什么?不能分析了半天,只注重结果如何如何,却忘记了最根本的问题、难题是什么。 复杂网络中社团结构发现的研究已经有好多年了,有分裂的方法,凝聚的方法,基于网络动力学的方法,还有很多别的奇怪的方法。这些方法都有各自适应的解决的网络结构。比如前一篇博客中提到的两点:层次性重叠性一些方法层次性处理的很好,如GN,Newman‘s fast algorithm等,有些重叠性处理的非常好,如k-clique方法比较典型。后来,研究人员相继提出一些方法,将上面的两个 阅读全文
posted @ 2012-02-28 15:04 sing1ee 阅读(1008) 评论(0) 推荐(0)

社交圈子挖掘尝试

摘要: 微博构成了一个社交网络,链接非常复杂,学术一点说叫做复杂网络。在社交网络中发现圈子,其实就是在复杂网络中发现社团结构,有很多方法可以依循。但是目前这些方法,都有各自的优缺点,没有相对完美的算法。从今天开始尝试学习、分析这些算法的特点,并且希望能够进行不遗余力的改进。 在一个复杂的社交网络中,有两个特点,首先要很清楚,才能够判断挖掘的圈子是否合理,是否贴合实际:层次性:在社交网络中,圈子、或者社团结构,往往都是可以分为子圈子、子社团结构的,可能是由于选取某系的某种不同程度。重叠性:由于人的多面的属性,在实际的社交网络中,圈子往往是重叠的。根据以上两个重要的特点,分别有比较典型的代表算法:Newm 阅读全文
posted @ 2012-02-25 10:00 sing1ee 阅读(1751) 评论(0) 推荐(0)

构建高性能java程序-使用mapped file创建超大的矩阵

摘要: 今天在一个博客中看到一个程序,使用mapped file机制,创建超大的矩阵,主要是为了节省内存,避免内存溢出异常。主要代码如下:/** * */package high.performace.java;import java.io.Closeable;import java.io.IOException;import java.io.RandomAccessFile;import java.n... 阅读全文
posted @ 2012-02-23 11:25 sing1ee 阅读(436) 评论(0) 推荐(0)

编写高性能的java程序

摘要: 看了几篇文章介绍高性能java程序开发的,主要是关于采用一些什么样的方法,能够较大的提升java程序的性能,主要有以下几点: 使用unsafe的类,去掉一些不必要的检查。这部分我平时没有使用,需要进一步研究 尽可能少的使用内存,比如对于基础类型的集合,可以采用Trove工具包。 java中默认的String的实现性能比较低,是基于char[],java 6之后,使用-XX:+UseCompress... 阅读全文
posted @ 2012-02-23 10:27 sing1ee 阅读(235) 评论(0) 推荐(0)

ubuntu环境下,eclipse CDT链接库设置

摘要: ubuntu下,适用eclipse开发c++程序,经常会需要连接外部的库,主要有两种方法: 直接修改Debug/objects.mk: 修改如下:LIBS := -lxapian 右键项目->peoperties->c/c++ Build->Settings->Tool Settings->GCC C++ Linkder->Libraries。在上面的Libraries(-l)中添加,比如我要添加... 阅读全文
posted @ 2012-02-22 11:27 sing1ee 阅读(327) 评论(0) 推荐(0)

在Ubuntu上安装Go环境

摘要: 打算将一篇论文中的存储引擎实现了,java效率相对低,不想用c++,就想到了google开源的go语言。这次是真的有实际需求的学习了。开始安装: 安装c语言工具:gcc,make,awk等,一般默认都安装好了 安装Mercurial,sudo easy_install mercurial, 如果没有安装easy_install,执行:apt-get install python-setuptool... 阅读全文
posted @ 2012-02-21 17:57 sing1ee 阅读(341) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 下一页