摘要: # coding: utf-8import luceneindexDir = './index'query = 'zhongguo'lucene.initVM()print 'lucene', lucene.VERSION#索引的存放位置indir = lucene.SimpleFSDirectory(lucene.File(indexDir))#分词器analyzer = lucene.StandardAnalyzer(lucene.Version.LUCENE_CURRENT)#检索器searcher = lucene.IndexSearch 阅读全文
posted @ 2013-07-15 18:10 TianMG 阅读(488) 评论(0) 推荐(0) 编辑
摘要: # coding:utf-8'''对doc目录里的所有文件建立索引,索引域主要有name,path,contents'''import sys, osimport lucenefrom lucene import SimpleFSDirectory,Document,File, Field,\ StandardAnalyzer, IndexWriter, Versionfrom datetime import datetimelucene.initVM() ############1print 'lucene',lucene.VE 阅读全文
posted @ 2013-07-15 18:09 TianMG 阅读(498) 评论(0) 推荐(0) 编辑
摘要: IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。Analyzer luceneAnalyzer = new StandardAnalyzer(); IndexWriter indexWriter = new IndexWriter(indexDir, luceneAnalyzer, true ); indexWriter.addDocument(document)Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有StandardAnalyzer分析器,StopAnalyzer分析器,... 阅读全文
posted @ 2013-06-25 10:19 TianMG 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 下面以python2.7 win32为例的安装步骤。1 安装jdk,配置环境变量。最新的jdk就可以2,将C:\Program Files\Java\jdk1.6.0_45\jre\bin\client加入Path路径3 安装python的easy_install工具。下载地址:http://pypi.python.org/pypi/setuptools 可以找到正确的版本进行下载。win7 32位可以下载setuptools-0.6c11.win32-py2.7.exe将D:\Program Files\python2.7\scripts添加到环境变量中4,安装JCCeasy_install 阅读全文
posted @ 2013-06-25 09:20 TianMG 阅读(924) 评论(0) 推荐(0) 编辑
摘要: for x in range(1,101): print"fizz"[x%3*len('fizz')::]+"buzz"[x%5*len('buzz')::] or x 阅读全文
posted @ 2013-06-20 10:10 TianMG 阅读(1932) 评论(0) 推荐(0) 编辑
摘要: 提到__new__就不能不说__init__,先说说关于__new__和__init__的不同与用法: object.__new__(cls[, ...]):调用创建cls类的一个新的实例。是静态方法不用声明。返回一个新对象的实例 object.__init__(self[, ...]):当实例创建的时候调用。没有返回值。 __new__在__init__这个之前被调用: 如果__new__返回一个cls的实例,那么新的实例的__init__方法就会被调用,且self是这个新的实例。如果是自定义重写__new__,没有调用__init__的话__init__就不... 阅读全文
posted @ 2013-06-19 17:07 TianMG 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 转载:http://sumongh.iteye.com/blog/82498具体来说cookie机制采用的是在客户端保持状态的方案。它是在用户端的会话状态的存贮机制,他需要用户打开客户端的cookie支持。cookie的作用就是为了解决HTTP协议无状态的缺陷所作的努力.而session机制采用的是一种在客户端与服务器之间保持状态的解决方案。同时我们也看到,由于采用服务器端保持状态的方案在客户端也需要保存一个标识,所以session机制可能需要借助于cookie机制来达到保存标识的目的。而session提供了方便管理全局变量的方式session是针对每一个用户的,变量的值保存在服务器上,用一个 阅读全文
posted @ 2013-06-08 16:59 TianMG 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 1,当函数没有显式地返回一个值时,例如没有执行到return object语句就结束了,他就返回None。2 finally会自动的重新引发异常。3.with语句目标的应用场景:保证共享资源的唯一分配,并在任务结束时释放它。比如文件(数据、日志、数据库等等)、线程资源、简单同步、数据库连接等等。类似于try...except但简化代码。with context_expr [as var]: with_suite with语句仅能工作于支持上下文管理协议(context management protocol)的对象,即只有内建了‘上下文管理’的对象才可以和with一起工作。 支持wit... 阅读全文
posted @ 2013-05-25 16:36 TianMG 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 1 非容器类型(比如数字、字符串和其他“原子”类型的对象,像代码、类型和xrange对象等)没有拷贝一说,浅拷贝是用完全切片操作来完成的。2 如果元组变量只包含原子类型对象,对它的深拷贝将不会进行。即便是 import copy 执行了copy.deepcopy也只能得到一个浅拷贝。 阅读全文
posted @ 2013-05-25 11:28 TianMG 阅读(163) 评论(0) 推荐(0) 编辑
摘要: enumerate的使用:输出序列的索引>>> lst1=['1','2','3','4']>>> lst2=['a','b','c','d']>>> for i, l1 in enumerate(lst1): print i,l1 0 11 22 33 4zip的使用:使两个序列结合输出:>>> for l1 ,l2 in zip(lst1,lst2): print l1,"=&quo 阅读全文
posted @ 2013-05-25 11:24 TianMG 阅读(148) 评论(0) 推荐(0) 编辑