随笔分类 -  python

PyLucene检索demo
摘要:# coding: utf-8import luceneindexDir = './index'query = 'zhongguo'lucene.initVM()print 'lucene', lucene.VERSION#索引的存放位置indir = lucene.SimpleFSDirectory(lucene.File(indexDir))#分词器analyzer = lucene.StandardAnalyzer(lucene.Version.LUCENE_CURRENT)#检索器searcher = lucene.IndexSearch 阅读全文
posted @ 2013-07-15 18:10 TianMG 阅读(499) 评论(0) 推荐(0)
PyLucene索引DEMO
摘要:# coding:utf-8'''对doc目录里的所有文件建立索引,索引域主要有name,path,contents'''import sys, osimport lucenefrom lucene import SimpleFSDirectory,Document,File, Field,\ StandardAnalyzer, IndexWriter, Versionfrom datetime import datetimelucene.initVM() ############1print 'lucene',lucene.VE 阅读全文
posted @ 2013-07-15 18:09 TianMG 阅读(511) 评论(0) 推荐(0)
PyLucene 的安装
摘要:下面以python2.7 win32为例的安装步骤。1 安装jdk,配置环境变量。最新的jdk就可以2,将C:\Program Files\Java\jdk1.6.0_45\jre\bin\client加入Path路径3 安装python的easy_install工具。下载地址:http://pypi.python.org/pypi/setuptools 可以找到正确的版本进行下载。win7 32位可以下载setuptools-0.6c11.win32-py2.7.exe将D:\Program Files\python2.7\scripts添加到环境变量中4,安装JCCeasy_install 阅读全文
posted @ 2013-06-25 09:20 TianMG 阅读(959) 评论(0) 推荐(0)
关于__new__和__init__的不同与用法
摘要:提到__new__就不能不说__init__,先说说关于__new__和__init__的不同与用法: object.__new__(cls[, ...]):调用创建cls类的一个新的实例。是静态方法不用声明。返回一个新对象的实例 object.__init__(self[, ...]):当实例创建的时候调用。没有返回值。 __new__在__init__这个之前被调用: 如果__new__返回一个cls的实例,那么新的实例的__init__方法就会被调用,且self是这个新的实例。如果是自定义重写__new__,没有调用__init__的话__init__就不... 阅读全文
posted @ 2013-06-19 17:07 TianMG 阅读(277) 评论(0) 推荐(0)
python 小记
摘要:1,当函数没有显式地返回一个值时,例如没有执行到return object语句就结束了,他就返回None。2 finally会自动的重新引发异常。3.with语句目标的应用场景:保证共享资源的唯一分配,并在任务结束时释放它。比如文件(数据、日志、数据库等等)、线程资源、简单同步、数据库连接等等。类似于try...except但简化代码。with context_expr [as var]: with_suite with语句仅能工作于支持上下文管理协议(context management protocol)的对象,即只有内建了‘上下文管理’的对象才可以和with一起工作。 支持wit... 阅读全文
posted @ 2013-05-25 16:36 TianMG 阅读(178) 评论(0) 推荐(0)
python 浅拷贝与深拷贝
摘要:1 非容器类型(比如数字、字符串和其他“原子”类型的对象,像代码、类型和xrange对象等)没有拷贝一说,浅拷贝是用完全切片操作来完成的。2 如果元组变量只包含原子类型对象,对它的深拷贝将不会进行。即便是 import copy 执行了copy.deepcopy也只能得到一个浅拷贝。 阅读全文
posted @ 2013-05-25 11:28 TianMG 阅读(175) 评论(0) 推荐(0)
python 字符串使用技巧
摘要:1,变编译时字符串连接,第一种是正常(‘\’),第二种是不成用的。s1="hello world \ !!!" print 's1: ',s1s2="hello world" "!" "!!! " ' I love you' print 's2: ',s2 s1: hello world !!!s2: hello world!!!! I love you2 字符串模板1 from string import Template2 s=Template('I am 阅读全文
posted @ 2013-05-25 10:30 TianMG 阅读(221) 评论(0) 推荐(0)
python iter()的使用 迭代器 生成器的使用
摘要:废话不多说 直接上代码:s=iter('12345')print 's.next(): ', s.next()print 'type(s.next()):' , type(s.next())print 's.next(): ', s.next()print 'type(s):' , type(s)dic ={ 'a':'c','b':'c'}d=iter(dic)print 'dic= ',dicprint 'type(d): 阅读全文
posted @ 2013-05-25 10:25 TianMG 阅读(541) 评论(0) 推荐(0)
python json 转换成xml
只有注册用户登录后才能阅读该文。
posted @ 2013-05-24 20:46 TianMG 阅读(8) 评论(0) 推荐(0)
python xml.etree解析xml
摘要:config.xml<?xml version="1.0" encoding="UTF-8"?> <employees> <employee> <name lang='en'>linux</name> <age>30</age> </employee> <employee> <name>windows</name> <age>20</age> </employee> < 阅读全文
posted @ 2013-05-15 22:37 TianMG 阅读(941) 评论(0) 推荐(0)
python yield
摘要:参考文章如下:http://blog.donews.com/limodou/archive/2006/09/04/1028747.aspxhttp://www.cnblogs.com/xuxm2007/archive/2010/08/30/1812566.html 阅读全文
posted @ 2013-05-15 15:18 TianMG 阅读(116) 评论(0) 推荐(0)
python urllib2
摘要:第一种方法:(其中url,可用ftp、file等协议)>>> import urllib2>>> response = urllib2.urlopen('http://python.org/')>>> print response.read(),response.geturl(),response.getcode()第二种方法:>>> import urllib2>>> req=urllib2.Request("http://python.org")>>&g 阅读全文
posted @ 2013-05-13 19:36 TianMG 阅读(414) 评论(0) 推荐(0)
python with
摘要:参考如下资料:1 http://effbot.org/zone/python-with-statement.html2 http://blog.csdn.net/elevenqiao/article/details/67966533 http://blog.csdn.net/largetalk/article/details/6910277 阅读全文
posted @ 2013-05-13 14:28 TianMG 阅读(111) 评论(0) 推荐(0)
python *args ** kwargs
摘要:argv:命令行参数List,第一个元素是程序本身路径,如需获取参数可用argv[1:]*args and * kwargs简单地说:*args去匹配没有指定参数名的参数,即列举出来的参数agr1,arg2,agr3。**kwargs 去匹配指定参数名的参数,形如:arg1="arg1",arg2="arg2",arg3="arg3"关于*args and * kwargs的使用看下面几个例子:>>> def print_everything(*args): for count,thing in enumerate( 阅读全文
posted @ 2013-05-13 14:09 TianMG 阅读(279) 评论(0) 推荐(0)
python sys module
摘要:sys模块 系统信息和方法模块,提供了很多实用的变量和方法: argv:命令行参数List,第一个元素是程序本身路径 builtin_module_names:Python解释器导入的模块列表 modules.keys():返回所有已经导入的模块列表 exc_info():获取当前正在处理的异常类 exc_type、exc_value、exc_traceback:当前处理的异常详细信息 executable:Python解释程序路径 exit(n):退出程序,正常退出时exit(0) getwindowsversion():获取Windows的... 阅读全文
posted @ 2013-05-13 14:01 TianMG 阅读(366) 评论(0) 推荐(0)
python os模块简介
摘要:os.sep 可以取代操作系统特定的路径分割符os.linesep 字符串给出当前平台使用的行终止符。例如,Windows使用'\r\n',Linux使用'\n' 而Mac使用'\r'。os.name 字符串指示你正在使用的平台。比如对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'os.getcwd() 函数得到当前工作目录,os.getenv()和os.putenv() 函数分别用来读取和设置环境变量。os.listdir(dirname):列出dirname下的目录和文件os 阅读全文
posted @ 2013-05-13 12:02 TianMG 阅读(564) 评论(0) 推荐(0)
python 学习笔记(1、数据类型)
摘要:1: python中的每个对象都可以分为不可变性和可变性。在核心类型中,数字、字符串、元组是不可变的;列表、字典可以自由地改变。2: 以r开口的字符串可以关闭反斜线转义机制,以u开头的字符串支持unicode字符串形式。ord()是将字符转换为ASCII码(以10进制显示结果),chr()执行相反的操作。3: 元组的不可变性经常用于提供一种完整性约束,例如传递一个对象的集合时,集合内的对象是不能改变的。4: python的长整型支持无穷无尽的大小,只要内存空间允许,一般在数字后面加L。5: 在python中,变量名没有类型,类型是属于对象。只是把变量名引用了对象。6: 在python中,变量总 阅读全文
posted @ 2012-09-28 17:33 TianMG 阅读(244) 评论(0) 推荐(0)