Python 类
1. 通过class关键字定义自己的类。
1.1 当实例化一个类时:
① 先被调用的:__new__。
② __int__用于实例化一个类。
class CoalCrawler:
def __init__(self, log_file, start_date, end_date, out_file):
"""
Args:
log_file:日志文件
start_date:待抓取数据的开始日期
end_date:待抓取数据的结束日期
out_file:抓取结果的存放文件
"""
self.__log_file = log_file
self.__url = "http://www.cctd.com.cn/list-148-"
self.__suffix = '.html'
self.__start_date = datetime.strptime(start_date, '%Y-%m-%d')
self.__end_date = datetime.strptime(end_date, '%Y-%m-%d')
self.__out_file = out_file
2. 方法:在一个类中,可能出现三种方法,实例方法、静态方法和类方法。
实例方法
实例方法只能通过类实例进行调用,这时候”self”就代表这个类实例本身。通过”self”可以直接访问实例的属性。
class Student(object):
'''
this is a Student class
'''
count = 0
books = []
def __init__(self, name, age):
self.name = name
self.age = age
def printInstanceInfo(self):
print "%s is %d years old" %(self.name, self.age)
pass
wilber = Student("Wilber", 28)
wilber.printInstanceInfo()
类方法
类方法以cls作为第一个参数,cls表示类本身,定义时使用@classmethod装饰器。通过cls可以访问类的相关属性。
class Student(object): ''' this is a Student class ''' count = 0 books = [] def __init__(self, name, age): self.name = name self.age = age @classmethod def printClassInfo(cls): print cls.__name__ print dir(cls) pass Student.printClassInfo() wilber = Student("Wilber", 28) wilber.printClassInfo()
静态方法
与实例方法和类方法不同,静态方法没有参数限制,既不需要实例参数,也不需要类参数,定义的时候使用@staticmethod装饰器。
同类方法一样,静态法可以通过类名访问,也可以通过实例访问。
1 class Student(object): 2 ''' 3 this is a Student class 4 ''' 5 count = 0 6 books = [] 7 def __init__(self, name, age): 8 self.name = name 9 self.age = age 10 11 @staticmethod 12 def printClassAttr(): 13 print Student.count 14 print Student.books 15 pass 16 17 Student.printClassAttr() 18 wilber = Student("Wilber", 28) 19 wilber.printClassAttr()
这三种方法的主要区别在于参数,实例方法被绑定到一个实例,只能通过实例进行调用;但是对于静态方法和类方法,可以通过类名和实例两种方式进行调用。
3. 访问控制
Python中没有访问控制的关键字,例如private、protected等等。但是,在Python编码中,有一些约定来进行访问控制。
单下划线”_”
在Python中,通过单下划线”_”来实现模块级别的私有化,一般约定以单下划线”_”开头的变量、函数为模块私有的,也就是说”from moduleName import *”将不会引入以单下划线”_”开头的变量、函数。
现在有一个模块lib.py,内容用如下,模块中一个变量名和一个函数名分别以”_”开头:
1 numA = 10 2 _numA = 100 3 4 def printNum(): 5 print "numA is:", numA 6 print "_numA is:", _numA 7 8 def _printNum(): 9 print "numA is:", numA 10 print "_numA is:", _numA
当通过下面代码引入lib.py这个模块后,所有的以”_”开头的变量和函数都没有被引入,如果访问将会抛出异常:
1 from lib import * 2 print numA 3 printNum() 4 5 print _numA 6 #print _printNum()
双下划线”__”
对于Python中的类属性,可以通过双下划线”__”来实现一定程度的私有化,因为双下划线开头的属性在运行时会被”混淆”(mangling)。
在Student类中,加入了一个”__address”属性:
1 class Student(object): 2 def __init__(self, name, age): 3 self.name = name 4 self.age = age 5 self.__address = "Shanghai" 6 7 pass 8 9 wilber = Student("Wilber", 28) 10 print wilber.__address
当通过实例wilber访问这个属性的时候,就会得到一个异常,提示属性”__address”不存在。
其实,通过内建函数dir()就可以看到其中的一些原由,”__address”属性在运行时,属性名被改为了”_Student__address”(属性名前增加了单下划线和类名)
1 >>> wilber = Student("Wilber", 28) 2 >>> dir(wilber) 3 ['_Student__address', '__class__', '__delattr__', '__dict__', '__doc__', '__form 4 at__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__r 5 educe__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', ' 6 __subclasshook__', '__weakref__', 'age', 'name'] 7 >>>
所以说,即使是双下划线,也没有实现属性的私有化,因为通过下面的方式还是可以直接访问”__address”属性:
>>> wilber = Student("Wilber", 28) >>> print wilber._Student__address Shanghai >>>
双下划线的另一个重要的目地是,避免子类对父类同名属性的冲突。
看下面一个例子:
1 class A(object): 2 def __init__(self): 3 self.__private() 4 self.public() 5 6 def __private(self): 7 print 'A.__private()' 8 9 def public(self): 10 print 'A.public()' 11 12 class B(A): 13 def __private(self): 14 print 'B.__private()' 15 16 def public(self): 17 print 'B.public()' 18 19 b = B()
当实例化B的时候,由于没有定义__init__函数,将调用父类的__init__,但是由于双下划线的”混淆”效果,”self.__private()”将变成 “self._A__private()”。
看到这里,就清楚为什么会有如下输出了:

“_”和” __”的使用 更多的是一种规范/约定,不没有真正达到限制的目的:
“_”:以单下划线开头的表示的是protected类型的变量,即只能允许其本身与子类进行访问;同时表示弱内部变量标示,如,当使用”from moduleNmae import *”时,不会将以一个下划线开头的对象引入。
“__”:双下划线的表示的是私有类型的变量。只能是允许这个类本身进行访问了,连子类也不可以,这类属性在运行时属性名会加上单下划线和类名。

浙公网安备 33010602011771号