黄聪

论SEO对人类的重要性,请看我的博客:hcsem.com

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

本文演示使用NLTK让计算机学习如何通过名字识别性别。

1、导入NLTK:

import nltk
from nltk.book import *

2、定义学习方法

def gender_features(word):
return {'last_letter':word[-1]}

3、导入学习的姓名-性别名单:

from nltk.corpus import names
import random
names
=([(name,'male') for name in names.words('male.txt')] + [(name,'female') for name in names.words('female.txt')])
random.shuffle(names)

4、开始学习

f = [(gender_features(n),g) for (n,g) in names]
trainset,testset
= f[500:],f[:500]
c
= nltk.NaiveBayesClassifier.train(trainset)

5、测试:

c.classify(gender_features('Neo'))
c.classify(gender_features(
'Trinity'))

posted on 2011-08-29 18:30  黄聪  阅读(6509)  评论(0编辑  收藏  举报