07 2018 档案

摘要:一、XPath from lxml import etree html = etree.parse('html源代码',etree.HTMLPaser()) 1.节点的获取 a.html.xpath('//*') #匹配HTML中的所有节点 b.html.xapth('//li') #匹配所有的li 阅读全文
posted @ 2018-07-28 15:49 夜尽天已明 阅读(951) 评论(0) 推荐(0)
摘要:DecisionTreeRegressor 树模型参数: 1.criterion gini(基尼系数) or entropy(信息熵) 2.splitter best or random 前者是在所有特征中找最好的切分点 后者是在部分特征中(数据量大的时候) 3.max_features None( 阅读全文
posted @ 2018-07-28 13:07 夜尽天已明 阅读(5082) 评论(0) 推荐(1)
摘要:1.先来谈一谈loc,loc这个方法就是你有啥我就用啥,你没有的我不用,pandas对象的index,columns有什么,pd.loc[index,column],index就是pd.index的其中的一个值或者是其中几个值组成的序列,或就是pd.index,column是pd.columns中的 阅读全文
posted @ 2018-07-27 19:05 夜尽天已明 阅读(1243) 评论(0) 推荐(0)