摘要:
在编码问题上困住了好久,对BeautifulSoup的问题在上一篇blog也分析了 最后写文件的时候用的gb18030编码解决的 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX 哎,我就是载在了 阅读全文
摘要:
今天爬一个网站,它的class里有空格,导致我用BeautifulSoup半天没爬出来,后来看了文档,这叫多值属性: HTML 4定义了一系列可以包含多个值的属性.在HTML5中移除了一些,却增加更多.最常见的多值的属性是 class (一个tag可以有多个CSS的class). 还有一些属性 re 阅读全文