会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
鹤城
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
10
下一页
2023年3月4日
第二三周学习总结
摘要: 第二周明显有所懈怠,靡不有初,鲜克有终。坚持,努力。 这两周还在爬虫,学习了urllib库,bs4模块,re库,分别是伪装浏览器,解析数据,字符串规则,目前还差保存数据模块,即xlwt库,等学完就把完整爬取豆瓣的过程发表博客,预计今天完成。总之最近太懈怠了,千万别走原来的老路。
阅读全文
posted @ 2023-03-04 14:35 鹤城
阅读(20)
评论(0)
推荐(0)
2023年2月25日
python爬虫学习——re模块(正则表达式)
摘要: 正则表达式常用操作符 . 任何单个字符 [] 字符集,对单个字符给出取值范围 [abc]、[a-z] [^ ] 非字符集,对单个字符给出排除范围 [^abc] * 对前一个字符0次或无限次拓展 abc* + 前一个字符一次或无限次拓展 abc+ ? 前一个字符0次或一次拓展 abc? | 左右表达式
阅读全文
posted @ 2023-02-25 19:42 鹤城
阅读(28)
评论(0)
推荐(0)
2023年2月23日
python爬虫学习——bs4
摘要: ##bs4 将一个复杂的html文档转化为一个复杂的树形结构,每个节点都是python对象,所有对象可以分为四种:Tag、NavigableString、BeautifulSoup、Comment from bs4 import BeautifulSoup f = open("./htmlDemo1
阅读全文
posted @ 2023-02-23 22:21 鹤城
阅读(51)
评论(0)
推荐(0)
2023年2月22日
第一周学习总结(02.21)
摘要: 这一周主要学习了python爬虫,主要是列表,元组,函数,文件操作,异常处理和爬虫基本概念的学习,除此之外还学习了一点xml。 列表:[],列表可以存储混合类型,for循环遍历输出,以及列表的增删改查,增:append,extend,insert:删:pop,del,remove,查in,not i
阅读全文
posted @ 2023-02-22 00:00 鹤城
阅读(26)
评论(0)
推荐(0)
2023年2月21日
python爬虫学习——urllib库
摘要: #获取一个get请求 #import urllib.request # response = urllib.request.urlopen("http://www.baidu.com") # print(response.read().decode('utf-8')) #对获取到的网页源码进行utf
阅读全文
posted @ 2023-02-21 17:22 鹤城
阅读(35)
评论(0)
推荐(0)
python终端中使用pip指令下载模块显示SyntaxError: invalid syntax解决办法
摘要: 今天学习爬虫导入模块时遇到以下错误,即语法错误 >>> pip bs4 File "<stdin>", line 1 pip bs4 ^^^ SyntaxError: invalid syntax 然后我发现终端已经给出了这段话 无法加载文件 E:\pythonProject\demo1_str\v
阅读全文
posted @ 2023-02-21 09:43 鹤城
阅读(396)
评论(0)
推荐(0)
2023年2月20日
python爬虫学习——文件操作,异常处理
摘要: ##文件操作 ''' f = open("a.txt","w") #打开一个文件, w模式(写),如果文件不存在就在当前目录下创建 f.write("hello world,i am here") #将字符串写入文件中 f.close() #关闭文件 ''' ''' #read方法:读取指定的字符,
阅读全文
posted @ 2023-02-20 16:55 鹤城
阅读(61)
评论(0)
推荐(0)
2023年2月17日
python爬虫基本学习——函数
摘要: 函数 概念:编写程序时,需要某块代码多次,为了提高编写效率和代码的重用,把具有独立功能的代码块组织为一个小模块,即函数。 代码练习 ''' #函数的定义 def printinfo(): print(" ") print("人生苦短,我用python") print(" ") #函数的调用 prin
阅读全文
posted @ 2023-02-17 10:12 鹤城
阅读(72)
评论(0)
推荐(0)
2023年2月16日
python爬虫学习——元组,字典
摘要: 元组 ''' tup1 = () #创建一个空的元组 print(type(tup1)) #tup2 = (50) #不是元组,python把括号当成了表达式的一部分,即数学运算的括号 #tup2 = (50,) tup2 = (50,60,70) print(type(tup2)) ''' '''
阅读全文
posted @ 2023-02-16 14:35 鹤城
阅读(126)
评论(2)
推荐(0)
2023年2月15日
xml基本学习
摘要: 概念:可拓展标记语言。可拓展即标签都是自定义的。标记语言即由标签构成的语言。 功能:存储数据: 配置文件 在网络中传输 语法 基本语法: xml文件后缀名为.xml xml第一行必须定义为文档声明 xml文档中有且只有一个根标签 属性值必须有引号 标签必须正确关闭 xml标签区分大小写 <?xml
阅读全文
posted @ 2023-02-15 22:05 鹤城
阅读(35)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
10
下一页
公告