Mechanize抓取数据【Ruby】
创建: 2017/08/05
更新: 2018/01/08 修正: ele_inner_text -> ele.inner_text
补充: inner_text和text一样
| 第一步 | gemfile里面加上
# 2017/08/05 拉取数据
这行是注释,自己随便写点啥
gem 'mechanize'
|
| 第二步 | bundle install 在项目目录下运行,安装Mechanize |
| 第三步 | 新建文件 scraping.rb 位置 app/models |
| 先自己标点注释, 实际第一行加上 require 'mechanize' |
|
| Mechanize方法 | |
| 创建 | agent = Mechanize.new |
| 读取 | page = agent.get('...') ''内部放网址 |
| 获取特定标签内容 满足条件的所有内容 |
elements = page.search('..') |
| 获取标签内部文本 | elements.each do |ele| puts ele.inner_text end |
| 获取特定标签内容 满足条件的一个内容 |
elements = page.at('..') |
| 获取内部属性 | elements.each do |ele| link = ele.get_attribute(:href) end 或者简写为ele[:href] |

浙公网安备 33010602011771号