Python 爬取猫眼 急先锋 评论 ,感觉豆瓣太假,来看看猫眼的

 

 12.4w评论了,但是限制反爬很厉害,网上接口我电脑用不了不知道为啥,网页打开是可以看见,到python不行了,那就换接口,只能抓取1050条数据,机器人不限制的。

猫眼评分挺正常的,但还是国庆档挺低的。

 

 那我们就看看评论都说了啥:

    def parse(self,response):
        for movie_info in json.loads(response.text)['data']['comments']:
            print(movie_info)
            # city = movie_info['cityName']
            content = movie_info['content']
            user_id = movie_info['id']
            nickName = movie_info['nick']
            movieId = movie_info['movieId']
            gender = movie_info.get('gender')
            pingfen = movie_info['score']

我抓了三个,分别是差评说啥,好评说啥,还有最近1000条评论说啥了,那就先看最近1000条评论说了啥,给了多少分。

 

 都是好评,来看最近1000条评分

 

 一半打了满分,极少数打了差评。

那我们就看看差评都说了啥:

 

 来看看差评都给多少分,

 

 几乎都是给1分,看来两端差距极大。

那我们就看看好评都说了啥,

 

 来看看好评都给了多少分,

 

 大部分都觉得挺满意的,可能龙叔老了,加入了很多小鲜肉,评论形成极端了,好看的人觉得很好看,接受不了小鲜肉的,就极度厌恶。 期待龙叔以后出好看的电影吧。

posted @ 2020-10-08 21:24  凹凸曼大人  阅读(144)  评论(0)    收藏  举报