Python 爬取猫眼 急先锋 评论 ,感觉豆瓣太假,来看看猫眼的

12.4w评论了,但是限制反爬很厉害,网上接口我电脑用不了不知道为啥,网页打开是可以看见,到python不行了,那就换接口,只能抓取1050条数据,机器人不限制的。
猫眼评分挺正常的,但还是国庆档挺低的。

那我们就看看评论都说了啥:
def parse(self,response): for movie_info in json.loads(response.text)['data']['comments']: print(movie_info) # city = movie_info['cityName'] content = movie_info['content'] user_id = movie_info['id'] nickName = movie_info['nick'] movieId = movie_info['movieId'] gender = movie_info.get('gender') pingfen = movie_info['score']
我抓了三个,分别是差评说啥,好评说啥,还有最近1000条评论说啥了,那就先看最近1000条评论说了啥,给了多少分。

都是好评,来看最近1000条评分

一半打了满分,极少数打了差评。
那我们就看看差评都说了啥:

来看看差评都给多少分,

几乎都是给1分,看来两端差距极大。
那我们就看看好评都说了啥,

来看看好评都给了多少分,

大部分都觉得挺满意的,可能龙叔老了,加入了很多小鲜肉,评论形成极端了,好看的人觉得很好看,接受不了小鲜肉的,就极度厌恶。 期待龙叔以后出好看的电影吧。
    如果人生还有重来,那就不叫人生。
 
                    
                
 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号