关于数据处理模块pandas

前言:

Pandas 库是一个免费、开源的第三方 Python 库,是 Python 数据分析必不可少的工具之一,它为 Python 数据分析提供了高性能,且易于使用的数据结构,即 Series 和 DataFrame。Pandas 自诞生后被应用于众多的领域,比如金融、统计学、社会科学、建筑工程等。
但想学习的人注意了,孔子有言,吾生而有涯,知也无涯,如果pandas无法解决你遇到的问题,那可以把时间和精力用到别的地方去。做一个聪明的牛马。下面是我了解到关于想用pandas处理工作问题的人遇到的一些实际情况。

适用场景:

数据源格式一致,数据量大于10W条,且周期性处理,那就值得用Pandas来处理。否则不如Excel快。

时间成本:

学python最快也得两周(没其他编程经验的人),学pandas又得一周,牛马稳定的学习时间并不容易,更不用说自身意愿,有这时间打游戏看电影逛街不香吗。长线投资反人性,学习技能也是如此。

沟通成本:

你只是辛苦的分析数据,领导考虑的就多了,你发个py.nb文件别人不会用,别人发给excel你还得处理才能用,你离职了别人如何继承你的工作?(狗头经济收益:除非分析岗,绝大部分职位熟练运用pandas提升效率并不会对个人带来直接和直观的经济收益,只会带来更多的工作。当然这不止是pandas库,R语言,matlab等都是一样的。

学以致用的机会:

在大公司工作过的人都知道,一般来说别说装Python了,就算是装个搜狗输入法,IT也能让你掉层皮,所以你学的东西如果不能通过实践来验证,那很快就会生疏,遗忘。

可替代的工具:

如果说上述条件还不能让你清晰自己的需求,那我告诉你,python还有一个可以直接操作excel的工具,叫pyexcel,github上的,不过stars的数量少的可怜

所以最终结论:

在真正的工作中,还需要考虑身边的人,毕竟对于使用pandas的人来说,excel是他们输入与输出的结果,而对于使用excel的人来说,excel是他们的生产工具,所以能用excel做相关性分析,尽量不要上pandas。但如果你是做大数据或数据展示的相关工作,并且有一个基于这方面的可信,有良好发展前景的工作机会,或打算进入并长期在这个行业发展,那就无脑入pandas吧。
image

posted @ 2024-12-12 10:40  小雨淅淅o0  阅读(56)  评论(0)    收藏  举报