关于数据处理模块pandas
前言:
Pandas 库是一个免费、开源的第三方 Python 库,是 Python 数据分析必不可少的工具之一,它为 Python 数据分析提供了高性能,且易于使用的数据结构,即 Series 和 DataFrame。Pandas 自诞生后被应用于众多的领域,比如金融、统计学、社会科学、建筑工程等。
但想学习的人注意了,孔子有言,吾生而有涯,知也无涯,如果pandas无法解决你遇到的问题,那可以把时间和精力用到别的地方去。做一个聪明的牛马。下面是我了解到关于想用pandas处理工作问题的人遇到的一些实际情况。
适用场景:
数据源格式一致,数据量大于10W条,且周期性处理,那就值得用Pandas来处理。否则不如Excel快。
时间成本:
学python最快也得两周(没其他编程经验的人),学pandas又得一周,牛马稳定的学习时间并不容易,更不用说自身意愿,有这时间打游戏看电影逛街不香吗。长线投资反人性,学习技能也是如此。
沟通成本:
你只是辛苦的分析数据,领导考虑的就多了,你发个py.nb文件别人不会用,别人发给excel你还得处理才能用,你离职了别人如何继承你的工作?(狗头经济收益:除非分析岗,绝大部分职位熟练运用pandas提升效率并不会对个人带来直接和直观的经济收益,只会带来更多的工作。当然这不止是pandas库,R语言,matlab等都是一样的。
学以致用的机会:
在大公司工作过的人都知道,一般来说别说装Python了,就算是装个搜狗输入法,IT也能让你掉层皮,所以你学的东西如果不能通过实践来验证,那很快就会生疏,遗忘。
可替代的工具:
如果说上述条件还不能让你清晰自己的需求,那我告诉你,python还有一个可以直接操作excel的工具,叫pyexcel,github上的,不过stars的数量少的可怜
所以最终结论:
在真正的工作中,还需要考虑身边的人,毕竟对于使用pandas的人来说,excel是他们输入与输出的结果,而对于使用excel的人来说,excel是他们的生产工具,所以能用excel做相关性分析,尽量不要上pandas。但如果你是做大数据或数据展示的相关工作,并且有一个基于这方面的可信,有良好发展前景的工作机会,或打算进入并长期在这个行业发展,那就无脑入pandas吧。


浙公网安备 33010602011771号