数和文

手机号、银行卡号,表现为数,实质上是文,方便输入、排序。身份证号最后一位可以是X,相当于十一进制。

 

Excel以cell为单位,数据缺乏一致性,容易引发数和文混乱,很讨厌。用pandas读取Excel时,设置下dtype参数,避免手机号变科学记数。pandas.DataFrame.dtypes可以返回各列的dtype。至于用pandas.DataFrame.astype事后弥补,纯属浪费时间。

 

时间的混乱也是个麻烦事,2020-12-31,2020/12/31,20201231,pandas.to_datetime是个解决办法。

posted @ 2020-05-08 20:04  ForestYe  阅读(136)  评论(0)    收藏  举报