最近不同的开发同事由于在代码文件中采用的 换行符 不同,而导致了在git merge代码阶段diff操作时增加了额外的人工判断成本,

如下图

 回顾一下 换行符 的几种标准,来源历史就不说了,可以百度一下。

打开任何一个IDE都能看到类似的Code Style设置,Mac(\r) 这种机已经不生产了。

BUT 还有一种 “换行符”,留在文末补充中说。

先上一张  ASCII 表,后面分析问题要用到:man ascii

回来说一下我们遇到的问题,初看起来像 图一,就是多了个^M,

但仔细看一下二进制格式(通过xxd可以看到二进制下的情况),就看出是可以分成两种情况的

情况一:就是不同换行符的问题

L3有^M,但L4没有^M

这种情况下 类似dos2unix 或者tr 命令就可以处理了

情况二:不止是不同换行符,还多了一个\r (0x0D)

这种情况下 唯有用sed处理了。

 

最后,我们统一为Unix换行符(\n),写个脚本把所有的\r(0x0D)都删除了(不管是情况一还是情况二),再推回git。

find . -type f -name "*.php" ! -path "./.*" -exec sed -i 's/\x0D//g' {} \;

 

修正原有的代码文件问题后,统一 一下 git 的配置:

#提交时转换为LF,检出时转换为CRLF
git config --global core.autocrlf true 
#拒绝提交包含混合换行符的文件
git config --global core.safecrlf true   

 

================= 补充 =================

不知道大家有没有看到 ASCII 表上第一个 NUL 字符,常见的用法是 find -print0 ... | xargs -0 .... 、perl -0 ....

伪换行符一个。

posted on 2017-04-18 15:08  理货宝  阅读(272)  评论(1编辑  收藏  举报