Leetcode Shell编程练习
Leetcode在shell编程部分只有4道题。
第1题:第十行 难度:简单
题目:
给定一个文本文件 file.txt,请只打印这个文件中的第十行。
示例:
假设 file.txt 有如下内容:
Line 1
Line 2
Line 3
Line 4
Line 5
Line 6
Line 7
Line 8
Line 9
Line 10
你的脚本应当显示第十行:
Line 10
说明:
1. 如果文件少于十行,你应当输出什么?
2. 至少有三种不同的解法,请尝试尽可能多的方法来解题。
思路:
第一步获取文件的行数,第二步进行判断,第三步进行显示。用awk、sed和tail三种方法来写的。
程序:
# Read from the file file.txt and output the tenth line to stdout. row_number=$(cat file.txt|wc -l) if [ $row_number -lt 10 ];then echo "" else awk '{if(NR==10) {print $0}}' file.txt fi #awk '{if(NR==10) {print $0}}' file.txt #sed -n '10p' file.txt #tail -n +10 file.txt | head -1
第2题:有效电话号码 难度:简单
题目:
给定一个包含电话号码列表(一行一个电话号码)的文本文件 file.txt,写一个 bash 脚本输出所有有效的电话号码。
你可以假设一个有效的电话号码必须满足以下两种格式: (xxx) xxx-xxxx 或 xxx-xxx-xxxx。(x 表示一个数字)
你也可以假设每行前后没有多余的空格字符。
示例:
假设 file.txt 内容如下:
987-123-4567
123 456 7890
(123) 456-7890
你的脚本应当输出下列有效的电话号码:
987-123-4567
(123) 456-7890
思路:
遇到电话号和邮箱号这类的问题,要想到使用正则表达式。
程序:
# Read from the file file.txt and output all valid phone numbers to stdout. awk '/^(([0-9]{3}-)|(\([0-9]{3}\) ))([0-9]{3}-[0-9]{4})$/' file.txt
第3题:转置文件 难度:中等
题目:
给定一个文件 file.txt,转置它的内容。
你可以假设每行列数相同,并且每个字段由 ' ' 分隔.
示例:
假设 file.txt 文件内容如下:
name age
alice 21
ryan 30
应当输出:
name alice ryan
age 21 30
思路:
要参考线性代数里面转置的思想,以及题目中的提示就是每个字段的分隔符是什么类型来做。
程序:
# Read from the file file.txt and print its transposed content to stdout. awk '{ for(i=1;i<=NF;i++){ if(NR==1){ result[i]=$i } else{ result[i]=result[i]" "$i } } }END{ for(j=1;j<=NF;j++){ print result[j] } }' file.txt
第4题:统计词频 难度:中等
题目:
写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。
为了简单起见,你可以假设:
words.txt只包括小写字母和 ' ' 。
每个单词只由小写字母组成。
单词间由一个或多个空格字符分隔。
示例:
假设 words.txt 内容如下:
the day is sunny the the
the sunny is is
你的脚本应当输出(以词频降序排列):
the 4
is 3
sunny 2
day 1
说明:
不要担心词频相同的单词的排序问题,每个单词出现的频率都是唯一的。
你可以使用一行 Unix pipes 实现吗?
思路:
解决这道题需要借助一个数组来实现。此外,在进行排序的时候,要用到-n:采取数字排序,-r:反向排序和-k:指定第几列这三个指令来进行排序。
程序:
# Read from the file words.txt and output the word frequency list to stdout. awk '{ for(i=1;i<=NF;i++){ auxiliary[$i]++ } }END{ for(j in auxiliary){ print j, auxiliary[j] } }' words.txt |sort -nrk 2