CCF-201703-3-Markdown

  1 #include <string>
  2 #include <iostream>
  3 using namespace std;
  4 
  5 void solve_last_segment(bool &ul, bool &paragraph)//解决上一区块的遗留问题
  6 {
  7     if(ul){
  8         cout << "</ul>" << endl;
  9         ul = false;
 10     }
 11     if(paragraph){
 12         cout << "</p>" << endl;
 13         paragraph = false;
 14     }
 15 }
 16 string getHTML(string &str, unsigned int start, unsigned int end)//获取[start,end)对应的HTML行内
 17 {
 18     string ans = "";
 19     unsigned int index = start;
 20     unsigned int s1, s2;
 21     string link = "";
 22     string text = "";
 23     while(index < end)
 24     {
 25         switch(str[index]){
 26             case '_':
 27                 index++;
 28                 s1 = index;
 29                 while(index < end && str[index] != '_') {
 30                     index++;
 31                 }
 32                 s2 = index;
 33                 index++;
 34                 ans += "<em>" + getHTML(str, s1, s2) + "</em>";
 35                 break;
 36             case '[':
 37                 index++;
 38                 s1 = index;
 39                 while(index < end && str[index] != ']') {
 40                     index++;
 41                 }
 42                 s2 = index;
 43                 index += 2;
 44                 text = getHTML(str, s1, s2);
 45                 s1 = index;
 46                 while(index < end && str[index] != ')') {
 47                     index++;
 48                 }
 49                 s2 = index;
 50                 index++;
 51                 link = str.substr(s1, s2 - s1);
 52                 ans += "<a href=\"" + link + "\">" + text + "</a>";
 53                 break;
 54             default:
 55                 ans += str[index];
 56                 index++;
 57                 break;
 58         }
 59     }
 60     return ans;
 61 }
 62 int main(int argc, char const *argv[])
 63 {
 64     string input = "";
 65     bool ul = false;//标记上一行是否为无序列表
 66     bool paragraph = false;//标记上一行是否为一段
 67     int cnt;//记录标题级数
 68     unsigned int index;//记录字符的开始位置
 69     unsigned int end;
 70     while(getline(cin, input)) {
 71         end = input.length();
 72         if(input == ""){//若为空行那么新区快将会产生
 73             solve_last_segment(ul, paragraph);
 74             continue;
 75         }
 76         switch(input[0])
 77         {
 78             case '#':
 79                 cnt = 0;
 80                 index = 0;
 81                 while(index < input.length() && input[index] == '#') {
 82                     cnt++;
 83                     index++;
 84                 }
 85                 while(index < input.length() && input[index] == ' ') {
 86                     index++;
 87                 }
 88                 cout << "<h" << cnt << ">" << getHTML(input, index, end) << "</h" << cnt << ">" << endl;
 89                 break;
 90             case '*':
 91                 if(!ul){
 92                     cout << "<ul>" << endl;
 93                     ul = true;
 94                 }
 95                 index = 1;
 96                 while(index < input.length() && input[index] == ' ') {
 97                     index++;
 98                 }
 99                 cout << "<li>" << getHTML(input, index, end) << "</li>" << endl;
100                 break;
101             default:
102                 if(paragraph){
103                     cout << endl;
104                 }
105                 else
106                 {
107                     cout << "<p>";
108                     paragraph = true;
109                 }
110                 index = 0;
111                 while(index < input.length() && input[index] == ' ') {
112                     index++;
113                 }
114                 cout << getHTML(input, index, end);
115                 break;
116         }
117     }
118     solve_last_segment(ul, paragraph);
119     return 0;
120 }
问题描述
  Markdown 是一种很流行的轻量级标记语言(lightweight markup language),广泛用于撰写带格式的文档。例如以下这段文本就是用 Markdown 的语法写成的:



  这些用 Markdown 写成的文本,尽管本身是纯文本格式,然而读者可以很容易地看出它的文档结构。同时,还有很多工具可以自动把 Markdown 文本转换成 HTML 甚至 Word、PDF 等格式,取得更好的排版效果。例如上面这段文本通过转化得到的 HTML 代码如下所示:



  本题要求由你来编写一个 Markdown 的转换工具,完成 Markdown 文本到 HTML 代码的转换工作。简化起见,本题定义的 Markdown 语法规则和转换规则描述如下:
  ●区块:区块是文档的顶级结构。本题的 Markdown 语法有 3 种区块格式。在输入中,相邻两个区块之间用一个或多个空行分隔。输出时删除所有分隔区块的空行。
  ○段落:一般情况下,连续多行输入构成一个段落。段落的转换规则是在段落的第一行行首插入 `<p>`,在最后一行行末插入 `</p>`。
  ○标题:每个标题区块只有一行,由若干个 `#` 开头,接着一个或多个空格,然后是标题内容,直到行末。`#` 的个数决定了标题的等级。转换时,`# Heading` 转换为 `<h1>Heading</h1>`,`## Heading` 转换为 `<h2>Heading</h2>`,以此类推。标题等级最深为 6。
  ○无序列表:无序列表由若干行组成,每行由 `*` 开头,接着一个或多个空格,然后是列表项目的文字,直到行末。转换时,在最开始插入一行 `<ul>`,最后插入一行 `</ul>`;对于每行,`* Item` 转换为 `<li>Item</li>`。本题中的无序列表只有一层,不会出现缩进的情况。
  ●行内:对于区块中的内容,有以下两种行内结构。
  ○强调:`_Text_` 转换为 `<em>Text</em>`。强调不会出现嵌套,每行中 `_` 的个数一定是偶数,且不会连续相邻。注意 `_Text_` 的前后不一定是空格字符。
  ○超级链接:`[Text](Link)` 转换为 `<a href="Link">Text</a>`。超级链接和强调可以相互嵌套,但每种格式不会超过一层。
输入格式
  输入由若干行组成,表示一个用本题规定的 Markdown 语法撰写的文档。
输出格式
  输出由若干行组成,表示输入的 Markdown 文档转换成产生的 HTML 代码。
样例输入
# Hello

Hello, world!
样例输出
<h1>Hello</h1>
<p>Hello, world!</p>
评测用例规模与约定
  本题的测试点满足以下条件:
  ●本题每个测试点的输入数据所包含的行数都不超过100,每行字符的个数(包括行末换行符)都不超过100。
  ●除了换行符之外,所有字符都是 ASCII 码 32 至 126 的可打印字符。
  ●每行行首和行末都不会出现空格字符。
  ●输入数据除了 Markdown 语法所需,内容中不会出现 `#`、`*`、`_`、`[`、`]`、`(`、`)`、`<`、`>`、`&` 这些字符。
  ●所有测试点均符合题目所规定的 Markdown 语法,你的程序不需要考虑语法错误的情况。
  每个测试点包含的语法规则如下表所示,其中“√”表示包含,“×”表示不包含。
测试点编号 段落 标题 无序列表 强调 超级链接
1 × × × ×
2 × × ×
3 × × ×
4 × × ×
5 × × ×
6 × ×
7 × ×
8 × ×
9 × ×
10

posted @ 2017-09-14 22:54  Barryiself  阅读(183)  评论(0编辑  收藏  举报