201803-3 URL映射 题解

试题编号: 201803-3
试题名称: URL映射
时间限制: 1.0s
内存限制: 256.0MB
问题描述:
问题描述
  URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。
输入格式
  输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。
输出格式
  输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。
样例输入
5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
样例输出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
样例说明
  对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
  对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
  对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
  对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
数据规模和约定
  1 ≤ n ≤ 100,1 ≤ m ≤ 100。
  所有输入行的长度不超过 100 个字符(不包含换行符)。
  保证输入的规则都是合法的。

题解:

  1:这就是一个恶心的题目,核心逻辑是匹配的三重循环,四个指针。无法写下整个细节的人,可以先把框架写下来,函数定义出来,然后把函数内容填写进去。

  2:小技巧,判断是否是合法字符串的问题,其实并不需要判断,所有字符串都是合法的。但是,作为考试的人,还是要好好理解清楚题意。拿满分还是很不容易的。

  3:字符串分割小函数,尾部标记判断等,都得考虑清楚整个逻辑。

 

#include <cstdio>
#include <iostream>
#include <cstring>
#include <cstdlib>
#include <vector>
#include <string>
using namespace std;
//16:15

typedef struct rule {
    vector<string> r;
    string name;
    int post;
} RR;
RR R[103];
string addrs[103];
vector<string> ads;
vector<string> paras;
int n, m, i, j, k, l, pos;
//手写字符串分割函数
vector<string> split(string &s, char c) {
    vector<string> res;
    string tmp;
    int i = 0, j = 0, k = 0;
    while (j != s.size()) {
        if (s[j] == c && i != j) {
            tmp = s.substr(i + 1, j - i - 1);
            i = j;
            res.push_back(tmp);
        }
        j++;
    }
    if (i != s.size() - 1) {//别忘记这个 
        res.push_back(s.substr(i + 1, j - i - 1));
    }
    return res;
}
bool isDigital(string &s) {
    for (int i = 0; i < s.length(); i++)
        if (!isdigit(s[i]))
            return false;
    return true;
}

void match() {
    int flag, post = 0, nFlag = 0;
    for (i = 0; i < m; i++) {
        ads = split(addrs[i], '/');
        if (addrs[i][addrs[i].length() - 1] == '/')
            post = 1;
        else
            post = 0;
        nFlag = 0;
        for (j = 0; j < n; j++) {
            flag = 1;
            paras.clear();
            for (k = 0, l = 0; k < ads.size() && l < R[j].r.size(); k++, l++) {
                if (R[j].r[l].compare("<int>") == 0) {
                    if (!isDigital(ads[k])) {
                        flag = 0;
                        break;
                    }
                    else {
                        string tmp = ads[k];
                        int tmpI = 0;
                        while (tmp[tmpI] == '0') {
                            tmpI++;
                        }
                        string rest;
                        if (tmpI >= tmp.length()) {
                            string rest = "0";
                        }else{
                            rest = tmp.substr(tmpI);
                        }
                        paras.push_back(rest);
                    }

                }
                else if (R[j].r[l].compare("<str>") == 0) {
                    paras.push_back(ads[k]);
                }
                else if (R[j].r[l].compare("<path>") == 0) {
                    string tmpPar;
                    for (; k < ads.size(); k++) {
                        tmpPar.append(ads[k]);
                        if (k != ads.size() - 1)
                            tmpPar.append("/");
                    }
                    paras.push_back(tmpPar);
                }
                else if (!R[j].r[l].compare(ads[k])) {

                }
                else {
                    flag = 0;
                    break;
                }
            }
            //末尾的斜杆
            if (flag && R[j].post == post && k >= ads.size() && l >= R[j].r.size()) {
                cout << R[j].name;
                for (k = 0; k < paras.size(); k++) {
                    printf(" %s", paras[k].c_str());
                }
                printf("\n");
                nFlag = 1;
                break;
            }
        }
        if (!nFlag) {
            printf("404\n");
        }
    }
}
int main() {

    string tmp;
    cin >> n >> m;
    for (i = 0; i < n; i++) {
        cin >> tmp >> R[i].name;
        R[i].r = split(tmp, '/');
        if (tmp[tmp.length() - 1] == '/')
            R[i].post = 1;
        else
            R[i].post = 0;
    }
    for (i = 0; i < m; i++) {
        cin >> addrs[i];
    }
    match();
    return 0;
}

 

posted @ 2018-09-10 20:51  快乐松鼠蹦蹦跳  阅读(163)  评论(0编辑  收藏  举报