2009年5月12日

摘要: LZW网页判重的题解 百度之星的题目,拿来练练手。 问题背景有一种简单的网页判重的方法,通过求两个网页内容的最长公共子序列(LCS)长度来判定两个网页的相似程度。如:(网页A)老师:请用“果然”造句。(网页B)学生:先吃水果,然后喝汽水……它们的最长公共子序列为“果然”,长度为2。注意这里的“子序列”并不要求连续。类似的,下面两个网页:(网页A)老师:请用“果然”造句。(网页B)学生:先吃水果,然... 阅读全文
posted @ 2009-05-12 10:43 absolute 阅读(321) 评论(0) 推荐(0)

导航