句子相似性问题解析与代码实现

  1. 句子相似性问题解析与代码实现
    在编程领域,字符串处理问题一直是一个重要且有趣的课题。今天,我们来探讨一个与句子相似性相关的算法问题——LeetCode 第 734 题:句子相似性。这个问题不仅考察了对字符串操作的理解,还涉及到了集合的使用和条件判断的逻辑。下面,我们将从问题描述、解题思路、代码实现等方面进行详细分析。

问题描述
给定两个句子 sentence1 和 sentence2,它们分别表示为一个字符串数组。同时,给定一个字符串对 similarPairs,其中 similarPairs[i] = [xi, yi] 表示两个单词 xi 和 yi 是相似的。任务是判断 sentence1 和 sentence2 是否相似。两个句子相似的条件是:

它们具有相同的长度(即相同的字数)。
对于每个索引 i,sentence1[i] 和 sentence2[i] 是相似的。
需要注意的是,一个词总是与它自己相似,且相似关系是不可传递的。例如,如果单词 a 和 b 是相似的,单词 b 和 c 也是相似的,那么 a 和 c 不一定相似。

示例分析
示例 1:

输入:sentence1 = ["great","acting","skills"],sentence2 = ["fine","drama","talent"],similarPairs = [["great","fine"],["drama","acting"],["skills","talent"]]
输出:true
解释:这两个句子长度相同,且每个对应位置的单词都是相似的。
示例 2:

输入:sentence1 = ["great"],sentence2 = ["great"],similarPairs = []
输出:true
解释:一个单词和它本身相似。
示例 3:

输入:sentence1 = ["great"],sentence2 = ["doubleplus","good"],similarPairs = [["great","doubleplus"]]
输出:false
解释:因为它们长度不同,所以返回 false。
解题思路
长度判断:首先判断两个句子的长度是否相等。如果不相等,直接返回 false,因为句子相似的前提是长度相同。
相似性判断:如果句子长度相等,接下来需要判断每个对应位置的单词是否相似。这里分为两种情况:
如果两个单词相同,那么它们自然是相似的。
如果两个单词不同,需要检查 similarPairs 中是否包含这两个单词的相似对。由于相似关系是双向的,所以需要检查 similarPairs 中是否同时包含 [sentence1[i], sentence2[i]] 和 [sentence2[i], sentence1[i]] 两种情况。
遍历判断:通过遍历句子中的每个单词,对每个单词进行相似性判断。如果在遍历过程中发现任意一对单词不相似,则直接返回 false。如果遍历结束后没有发现不相似的单词对,则返回 true。
代码实现
package _734;

import java.util.List;

/**

    1. 句子相似性
      */
      public class LeetCode734 {
      public boolean areSentencesSimilar(String[] sentence1, String[] sentence2, List<List> similarPairs) {
      // 如果两个句子长度不同,直接返回 false
      if (sentence1.length != sentence2.length) {
      return false;
      }

      // 如果 similarPairs 为空,那么两个句子中对应位置的单词必须完全相同
      if (similarPairs.isEmpty()) {
      for (int i = 0; i < sentence1.length; i++) {
      if (!sentence1[i].equals(sentence2[i])) {
      return false;
      }
      }
      return true;
      }

      // 遍历句子中的每个单词,判断它们是否相似
      for (int i = 0; i < sentence1.length; i++) {
      if (!sentence1[i].equals(sentence2[i])) {
      // 检查 similarPairs 中是否包含这两个单词的相似对
      if (!similarPairs.contains(List.of(sentence1[i], sentence2[i])) &&
      !similarPairs.contains(List.of(sentence2[i], sentence1[i]))) {
      return false;
      }
      }
      }
      return true;
      }
      }
      代码分析
      时间复杂度:主要时间消耗在遍历句子和检查 similarPairs 中是否存在相似对。假设句子长度为 n,similarPairs 的长度为 m,则时间复杂度为 O(n * m)。
      空间复杂度:由于没有使用额外的数据结构存储大量数据,空间复杂度主要取决于输入参数的存储空间,可以认为是 O(1)。
      总结
      LeetCode 第 734 题是一个典型的字符串处理问题,通过判断句子中对应位置的单词是否相似来解决问题。解题过程中,需要注意相似关系的不可传递性以及对 similarPairs 的双向检查。掌握这类问题的解题思路,有助于提高对字符串操作和集合使用的理解,为解决更复杂的字符串处理问题打下基础。

posted @ 2025-01-10 08:13  东百牧码人  阅读(30)  评论(0)    收藏  举报