LeetCode 1078. Bigram 分词

作者: TheKey_ | 来源:发表于2019-07-24 21:46 被阅读0次

1078. Bigram 分词

给出第一个词 first 和第二个词 second,考虑在某些文本 text 中可能以 "first second third" 形式出现的情况,其中 second 紧随 first 出现,third 紧随 second 出现。

  • 对于每种这样的情况,将第三个词 "third" 添加到答案中,并返回答案。
示例1:
输入:text = "alice is a good girl she is a good student", first = "a", second = "good"
输出:["girl","student"]
示例2:
输入:text = "we will we will rock you", first = "we", second = "will"
输出:["we","rock"]
提示:
  • 1 <= text.length <= 1000
  • text 由一些用空格分隔的单词组成,每个单词都由小写英文字母组成
  • 1 <= first.length, second.length <= 10
  • first 和 second 由小写英文字母组成

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/occurrences-after-bigram
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。


  • 1. 迭代法

思路:

  1. 将 text 根据 "" 切分成数组
  2. 从第二个元素开始到倒是第二个元素结束,如果满足 str[i].equals(second) && str[i - 1].equals(first),我们直接取 second 后面的一个元素加入 list 即可
  3. 遍历 list,将其转化为数组
public static String[] findOcurrences(String text, String first, String second) {
        if (text == null) return null;
        List<String> list = new ArrayList<>();
        String[] str = text.split(" ");
        for (int i = 1; i < str.length - 1; i++) {
            if (str[i].equals(second) && str[i - 1].equals(first)) {
                list.add(str[i + 1]);
            }
        }
        return list.toArray(new String[list.size()]);
    }

复杂度分析:

  • 时间复杂度:O(n), 复杂度为遍历数组所用的时间

  • 空间复杂度:O(l), l 为 list 所占用的空间

  • 测试用例

 public static void main(String[] args) {
         String text = "alice is a good girl she is a good student";
         String first = "a";
         String second = "good";
         System.out.println("Bigram 分词:" + Arrays.toString(findOcurrences(text, first, second)));
    }
  • 结果

Bigram 分词:[girl, student]

  • 源码

  • 我会每天更新新的算法,并尽可能尝试不同解法,如果发现问题请指正
  • Github

相关文章

网友评论

    本文标题:LeetCode 1078. Bigram 分词

    本文链接:https://www.haomeiwen.com/subject/ksqqrctx.html