433. 最小基因变化

作者: 刘翊扬 | 来源:发表于2022-05-07 21:56 被阅读0次

    基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 'A'、'C'、'G' 和 'T' 之一。

    假设我们需要调查从基因序列start 变为 end 所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。

    例如,"AACCGGTT" --> "AACCGGTA" 就是一次基因变化。
    另有一个基因库 bank 记录了所有有效的基因变化,只有基因库中的基因才是有效的基因序列。

    给你两个基因序列 start 和 end ,以及一个基因库 bank ,请你找出并返回能够使start 变化为 end 所需的最少变化次数。如果无法完成此基因变化,返回 -1 。

    注意:起始基因序列start 默认是有效的,但是它并不一定会出现在基因库中。

    示例 1:
    
    输入:start = "AACCGGTT", end = "AACCGGTA", bank = ["AACCGGTA"]
    输出:1
    示例 2:
    
    输入:start = "AACCGGTT", end = "AAACGGTA", bank = ["AACCGGTA","AACCGCTA","AAACGGTA"]
    输出:2
    示例 3:
    
    输入:start = "AAAAACCC", end = "AACCCCCC", bank = ["AAAACCCC","AAACCCCC","AACCCCCC"]
    输出:3
    
    
    提示:
    
    start.length == 8
    end.length == 8
    0 <= bank.length <= 10
    bank[i].length == 8
    start、end 和 bank[i] 仅由字符 ['A', 'C', 'G', 'T'] 组成
    

    方法一:广度优先搜索

    经过分析可知,题目要求将一个基因序列 AA 变化至另一个基因序列 BB,需要满足一下条件:
    序列 AA 与 序列 BB 之间只有一个字符不同;
    变化字符只能从 \texttt{A',C', G',T'}‘A’, ‘C’, ‘G’, ‘T’ 中进行选择;
    变换后的序列 BB 一定要在字符串数组 \textit{bank}bank 中。

    public static int minMutation(String start, String end, String[] bank) {
            if (start.equals(end)) {
                return 0;
            }
            Set<String> cnt = new HashSet<>();
            Set<String> visited = new HashSet<>();
            char[] keys = {'A', 'C', 'G', 'T'};
            for (String s : bank) {
                cnt.add(s);
            }
            if (!cnt.contains(end)) {
                return -1;
            }
            Queue<String> queue = new ArrayDeque<>();
            queue.offer(start);
            visited.add(start);
            int step = 1;
            while (!queue.isEmpty()) {
                int size = queue.size();
                for (int i = 0; i < size; i++) {
                    String curr = queue.poll();
                    for (int j = 0; j < 8; j++) {
                        for (int k = 0; k < 4; k++) {
                            if (keys[k] != curr.charAt(j)) {
                                StringBuilder sb = new StringBuilder(curr);
                                sb.setCharAt(j, keys[k]);
                                String next = sb.toString();
                                if (!visited.contains(next) && cnt.contains(next)) {
                                    if (next.equals(end)) {
                                        return step;
                                    }
                                    queue.offer(next);
                                    visited.add(next);
                                }
                            }
                        }
                    }
                }
                step++;
            }
            return -1;
        }
    

    复杂度分析
    时间复杂度:O(C×n×m),其中 nn 为基因序列的长度,mm 为数组 \textit{bank}bank 的长度。对于队列中的每个合法的基因序列每次都需要计算 C \times nC×n 种变化,在这里 C = 4C=4;队列中最多有 mm 个元素,因此时间复杂度为 O(C×n×m)。
    空间复杂度:O(n×m),其中 nn 为基因序列的长度,m 为数组 bank 的长度。合法性的哈希表中一共存有 m 个元素,队列中最多有 mm 个元素,每个元素的空间为 O(n);队列中最多有 m 个元素,每个元素的空间为 O(n),因此空间复杂度为 O(n×m)。

    来源:力扣(LeetCode)
    链接:https://leetcode-cn.com/problems/minimum-genetic-mutation
    著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

    相关文章

      网友评论

        本文标题:433. 最小基因变化

        本文链接:https://www.haomeiwen.com/subject/raxfurtx.html