2019-01-18

作者: ruicore | 来源:发表于2019-01-18 20:27 被阅读0次

奶奶出院了，我也将开启新的征程！
2019-01-18
书摘4
关于intel-mkl-fatal-error-cannot-l
import os, glob, fnmatch
晨读DAY 26 总结日志
Winter的ScalersTalk第四轮新概念朗读持续力训练D
果的ScalersTalk第四轮新概念朗读持续力训练Day 10
iQCAR by Duke Professors
荆的ScalersTalk第四轮新概念朗读持续力训练Day102

LeetCode 187. Repeated DNA Sequences.jpg

LeetCode 187. Repeated DNA Sequences

Description

All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.
Write a function to find all the 10-letter-long sequences (substrings) that occur more than once in a DNA molecule.
Example:
Input: s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
Output: ["AAAAACCCCC", "CCCCCAAAAA"]

描述

所有 DNA 由一系列缩写为 A，C，G 和 T 的核苷酸组成，例如：“ACGAATTCCG”。在研究 DNA 时，识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来查找 DNA 分子中所有出现超多一次的10个字母长的序列（子串）。
示例:
输入: s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出: ["AAAAACCCCC", "CCCCCAAAAA"]

思路

题意是以10个字符构成每一个子串，寻找在字符串中出现了不止了一次的子字符串.
我们使用两个哈希set，wordset用于存储已经找到的子字符串，res用于存储已经出现的结果.我们以10个字符串为窗口，如果当前子字符串已经出现过在wordset中，我们就把他添加到res中，如果没有就添加到wordset中，最后我们返回list类型的res.

# -*- coding: utf-8 -*-
# @Author:             何睿
# @Create Date:        2019-01-18 19:56:00
# @Last Modified by:   何睿
# @Last Modified time: 2019-01-18 20:10:34


class Solution:
    def findRepeatedDnaSequences(self, s):
        """
        :type s: str
        :rtype: List[str]
        """
        # wordset哈希set存储已经出现过的子字符串
        # res用于存储结果中的子字符串
        wordset, res, count = set(),set(), len(s)
        i = 0
        # 每一个窗口的长度为10
        while i + 10 <= count:
            # 如果当前字符串已经出现过，就把当前字符串添加到结果字符串中
            if s[i:i + 10] in wordset:
                res.add(s[i:i + 10])
            else:
                # 如果没有出现过，就添加到记录中
                wordset.add(s[i:i + 10])
            i += 1
        # 返回需要list类型
        return list(res)

源代码文件在这里.
©本文首发于何睿的博客，欢迎转载，转载需保留文章来源，作者信息和本声明.

网友评论

Leetcode

本文标题：2019-01-18

本文链接：https://www.haomeiwen.com/subject/ordodqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2019-01-18

LeetCode 187. Repeated DNA Sequences

Description

描述

思路

相关文章

奶奶出院了，我也将开启新的征程！

2019-01-18

书摘4

关于intel-mkl-fatal-error-cannot-l

import os, glob, fnmatch

晨读DAY 26 总结日志

Winter的ScalersTalk第四轮新概念朗读持续力训练D

果的ScalersTalk第四轮新概念朗读持续力训练Day 10

iQCAR by Duke Professors

荆的ScalersTalk第四轮新概念朗读持续力训练Day102

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Leetcode