美文网首页
Python 序列截取2021-06-21

Python 序列截取2021-06-21

作者: 土雕艺术家 | 来源:发表于2021-06-21 16:55 被阅读0次

序列截取实际上也就是字符串截取

1.索引数字使用

Python 允许从字符串的两端使用索引:

  • 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……
seqence='ATCG'
seqence[0]
Out[31]: 'A'
seqence[1]
Out[32]: 'T'
seqence[3]
Out[33]: 'G'
  • 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……
seqence[-1]
Out[34]: 'G'
seqence[-3]
Out[35]: 'T'
seqence[-4]
Out[36]: 'A'

2.获取多个字符(字符串截去/字符串切片)

使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,格式为:

sequence[start : end : step]

  • start:表示要截取的第一个字符所在的索引(截取时包含该字符)。如果不指定,默认为 0,也就是从字符串的开头截取;
  • end:表示要截取的最后一个字符所在的索引(截取时不包含该字符)。如果不指定,默认为字符串的长度;
  • step:指的是从 start 索引处的字符开始,每 step 个距离获取一个字符,直至 end 索引出的字符。step 默认值为 1,当省略该值时,最后一个冒号也可以省略。

3.截取编码蛋白的起始密码子与终止密码子

起始密码子就是前三个字符串[0,1,2],终止密码子就是最后三个字符串[-3,-2,-1]

  • 起始密码子,因为end截取时不包含该字符,所以要取[0,1,2]就得选择[0:3]这样才能包括前三个字符。
seq[:3]
Out[39]: 'ATT'
  • 终止密码子,可以直接使用[-3:],因为start是包含起始位点的。
seq[-3:]
Out[40]: 'TAA'

参考
http://c.biancheng.net/view/2178.html

相关文章

网友评论

      本文标题:Python 序列截取2021-06-21

      本文链接:https://www.haomeiwen.com/subject/edwyyltx.html