绿色植物为了应对环境中复杂多变的病原形成了一类具有特殊功能的基因——植物抗病基因,其中,NLRs(富含亮氨酸重复序列的核苷酸结合位点受体)基因是植物中最大的抗病基因家族。
植物 NLRs 能
识别
快速演变的病原体效应蛋白,能最大限度地分辨来自不同病原体的结构各异的效应蛋白
。宿主防御和病原体反防御的迭代循环推动了植物宿主-病原体的共同进化。这些循环促进了细胞内免疫受体家族蛋白质序列和拷贝数的变异
。
NLR免疫受体识别病原物后如何启动下游抗性信号通路,是当前植物病理学领域最重要的科学问题之一。随着越来越多NLR基因的克隆、NLR蛋白晶体结构的解析以及植物基因组的高通量测序,NLR基因的鉴定与分类、起源与演化以及NLR下游信号传导等方面的研究得到了广泛关注并取得了突破性进展。
经典的NLR结构也包括三个部分:一个可变N端结构域,一个中间的NB-ARC(Nucleotide-Binding adaptor shared by Apaf1, certain R genes and CED4)结构域,以及一个C端的LRR(leucine-rich-repeat)结构域。
NLR蛋白的结构组成和分类
根据N端结构域的不同,NLR被分为两大类:N端为TIR结构域的被称为TNL,N端为CC结构域的被称为CNL。
植物 NLRs 根据其 N 端结构域大致分为 CC 结构域 NLRs(CNLs)或 类似 TIR 结构域 NLRs(TNLs)。此外,CNLs 的一个亚类已被确认为类似 RPW8 含 CC 结构域的 NLRs(RNLs)。RNLs 也被称为"辅助型 NLRs",因为 RNLs 可作为 TNLs 产生的信号以及细胞外受体信号的转换因子。在茄科植物中,一个名为 NRC 的 CNL 家族与 RNLs 关系密切,它参与了几种效应蛋白感应 NLR 和细胞外免疫受体的下游信号转导。RNLs 又可细分为 ADR1 亚家族和 NRG1 亚家族。
NLR可以根据位置和数量划分singleton、pair和cluster
文中NLR的分类
要求含有NB-ARC结构域,
然后根据NLR和CC的有无
分成四大类
(1)、有NLR和CC结构的
(2)、有NLR结构的
(3)、有CC结构的
(4)、NLR和CC结构都无的
含有9、11、19结构域的NLR 同时含有CC和LRR的NBS
pfam鉴定kinase/NB-ARC:
[InterProScan Search Result (iprscan5-R20240108-051019-0677-84843697-p1m) - protein - InterPro (ebi.ac.uk)]
(https://www.ebi.ac.uk/interpro/result/InterProScan/iprscan5-R20240108-051019-0677-84843697-p1m/)
NLR
NB-ARC domain (PF00931) - Pfam entry - InterPro (ebi.ac.uk)
NLR的鉴定
需要准备NB-ARC hmm(PF00931)文件,物种蛋白质文件
###/public/home/fengting/work/zyyy/归档/NB
cat pepid | while read id
do
hmmsearch -E 1e-5 --domtblout out1/$id.out NB_ARC.hmm /public/home/fengting/work/GH_cjs/pep/$id.fa
#hmmsearch -E 1e-5 NB_ARC.hmm /public/home/fengting/work/GH_cjs/pep/$id.fa > out/$id.txt
done
提取hmmsearch结果
###以下是一个Python脚本示例,用于提取当前文件夹下所有.out文件中非#号内容的第一列,并将其分别打印到以.out文件前命名的新文件中:
import os
# 获取当前文件夹路径
folder_path = os.getcwd()
# 获取当前文件夹下的所有文件
files = os.listdir(folder_path)
# 遍历所有文件
for file_name in files:
if file_name.endswith(".out"):
# 提取文件名(不包含扩展名)
file_base_name = os.path.splitext(file_name)[0]
# 新文件名
new_file_name = file_base_name + ".txt"
# 打开当前文件
with open(file_name, 'r') as file:
# 读取文件内容
content = file.readlines()
# 提取非#号内容的第一列
data = [line.split()[0] for line in content if not line.startswith("#")]
# 写入新文件
with open(new_file_name, 'w') as new_file:
new_file.write("\n".join(data))
###提取每个样本NRC蛋白序列
cat pepid|while read id
do
perl ~/scripts/perl/per.pl out1/$id.txt /public/home/fengting/work/GH_cjs/pep/$id.fa >fas/$id.fas
done
#interproscan检测结构域
cat pepid|while read id
do
/public/home/qianyingzhi/YZ/tool/InterPro/interproscan-5.28-67.0/interproscan.sh \
-appl COILS,Pfam,SMART -i /public/home/fengting/work/zyyy/归档/NB/fas/$id.fas -o inter/$id.nb.tsv -f tsv
done
参考:
Chiang, Y. H., & Coaker, G. (2015). Effector triggered immunity: NLR immune perception and downstream defense responses. The Arabidopsis Book, 2015(13).
Shang, L., Li, X., He, H. et al. A super pan-genomic landscape of rice. Cell Res 32, 878–896 (2022). https://doi.org/10.1038/s41422-022-00685-z
以“不变”应万变:植物免疫受体NLR的结构组成 - 知乎 (zhihu.com)
基于Pfam中hmm结构的基因家族分析 - 知乎 (zhihu.com)
Golicz, A., Bayer, P., Barker, G. et al. The pangenome of an agronomically important crop plant Brassica oleracea. Nat Commun 7, 13390 (2016). https://doi.org/10.1038/ncomms13390
网友评论