美文网首页生不了啦
基因检测头脑风暴

基因检测头脑风暴

作者: 刘小泽 | 来源:发表于2018-07-28 22:16 被阅读45次

. 实质

找出和正常人不同的基因,再评估这些基因变异产生的影响,并定位到与表型有关的基因变异信息

. 应用领域

  • 产前筛查:孕妇外周血液-》胎儿染色体类疾病(21三体、18三体综合征)
  • 肿瘤患者:致病突变-》靶向治疗药物、化疗药物
  • 遗传病:单基因遗传病(目前大于4000种有明确致病基因)-》辅助诊断、评估预后
  • 个人健康检测:预测未来患病风险-》提前预防

. 表型

  • 每个人表现的特征,如肤色、智力、身高等
  • 几乎都和遗传相关
  • 疾病也是表型,如运动障碍、智力障碍
    除了遗传因素(染色体异常、单基因缺陷等),还有环境因素(营养、理化因素、外伤感染等)且影响大小不一

. 遗传因素

  • 细胞--生命基本单位
    • 人体有40万亿-60万亿细胞,平均直径10-20微米;
    • 细胞核--含有遗传物质​
    • 细胞器:多个部分行使不同功能(线粒体、内质网、溶酶体、高尔基体等)​​
  • 遗传物质
    • 绝大多数在细胞核(除了成熟红细胞和血小板没有细胞核)
    • 小部分在线粒体​​
  • 细胞核--染色体
    • 23对(常1-22 + 性),46条;23条来自母亲,23条来自父亲
  • DNA
    • 与组蛋白合成染色体;
    • 平面结构双链,立体结构超螺旋​
    • 计量单位bp​
  • 基因
    • 一段具有遗传效应的DNA片段,排布在双链上,ATCG排列组合得到
  • 基因组
    • 细胞核中编码蛋白基因22000+个
    • ​​基因在染色体分布不均,1号染色体基因数目最多(基因组大小248.96Mb,编码的蛋白质11046种);
    • 线粒体基因组​有37个基因,2个编码rRNA,22个编码tRNA,13个编码多肽
  • 基因组计划
    • “Human Genome Project”--“生命科学登月计划”--美英法德日中
    • 1953年DNA双螺旋结构-》1990HGP启动-》1999中国加入-》2000草图完成-》2003提前两年完成​(搞清楚了许多基因位置、结构和组成)​

. 基因变异

  • 基因功能
    • 指导蛋白质合成--基因表达:DNA序列的遗传信息-》转录、翻译-》生物活性蛋白分子(作为除水以外的最主要组成)
  • 基因与蛋白
    • 密码子(每3个相连核苷酸)-》编码一个氨基酸aa(如:AGA编码精氨酸,GCA丙氨酸)-》aa组成蛋白质
  • 基因突变
    • 定义:组成基因的DNA序列永久性改变
    • 过程:碱基改变-》密码子改变-》氨基酸可能改变(考虑简并性)​-》蛋白结构改变-》结构决定功能,功能改变-》遗传病或肿瘤​
  • 突变来源
    • 来源一: 胚系(生殖细胞)突变​【遗传病】
      遗传病基因检测常见​​
      ​突变来自父母卵子或精子,几乎存在每个细胞
      精卵结合-》DNA结合-》如果DNA有一个突变,受精卵发育会一直携带
    • 来源二:获得性(体细胞)突变【肿瘤】
    • 发生在某一生命时间并仅存在与某些细胞,并非整体
    • 可能由于环境(如辐射),​或者细胞分离时DNA复制错误 ,不能遗传​
    • 肿瘤患者基因检测,样本必须是肿瘤组织(因基因信息与其他组织不同)
    • 肿瘤组织要求:​新鲜手术组织、穿刺样本【前两个液氮冷冻,干冰运输】或FFPE(石蜡切片)样本【常温保存运输】
    • 液体活检:【患者没有手术或样本不易获取】取样外周血(带有肿瘤基因组DNA片段-- 循环肿瘤DNA即ctDNA)​,包含肿瘤组织全部基因信息
    • 来源三:新发突变
    • 可来自父母精细胞或卵细胞中突变【父母其他细胞中没有】;
    • 也可在受精卵形成后突变【父母全部细胞正常,子代每个生长的细胞都突变】​
    • 一般不可知发生时间​如:父母没有突变,没有家族史,孩子身体每个细胞都有突变​
  • 突变类型- **碱基水平 ** 全外显子检测基因变异数目5w左右,但仅有少部分变异导致遗传病,大多对健康无害【序列改变但最终蛋白的功能不变】 变异是否有害,取决于基因变异是否影响编码蛋白​​
    • 单核苷酸变异(Single nucleotide variation) SNV
    • 基因组某个位置的单个碱基变异
    • 第一种:错义突变
      • 密码子受碱基突变影响发生改变-》多肽链的aa种类和序列改变-》丧失原有功能
    • 第二种:同义突变
      • 碱基突变,新密码子产生-》密码子简并性-》aa种类不变
      • 简并密码子:一个aa由一个以上三联体密码编码【如:精氨酸6种密码子CGU; CGC; CGA; CGG; AGA; AGG】​​
    • 第三种:无义突变
      • 碱基突变使密码子变成终止密码子-》肽链合成提前终止-》蛋白质结构缩短-》可影响甚至完全破坏功能
      • 终止密码子:TAG、TAA、TGA​
    • 插入缺失(Insertion deletion) InDel
    • 插入:插入的DNA序列,可能使产生的蛋白质不能正常运行 有时插入一个碱基,后面编码的aa全部改变​
    • 缺失:缺失范围:一或几个碱基对,甚至整个基因或几个相邻基因 与插入一样,可能导致“蝴蝶效应”​
    • 动态突变
      • DNA分子中某些短串联重复序列重复扩增-》世代交替传递,逐代递增-》累加突变效应
      • 【短串联重复序列:基因编码序列或侧翼序列的三核苷酸​】 【如:脊髓小脑性共济失调(SCA),正常情况下​ATXN1基因外显子内部的CAG三核苷酸重复使6-39次,而患者为41-81次(SCA 1型);更严重的SCA 7型,普通人是7-35次,而部分患者高达200次】
      • 重复次数与疾病外显率有关
      • 外显率:群体中某一基因型(通常杂合)表现相应表型的百分率。等于100%成为完全外显​​
    • 移码突变:碱基缺失或增加非3的倍数-》改变基因阅读框-》该位置后一系列编码发生移位错误 得到蛋白质通常无功能​
  • 突变类型-染色体水平
    • 染色体数目异常:可能导致身体生长、发育存在问题 细胞分裂过程染色体分离障碍​​
    • 按染色体分类
      • 常染色体数目异常
      • 唐氏综合征,三条21号染色体,每个细胞共有47条
      • 常见三体综合征还有18三体综合征、13三体综合征等
      • 性染色体数目异常
      • Turner综合征[女性先天性性腺发育不良或先天性卵巢发育不良综合征]
        女性患者其中的一条X染色体缺失,每个细胞总共45条染色体
      • Klinefelter综合征(XXY综合征):先天性睾丸发育不全,核型为47,XXY
    • 按数量分类
      • 整倍性改变
      • 染色体变化数目是单倍体23的整倍数
      • 例如三倍体:223+123=69条染色体​
      • 非整倍性改变
    • 染色体结构异常
    • 插入:一条染色体片段插入另一条染色体
    • 缺失:如:猫叫综合征就是5好染色体部分缺失
    • 重复:增加某一段
    • 倒位:颠倒180度,染色体内重新排列,如女性习惯性流产《- 9号长臂倒置​
    • 易位:染色体某一片段接到同一条不同区域或另一条非同源染色体,如:惯性粒白血病(14号与22号易位)
    • 环状染色体:染色体长短臂同时断裂,带有着丝粒的两端重接
    • 等臂染色体:​染色体两臂的基因种类、数量、排列对称相同

. 遗传病检测

  • OMIM数据库

    • 《人类孟德尔遗传》(Mendelian Inheritance in Man,MIM)--“医学遗传界圣经”

    • 包括所有已知的遗传病、遗传决定的性状及基因

    • 对各种疾病的临床特征、诊断、治疗预防的描述

    • 研究了已知有关致病基因的连锁关系、染色体定位、组成结构与功能、动物模型

    • 制定各种遗传病、性状、基因的编号--MIM号【报道疾病必须加MIM号】

    • 1987年在线版OMIM-》关于人类基因与遗传紊乱

    • 针对可遗传基因疾病,包括文本信息、相关参考信息、序列记录、图谱等

    • 截至2018.7.26,其中已明确致病基因的单基因疾病有5182种,已知基因3554个。

OMIM1 OMIM2
  • 遗传病分类:三大类

    • 染色体病:染色体数目异常(18三体综合征、Turner综合征等)和染色体结构异常(猫叫综合症)
    • 多基因病:家族聚集,但系谱分析不符合一般的常染色体显、隐性或性连锁【同胞中患病率远低于1/2或1/4】;受环境影响
      -单基因病
  • 单基因遗传病

    • 特点:单个发病率低,但种类极多 -》总体发病率高,先天性、致死致残
    • 分类
    • 【符合孟德尔遗传】常染色体显性/隐性遗传、X连锁显性、X连锁隐性、Y连锁
    • 【不符合孟德尔】线粒体病
    • 常染色体遗传病:致病基因位于第1-22号常染色体上,患病与性别无关
      • 常染色体显性遗传病(Autosomal dominant, AD):例如致病基因是A,正常为aa:两个等位基因aa其中之一突变,变成A即可发病
        等位基因:同源染色体,相同位置,控制某性状不同形式基因
      • 双亲一个是患者,子代有1/2概率患病;双亲都是患者,至少3/4概率患病,有一个为纯合AA,子代全部患病
      • 一旦患病,容易连续传递
      • 无病子女和正常人结婚,后代一般不再患病
      • 常见病症:家族性高脂蛋白血症、马尔芬氏综合征、威尔逊氏综合征、亨丁顿氏舞蹈病、结肠息肉、阵发性心动过速、体质性低血压、椭圆形红细胞增多症、肌强直性营养不良、先天性肌强直、周期性麻痹、胱氨酸尿症、遗传性球形细胞增多症、颞叶癫痫
      • 常染色体隐性遗传病(Autosomal recessive, AR):例如致病基因是a,正常为A*,只有aa时才发病
      • 双亲无病但携带致病基因Aa,子代1/4发病
      • 多为隔代遗传
    • X连锁显性(X-linked dominant, XD):类似AD,只是致病基因在X染色体
      • 男性患者的女儿总是患者,儿子正常
      • 女性患者将疾病传递给男女后代的机会都是1/2
      • 患者的生育率正常前提下,家系中女性患者的数目要比男性患者多约一倍
    • X连锁隐性
      • 男性患者多于女性,因为男性只要有一个a就患病;女性需要两个a
      • 男性的X连锁基因只能从母亲处传来,将来只能传给女儿
      • 如血友病、进行性肌营养不良假性肥大型
    • Y连锁:父子遗传
    • 线粒体病【详见下方】
  • 变异种类

    • 单核苷酸突变SNV
    • 插入缺失InDel
    • 前两种突变检测使用全外显子组测序和目标区域捕获测序(基因panel)
    • 线粒体基因突变
      • 线粒体代谢酶缺陷-》ATP合成障碍、能量来源不足
      • 分为:
      • 线粒体DNA突变导致(母系遗传,对线粒体基因组进行基因组测序或位点测序)
      • 核基因突变导致(WES可检出)
    • 拷贝数变异CNV
      • 常见症状:畸形、精神迟滞、多系统疾病
      • 检测技术:
      • 染色体基因芯片分析(Chromosomal Microarray Analysis, CMA),包括比较基因组杂交技术(aCGH)和SNParray 《--不明确怀疑的基因
      • 多重连接探针扩增技术(MLPA)《--患者疾病有明确怀疑致病基因
      • 低倍基因组测序
      • SNP-array
      • 提高检测阳性率,可以结合CNV+WES
    • 动态突变

. 测序技术

  • 一代测序:“黄金标准”,来验证二代测序中检测的阳性致病位点
  • 全基因组测序(WGS)
    • 测通整个基因组,深度一般30X【深度也就是平均每个位点测的次数=总碱基数/基因组大小】,人类基因子约为30亿碱基(3Gbase),也就是结果为900亿个碱基。另外拿到的fq文件中一个碱基对应一个质量值,二者都以字母表示,也就是得到1800亿字符。目前测序策略一般是PE150,也就是900亿碱基/150bp=6亿条reads,fq文件中每条reads第一行是测序信息,一般是45个字母,总的首行信息有456亿=270亿字符。不算第三行的+号,加起来总共2070亿字符*。一个字符用一个ASCII码来表示,占8个二进制位(bit),也就是一个字节(Byte),存储的GB意思是1024的三次方字节。换算一下,90G测序结果=192.78GB存储空间。接下来用gzip压缩,能达到2.7倍压缩率,大概最后能有71GB存储。然后fq.gz再压缩成sra格式,占用空间会更小
    • 涵盖信息全,数据量大,适合各种变异类型检测,但成本高
  • 全外显子组测序:利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序
    • 对体内所有蛋白质编码区测序,约占全集因组1-2%
    • 人类外显子组包含22,000多个基因的180,000多个外显子
    • 约85%单基因遗传病的致病突变都发生在基因的外显子区
    • 特点:1. 测序范围广,筛查全面,准确率高,阳性致病基因检出率高,并且早期发病的患者中诊断率较高;2. 测序样本足够大时,可以发现新致病基因; 3. 现在结果为阴性的WES数据,可以日后再遇不断更新的数据库比对,可以说一次测序,永久有用;4.不能覆盖线粒体
    • 基本流程:
    • 采集血液样本,序列捕获(如:安捷伦V6平台),测序(如:HiseqX ten PE150),Q30要大于30%
    • Rawdata QC 数据质控:FastQC / Trimmomatic -》 clean fq
    • Mapping 比对:BWA/samtools/Picard -》 bam
    • Variant Calling 变异输出:GATK+Picard -》VCF(raw variants)
    • Annotation & Filtering 变异过滤和注释: Bedtools、Annovar -》CSV(Annotated variants)
    • 与ExAC、1000G、ClinVar、HGMD、OMIM等数据库对突变进行比对
    • 参考多个不同算法的软件SIFT、PolyPhen2、LRT、MutationTaster、MutationAssessor、FATHMM、REVEL、MCAP进行突变位点功能预测
    • 二代测序确定阳性致病基因位点后,对先证者trio(家系中第一个被确诊的人)和父母样本进行一代测序,验证阳性结果
  • 基因panel:
    • 对某个或某些遗传病相关的致病区域进行捕获并测序
      比如,就像研究gene2的3、4号外显子,就只需要在这两个区域进行捕获富集测序
    • 设计的基因有一定的覆盖区域,不局限于位点;设计上会偏重Hospot,即使发现突变位点,也要具体分析突变性质来看是否致病
    • 特点:成本低,但阳性检出率也低;数据有时效性,也就是检出结果为隐性,想要再次验证,需要再次测序

推荐阅读原文~https://mubu.com/doc/9KgRwR72T0
欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到Bioplanet520@outlook.com

Welcome to our bioinfoplanet!

相关文章

  • 基因检测头脑风暴

    . 实质 找出和正常人不同的基因,再评估这些基因变异产生的影响,并定位到与表型有关的基因变异信息 . 应用领域 产...

  • 如何高效组织一场头脑风暴

    头脑风暴法 | Brainstorming 头脑风暴法出自"头脑风暴"一词。所谓头脑风暴(Brain-stormi...

  • 【基因检测的意义】为什么要做基因检测 基因检测的好处

    【基因检测的意义】为什么要做基因检测基因检测的好处 基因检测有什么意义? 一切疾病都与基因有关。基因是DNA分子上...

  • 头脑风暴

    点一杯夜色供你沉寂, 任往事清冷逐渐消弭。 愿此夜短暂转眼天明, 却只有往昔漫漫辗转沉溺。 若我当初确定与你有情,...

  • 头脑风暴

    最先接触头脑风暴这个词儿是在电视剧中。往往是带有设计性的工作中就会出现这个词。而且还是高层之间,会议场中。...

  • 头脑风暴

    某天晚上,正悠哉游哉刷着无聊的新闻,Skype突然冒出消息驱使鄙人点开,使劲捣腾手机一番,愣是看着Hi未能成功送达...

  • 头脑风暴

    月光照射在水面上,一切都显得那么萧条。船只顺着微风在水中行驶,他站在船上双手抱着胸背着长剑注视着前方,他突然感到不...

  • 头脑风暴

    天色渐渐暗了下来,我穿过拥挤的人行横道走到天桥上,望着桥下川流不息的车辆,走下天桥来到公交站台,我坐在站台前的公共...

  • 头脑风暴

    他们来到公园里,夜色给了他们更好的伪装,他们相互望了一眼。微风穿过树梢发出哗哗的响声,一个接一个的路人从他们身边经...

  • 头脑风暴

    今晚我校全体教师有幸聆听了上海佰特教育首席培训师唐薇老师的一堂讲座,可谓是机会难得,短短的一个半小时品尝了...

网友评论

    本文标题:基因检测头脑风暴

    本文链接:https://www.haomeiwen.com/subject/tyuamftx.html