GLIPH2是一个TCR序列功能聚类的软件【Analyzing the Mycobacterium tuberculosis immune response by T-cell receptor clustering with GLIPH2 and genome-wide antigen screening 】。该软件主要基因global算法和local算法,其中global算法为整条序列相似,local算法为基于motif算法即仅几个氨基酸序列一致。该软件在第一版的基础上进行了更新,主要优化了4点:
1、一条TCR可以聚在多个cluster中;
2、相同长度且氨基酸相同的TCR聚类扩展到相同序列或者相同BLOSUM62打分的序列(global)(这一步实质是对第一版global算法的条件放宽);motif的长度限制在3个氨基酸;
3、motif的差异直接进行fisher检验而不是抽样(此处为与naive TCR序列的比较);
4、N端和P端的氨基酸额外的权重。
性能如何?
常用软件的比较从文章中提供两个图来看,a图随着噪音序列的加入,GLIPH2聚类的效果稳定,切准确度较高,从b图看,GLIPH2的速度在保持高性能的基础上速度也不错。
下载
文献中提供的两种方法,一个网页版,一个是提供了代码,代码在附件中。
安装
1、查看GLIBC版本
strings /lib64/libc.so.6 | grep GLIBC
2、GLIBC版本应为:GLIBC_2.14
3、安装GLIBC2.14版本,我安装的2.15
wget http://ftp.gnu.org/gnu/glibc/glibc-2.15.tar.gz
wget http://ftp.gnu.org/gnu/glibc/glibc-ports-2.15.tar.bz2
tar -xvf glibc-2.15.tar.gz
tar -xvf glibc-ports-2.15.tar.gz
mv glibc-ports-2.15 glibc-2.15/ports
mkdir glibc-build-2.15
../glibc-2.15/configure --prefix=/your/path/ --disable-profile --enable-add-ons --with-headers=/usr/include --with-binutils=/usr/bin
make ## make的时间比较久,大概半小时
make install ##
cd glibc-build-2.15
安装GLIBC后再运行
网友评论