ParaAT是中科院基因组所的章张课题组开发的工具,它整合了计算ka/ks所需的一整套分析,包括:
蛋白序列比对(可选clustalw2 | t_coffee | mafft | muscle)
根据蛋白比对结果回译成codon对应的核酸比对结果
(Back-translated nucleotide alignmentsguided by amino acid alignments are more reliable and accurate than direct nucleotide alignments)
计算kaks值(KaKs_Calculator实现)
ParaAT安装
1. 下载ParaAT2.0
(https://bigd.big.ac.cn/tools/paraat)
解压后,“ParaAT.pl”是运行的脚本。可以把解压后的路径加入环境变量,或者用脚本所在的绝对路径来运行也可以。
2. 安装所需的依赖工具,依赖工具需要加入环境变量
蛋白比对工具,推荐安装muscle,比对效果相对最好,比对速度快,但
它比其它工具更消耗内存。
KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)
准备输入文件
1. 同源基因列表,文件格式如下:
每一行表示一组同源基因,每一列表示每个物种对应的基因。gene ID之间用tab符隔开。
2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要与同源基因列表文件中的ID一致;
3. 多线程运行,指定线程数量的文件。
这个文件只需要写入一个数字即可,表示有多少个线程同时运行。
三种示例文件可以在解压的安装包中找到,分别是:test.homologs, test.pep, test.cds, proc
运行ParaAT
运行代码如下:
-h, 指定同源基因列表文件
-n, 指定核酸序列文件
-a, 指定蛋白序列文件
-p, 指定多线程文件
-m, 指定比对工具
-g, 去除比对有gap的密码子
-k, 用KaKs_Calculator 计算kaks值
-o, 输出结果的目录
注:
1. 如果需要用PAML,Hyphy等工具分析kaks时,ParaAT也可以生成这些工具所需的输入文件(-f 参数)
2. 如果是细菌的序列,需要设置成细菌对应的Genetic Code used (-c 11)。其他物种同理,默认的是The Standard Code (-c 1)
感谢您的阅读,欢迎点赞、评论、支持和转发!!
觉得本文好看,请点这里
继续阅读与本文标签相同的文章
在Word里,一个完美目录是怎么来的?
物联网平台类型解说
-
学宏程序编程,这些知识必不可少!
2026-05-14栏目: 教程
-
华为准备卖出“落后”的5G,多家美企极力竞争!任正非格局太大!
2026-05-14栏目: 教程
-
百度:飞桨深度学习平台已累计服务150多万开发者
2026-05-14栏目: 教程
-
滴滴公布安全功能数据:近2亿用户添加紧急联系人
2026-05-14栏目: 教程
-
滴滴自动驾驶或将于年底落地上海
2026-05-14栏目: 教程
