BIOM格式是微生物组领域最常用的结果保存格式,优点是可将OTU或Feature表、样本属性、物种信息等多个表保存于同一个文件中,且格式统一,体积更小巧,目前被微生物组领域几乎所有主流软件所支持
- BIOM目前分为1.0 JSON和2.0 HDF5两个版本;
- 1.0 JSON是编程语言广泛支持的格式,类似于散列的键值对结果。会根据数据松散程度,选择不同的存储结构来节省空间。
- 2.0 HDF5是二进制格式,被许多程序语言支持,读取更高效和节约空间。
-
table.py 修改
test_element = 0
if has_data:
test_element = self[0, 0]
if isinstance(test_element, ndarray):
test_element= test_element.item()
- 转换经典表格为HDF5或JSON格式
biom convert -i table.txt -o table.from_txt_json.biom --table-type="OTU table" --to-json
biom convert -i table.txt -o table.from_txt_hdf5.biom --table-type="OTU table" --to-hdf5
- 转换biom为经典格式
biom convert -i table.biom -o table.from_biom.txt --to-tsv
- 转换biom为经典格式,并在最后列包括物种注释信息
biom convert -i table.biom -o table.from_biom_w_taxonomy.txt --to-tsv --header-key taxonomy
- 转换biom为经典格式,并在最后列包括物种注释信息,并改名为ConsensusLineage
- 此功能对于一些软件要求指定的列名有很有用。
- biom convert -i table.biom -o table.from_biom_w_consensuslineage.txt --to-tsv --header-key taxonomy --output-metadata-id "ConsensusLineage"
- 带物种注释表格互转
biom convert -i table.biom -o table_tax.txt --to-tsv --header-key taxonomy
biom convert -i table_tax.txt -o new_table.biom --to-hdf5 --table-type="OTU table" --process-obs-metadata taxonomy
biom convert -i table_tax.txt -o new_table.biom --to-json --table-type="OTU table" --process-obs-metadata taxonomy
网友评论