MetagenomeDB是一個Python庫設計,易於存儲,檢索和宏基因組註釋和序列NBSP;。MetagenomeDB可作為對MongoDB數據庫之上的抽象層。它提供了一個API來創建和修改,並連接兩種類型的對象,即序列和集合:
  *序列(序列類)可以讀,重疊群,PCR克隆等。
  *集合(Collection類)代表的序列集;例如,讀取從樣品的測序所得,重疊群從一組讀出的PCR文庫組裝
任何對象都可以使用類似於字典的語法註解:
#首先,我們導入庫
進口MetagenomeDB為MDB
#然後,我們創建了兩個新的Sequence對象
#(強制)的屬性,“名”和“序”
S = mdb.Sequence({“名”:“我的序”,“序”:“ATGC”})
#對象現在可以註釋
打印S [“長度”]
S [“型”] =“讀”
#一旦改性,對象需要被提交
#對數據庫的修改,以保持
s.commit()
型序列或集合的對象可以彼此連接,以表示各種宏基因組數據集。實例包括,但不限於:
  *採集讀取一個測序運行產生的(多個序列之間的關係對象,一個集合)
  *組從一組的組裝造成重疊群的讀取(兩個Collection對象之間的關係)
  *讀取是重疊群的一部分(多序列關係的對象和一個序列)
  *序列是類似於另一序列(二序列之間的關係的對象)
  *集合,是一個更大的集合的一部分(兩個Collection對象之間的關係)
其結果是序列和集合中的網絡,可以使用專用的方法來探討; IEG,Collection.list_sequences(),Sequence.list_collections(),Sequence.list_related_sequences()。這些方法的每一個允許使用MongoDB的查詢語法複雜的過濾器:
#列表類型“collection_of_reads”的所有集合
#序列的“屬
集合= s.list_collections({“類型”:“collection_of_reads”})
#列表也屬於這些集合所有序列
#與至少50鹼基對的長度
對於C於類別:
 打印c.list_sequences({“長度”:{“$ GT”:50}})
MetagenomeDB還提供了一組命令行工具來導入核苷酸序列,蛋白質序列,BLAST和FASTA比對算法輸出,和ACE組件文件。還提供其他工具來添加或刪除多個對象,或註釋它們
要求:
- 在Python的
評論沒有發現