Re: [請益] 字串部分比對篩選 aattsat PTT批踢踢實業坊

Re: [請益] 字串部分比對篩選

作者: aattsat (Tala) 2012-12-07 15:57:25

※ 引述《killerjackal (比利養了一隻狗叫比利)》之銘言：
: 現在手邊有兩個檔案
: 檔案的格式都差不多長一樣
: >xxxxxxx(title)xxxxxxxxx
: stringstringstringstring......
: A檔案格式如下：
: >UniqueRead1_count1
: CTCGCCGTCGCAAACCCAAGCTGTCT
: >UniqueRead2_count1
: CTCGCCTGGCTGTGGTTCTTCTAACA
: >UniqueRead3_count1
: CTCGCCTGCTAAGCGTTGAGATCATC
: B檔案如下：
: >UniqueRead1_count1
: CTCGCCCCCCCAAAAAAAACAAAAACGCCTCATACGAGATTATCAATTAGCTAAGTTGGTAATGTG
: >UniqueRead2_count1
: CTCGCCGCCAGTAACATTCATTTACGTTTTATCATATATTTGATTTCTTGCTTTTATTCCATTTAT
: >UniqueRead3_count1
: CTCGCCTCCTATTCTTCCCGCCACTTCTTGCTTGACCAACAACCTCAGCTCTCATCACTCACCTGG
: 目的是要看A檔案出現的內容是否也在B檔案中出現過
: 意思就是說如果A檔案的第一筆資料（資料內容）
: >UniqueRead1_count1（此為資料名稱）
: CTCGCCGTCGCAAACCCAAGCTGTCT （此為資料內容）
各位高手
我遇到類似問題，不過是要去除相同資料
主要問題爲
檢查title 只要相同，連同strings不保留
也就是
以A為主的資料要檢查出裡面是否包含B資料中含title的資料
而C存取A不包含B的剩餘資料
有想過是使用 sort 與雜湊
請問該如何著手撰寫程式
謝謝

作者: qulqul (飄) 2012-02-07 17:29:00

如果是序列檔案的話可以用Bioperl模組處理

作者: abliou (愚者) 2012-02-08 09:08:00

如果要移除重復序列還是用降identity的軟體比較保險喔

作者: qulqul (飄) 2012-02-10 17:52:00

原PO消失了!?

繼續閱讀

[問題]socket echo serverdelta9 [問題] 台灣哪些職業或工作會使用到Perl??qulqul [問題] STDIN問題projectd2007 [問題] regex 字串擷取doom8199 Re: [問題] 讀取檔案的內容dryman Re: [問題] 讀取檔案的內容hws110 Re: [問題] 讀取檔案的內容clanguage Re: [問題] 讀取檔案的內容hws110 Re: [問題] 讀取檔案的內容clanguage Re: [問題] 讀取檔案的內容hws110