[閒聊] Sisyphean tasks

作者: Neisseria (Neisseria)   2017-04-13 10:29:15
這篇有一些個人主觀意識
但小弟不是要刻意引戰
希望大家就事情本身來談論
激發出一些新的想法 感恩
我們實驗室有時候需要查詢一些數據
目前的模式是我老闆跟我講需求
例如「找出所有的可生成胺基酸的基因」
然後小弟我就用 AWK 或 Perl one-liner
從一些文字檔案萃取出這些資訊
然後把萃取出來的結果交給我老闆
為什麼會用這種模式呢?
因為上游的數據就是存在一些文字檔案中
(註:像是 GTF 或 GFF 等檔案)
我老闆和我確認過 Excel 無法處理
因為檔案行數過多 (檔案約 2~3 GB 左右)
這種模式運作了一陣子 倒是還算順利
但時間一久 發現自已好像在重覆做一些手工
表面上是在寫程式 但每次需要時都重寫一次
感覺好像是有資料庫 但是要每次手動寫 SQL 語法
不知道有沒有減少手動的方式
我有想過把資料轉為 SQLite database
然後請老闆裝 SQLite viewer 不確定有沒有搞頭
或是教其他同學 AWK 或 Perl (別人的小孩死不完 XD)
這就是傳承的概念 (煙)
當然 這個模式目前還是會運作下去
只是上來 brain storming 一下
開放推噓文 感恩 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com