天天看點

biostar handbook: 第一周筆記彙總+第二周任務布置

第一周筆記彙總

昨天和一位也在自學生信的同學交流自學的心境,他在我的唆使之下也在簡書更新自己的筆記,可以搜尋

小鄭的學習筆記

。期間,他說道

非常慶幸自己能夠堅持把自己學到的知識和困惑以文字的形式記錄下來。以前導師讓我搞網頁的時候折騰過Apache,當時一邊學習一邊記錄。幾個月過去後,導師又讓我重新負責,盡管我已經忘記了具體的步驟,但是看到自己的筆記就全部想起來了。

這也就是為什麼我鼓勵學習小組記錄筆記的原因。你不需要把筆記寫的多麼好,隻需要記錄自己遇到的問題以及當時的解決方法就行了。就比如說我這次的筆記就主要寫的是”如何用虛拟機安裝Linux和Xshell連接配接伺服器的方法“。并且我也從别人的筆記中看到如何保證資料的可重複,以及詳細虛拟機安裝方法。

筆記的意義就在于未來出現的問題,或許現在已經解決了,于是通過筆記你就能瞬間穿越到寫筆記的那一刻了。

以下為已經上交且和第一周任務關聯度較大的筆記:

第二周任務

從某種意義而言,不掌握Linux或者Unix系統就無法順利的進行生信學習,原因就是大部分流程都是運作Linux伺服器上,結果就是絕大部分生信軟體也都隻能在Linux下運作。你可以嘗試進行源碼編譯,移植到Windows平台。

為此,你需要把Linux用的像Windows那樣熟練,把所有Windows的相關操作都用指令映射,是以作業1就是

把自己Windows下的操作記錄下來,然後在Linux下找到對應的指令實作。

案例1,檔案移動 :Windows的檔案移動需要右擊檔案,選擇剪切,然後到目錄路徑下粘貼,在Linux下則是

mv SRC DEST

案例2, 軟體安裝: Windows都是先百度軟體名,然後去官網下載下傳,輕按兩下exe,選擇安裝路徑,不斷下一步,或者去某軟體管理器下搜尋,之後自動安裝。在Linux下的軟體安裝有哪些方法,請記錄。

案例3, 資料壓縮: Windows是下載下傳一款壓縮軟體,然後壓制成ZIP或者RAR或者7z等。在Linux下則是用

gzip

等壓縮,不過一般還要先用

tar

打包。

作業二: 用管道指令分析資料

We should have some ways of connecting program likes [a] garden hose -- screw in another segment when it becomes necessary to massage data in another way.

--Doug McIlory(1964)

用好Linux的管道指令, 這個是從Linux新手進階的必須了解的理念,結果是大家都能夠了解下面這段指令,它的功能是計算 input.txt(input.txt裡面存放的是一篇英國文章。) 裡面出現頻率最多的單詞。

cat input.txt | tr -cs A-Za-z '\n' | tr A-Z a-z | sort | uniq -c | sort -rn | sed 10q
           

正所謂熟能生巧,是以請保證自己能夠在不看

Data analytics with Unix

的情況下,也能熟練提出問題和解決問題。

更多題目見

http://rosalind.info/problems/topics/string-algorithms/

, 嘗試用管道指令解決這個問題。

其他作業

第三個作業 是了解一下正規表達式(regular expression),知道它的用途即可。

第四個作業: 這個僅對自己有超高要求,并且能夠毫無壓力完成前面三個作業的人,也就是掌握

grep

,

sed

awk

的用法,至于要學習到什麼程度,取決于你自己的能力。

以下為和第二周相關,但在第一周上交的作業:

參考資料

Google is your friend. If you are not able to contact this friend due to some reason, you can baidu how to find google.

--by xuzhougeng