雖然生統人少,知道生統的人更少XD
希望這個可以讓想讀統計的人也參考一下我們家。
知道生統在搞什麼東西的也人參考看看我們家。
那基本上我們家課程的編號是
BIOS 5XX:給其他公衛學院碩士
BIOS 6XX:給自己生統碩士(跟統計STATS 5XX類似)
BIOS 8XX:給自己生統博士(可以去修統計STAT 6XX)
必修課程們:
理論課程:
BIOS 601, 602
基本上毫無反應就是機率跟統計推論。601, 602為期一學年,是生統碩必修。
(生統碩的課都是以601, 602為基礎。)
各種收斂,各種分配介紹,強弱大數,中央極限定理 (601到這)
Exp family, sufficient, complete, ancillary statistics, NP lemma, Karlin-Rubin
Cramer-Rao 等等的
基本上就是照著Casella & Berger Stat Inference。
應用課程: 基本上這系列的課程(還有survival)的講義是每年通用。
BIOS 650, 651, 653
這個系列則是共一年半的三門系列課。
650: 基本的線性回歸, OLS
651: generalized linear model
653: longitudinal data analysis: mix effect model and GEE
這邊我得說653是所上很重要的課。我自己在跟醫院面試的時候,醫院那邊表示這個東西
大部分是生統碩的人的優勢。
Capstone:
BIOS 699
最後一個學期的必修課,基本上就是5個Projects。是一門把老師跟學生都累得半死的一門
課。但是對找醫院的工作有著作弊一般的效果。(面試的時候全都在問project然後也被要
求帶報告過去。)每個project都得上台報告至少一次並且交出一個紙本報告(背景知識當初
查得要死)。學期的project都不太一樣,完全要看上課的老師手上有什麼資料。那因為是
自己一個人一組,每次project都會被要求做期中或者是期末報告,所以可以預期大概2.5
個禮拜就得結束一個報告。給大家參考一下我這學期的題目是什麼。
第一個project基本上就是暖身上台,寫份醫院的報告。
prostate cancer surgery comparison
第二個project: clinical trial with longitudinal data
Fibromyagia treatment efficacy
第三個project: breast cancer prediction with gene biomarker
這個project因為是做預測,各種方法都來了。我記得那個時候最好是gradient boosting
第四個project: Power calculation and simulation
這邊要我們計算power and sample size。用的資料會是logitudinal data或者是survival
第五個project: spatial data
基本上,不太可能會讓你輕鬆結束的一門課。
老師們對於上台的標準是要能夠講出選用這個模型跟變數的理由。
對於報告的要求則是可以讓沒有統計背景的醫生也能看懂你的報告。
(嚴禁太多數學的意思
選修課程:
BIOS 615 Stat Computing
大概一半的學生會是統碩的學生。那基本上就是教C++跟RCpp。
會有一些作業會是Leetcode題目XD
另外會教到比較統計的部分會像是HMM, MCMC implementation。
BIOS 617 Sample Design
老師是專門做問卷跟抽樣方法的Michael Eillot。基本上老師很忙,那個時候還兼了Univ
of Maryland的課,常常會需要自己上網看課程。
課程不外乎就是從最基本的SRS到stratification,cluster,systematic等等的統計量。
會教你在各種抽樣方法下,要怎麼使用哪種統計量會比較efficient。
(注意,不會教你怎麼抽樣的細節,那方面請洽詢survey methodology的課程)
這門課,個人覺得其實可以學到很多,但是老師我真的不喜歡。
BIOS 619 Clinical Trial
老師是好爸爸的Philip Boonstra。我上的時候還是兩學分的課,現在變成了三學分,所以
可能內容有所變動。
課程其實算是相對悠閒的課,不會有太多太難的數學跟統計,我個人覺得常常流於太敘述
性質。不過可能在變成三學分之後會有所改變。
BIOS 665, 666 Population genetics and stat method in genetics
老師基本上就是center of statistical genetics的老師們。(Sabestian, Xiang Zhou)
665是population genetics。一句話: Coalescence theorey。(當然會慢慢加上mutation,
population structure, recombination等等的)。但個人覺得礙於限制在碩班的程度,背
後其實有些隨機過程的數學被藏起來,常常流於看公式自己心領神會。以為是佛系學生,
讓我覺得很困擾。
666則是跟665有很大的重疊,但是會放比教多比重在coalescence以外的模型。像是
phasing 等等的。
個人覺得665和666比較可惜的一點是,想要教的東西太雜了,所以也沒有好的課本。常常
教的東西都還在論文裡面,讓整個課程常常有點太發散。
BIOS 675 survival analysis
對,我們所survival analysis是選修。但是因為也是醫院求職必用的,基本上跟必修一樣
。所有人都會上。但是有一半的學生是統碩學生。
老師這幾年換成了Yi Li。老師之前在哈佛,所以常常跟大家講密西根的大家上的survival
比哈佛碩班難啊(不知道是真是假XD)
但是survival的課程在所上的講義是有固定的。所以內容其實每個老師差不了太多。(老師
特別提到的是counting process的部分,他說這不應該出現在碩班的survival)
個人很喜歡Yi Li,老師調條理很清晰,每次上課也都會先花點時間複習上次講了什麼。
只要上課跟得住老師的腳步,講義可以理解的很快。但是老師的作業偏難。
BIOS 680 applied stochastic process
老師是Willam Wen,是個大好人。雖然這門課冠上stochastic process,但是實際上非常
地不數學理論。能夠不用到太難的數學,老師就盡量不用到。比較特別的是老師會花點時
間講Metropolis-Hasting跟Gibbs Sampling的基礎。另外這門課不會上到martingale。如
果想上正統的隨機過程,請洽stats 621, 625。
BIOS 682 applied Bayesain inference
我上的是Jian Kang的課,也是個大好人。這門課的組成跟615一樣,一半是統碩。最近我
們統計所好像聘了幾個Bayesain,終於自己也開了自己的貝氏統計。(不過也聽說,跟原本
的frequentist起了些爭執XD 是的,我們學校統計所走frequentist)老師其實中規中矩,
但是作業跟考試常常出得太難。導致最後老師分數都給很甜(?)。
BIOS 695 categorical data analysis
雖然之前Yi Li說生統三大跟統計不同資料類型: categorical, survival, longitudinal
但是如果651修的好,這門課就是門輕鬆美滿混學分的課。如果缺學分,這是最好的選擇。
所上少數可以混學分的選修。
BIOS 801, 802
在幾年前,原本都是跟統博一起上STATS 610, 611。但是這幾年老師們決定自己收回來教
自己喜歡的東西(?)
801基本上會花不少時間在測度論上。不過比較可惜的是之前的老師Bin Nan去了UCI。
現在的老師個人不是很喜歡。現在的老師Notation很混亂。
801大致上會照著Durette Prob Them前幾章再配上一點M-est, z-est。
802則是各取一點。教的內容也很廣泛。
基本上是
Stat Decision Thm:
loss func, risk func, decision func, acion func, admissibility, minimax
Bayes Stat and EM alg:
Bayes principle, minimax priciple, Stein-James est, Empirical Bayes est
Testing:
NP lemma, UMP, UMPU, Karlin-Rubin, Sequential testing, Generalized llh test
Multiple testing and false discovery rate
BIOS 885 Nonparametric Statistics
應該是兩年一開的課。老師Peter Song是個走非常理論的老師。我本來以為會是教rank
test, chi square等等的。結果教kernel density estimation, local polynomial reg,
spline reg, gam, varying coeffcient model。最後把mixed effect model和spline 連
起來之後,個人覺得這門課算是650, 651, 653系列的集大成。因為原本的650, 651, 653
還有survival其實都可以把原本的parametric model換成non-parametric。考試跟作業都
是要求把原本課堂上的normal continuous的結果變成glm的假設去證明。最後的最後,老
師給了不少functional data analysis的論文出來。我個人很喜歡peter,也學到很多。
BIOS 830 spetial topic
基本上是看老師們自己想開什麼課。這兩年Rod Little大師,開了history of stat,聽
說是把重要的論文全都抓出來看。不過我上的William Wen的machine learning。William
一樣是個老好人XD。更重要的是,比起我之前在CS上的,我覺得William上的方式我個人
覺得比較適合統計背景的人。老師基本上會講這個模型是怎麼想出來的,跟為什麼這個模
型會可以minimize loss function。(下面我會講我去CS上的版本。)對我來說,William有
好好把背後的數學講好,我很開心。
EECS 545 machine learning
我上的時候是Jacob Abernethy還在的時候。現在不知道被挖去哪了。基本上沒有人知道
他在幹嘛。是我最害怕的教學類型: 直接丟結果,跟你講這個方法的性質。我都覺得我如
果可以直接理解,我就直接wiki不就好了。(佛系老師: 不證明,不推導,不解釋。時間到
了,學生自然學會。)最後,我所有的理解都是從線上課程學到的。
(這邊推薦youtube mathematicalmonk給大家,現在是哈佛生統的老師)
MATH 451 advanced calculus
是的,小弟不才,之前大學化學的,沒修過分析導論。老師其實一般般,但是選書我很喜
歡: Introduction to Real Analysis, Bartle。個人覺得很容易理解。我之後甚至買了
Bartle的測度論來啃完。
EPID 601 Principles and methods of epid
流行病所博一必修,也是生統碩流病選必修之一。當初上課的老師是大老Hal Morgenstern
。(現在已經退休。)基本上,流行病學在講各種實驗設計,跟因果推論。老師其實很嚴格
。不過講義寫得很好。但我知道美國流病學生不喜歡他XD因為他做人太嚴厲XD
Public Health 610 Intro to Public Health
基本上是門一學分必修涼課,主要是給沒有任何公衛背景的人一點現在公衛的議題。簡單
來說就是讀paper然後上台報告。
Stats 608a Optimization in Stats
統計所607, 608的課程設計很奇怪。上學期上了607a, 608a各半學期,下學期再把607b,
608b上完。我上的是最近統計所聘來的老師Yuekai Sun,專長就是最適化。缺點是老師步
調極快。完全不覺得有可能好好地把課程完整的數學上完。老師自己也說,理論上課程是
要608a + 607b才是一門完整的課。
epid 515 genetics in public health
基本上讓我對基因體的方法有基本的了解。但我對這門課的印象全都被後來的665,666蓋掉
基本上,所上碩班課程跟統碩可能差異不大。但是到了博士班,分野就會比較清楚了,生
統博士的課程還是比較偏向應用。證明大致上可以不用在意太多細節跟條件。但是要讀得
懂就是。
那依照自己的經驗,如果想找工作,醫院的生統職大概是生統碩最容易找到的工作。(當初
我丟自己學校醫院,通常回復都不錯,也可能是因為沒有人想待密西根醫院XD)那如果要找
這類型的工作,我會建議好好學653, 675,然後做好project,並學一下SQL(EECS 484去旁
聽半學期一下)會容易很多。另外,醫院生統職的工作真的要會知道醫生要什麼。跳過數學
們,那些數學留給自己自high就好。如果有機會,做到claim data,那流行病學就要學好
一點。當初我有家醫院就因為這個被打掉。另外,我們家也有學生團體在接NGO的案子,想
要更多project跟consulting的經驗其實會很有幫助。
最後,如果對於做統計基因體,那我們家可能就是你的首選了。所上大概一半的老師是在
做基因體,不會不愁找不到沒有喜歡的老師。
(但我真的好想抱怨為什麼課上的這麼佛系.....。網路上資源已經夠少了。)
另外,如果你現在問我統計跟生統的差別在哪,我會說碩士的話應該差不多。博士班的話
就看你想不想走理論。如果想走理論的話,統博會是比較好的選擇,因為你可以選擇的老
師會比較多。
(記得當初有人跟我講統計所跟生統所的差別:
統計所你可以找到很多做理論的老師跟一些做應用的老師
生統所你可以找到很多做應用的老師跟一些做理論的老師