原文恕刪 對原po的幾個問題試著回答看看 不是南島語專家 有錯請見諒
問題1. 為何除了台灣本島的南島語其它地方的南島語都屬同一語族?
(即南島語系下的馬來-玻里尼西亞語族?)
這個只能說比較語言學構擬(反推)的結果就是這樣的。
以馬來-玻里尼西亞諸語的數字2來說,有dua duo rua ruo lua各種講法
並且我們發現僅在菲律賓的某些語言中,有著duha的講法,於是我們做出判斷
認為這個詞的祖形應該是接近於duha那樣的。
(除了保存著母音之間的h的那些語言,其它語言都把母音之間的h丟掉了)
也就是說,這些語言我們不難看出來有一個共同的源頭,那這個源頭,也能
套到台灣的南島語上面嗎?
我們審視了一下台灣南島語的資料可以發現,2的講法也很多樣
有doθa ruso cuusa tusa' dusa daha roʃa' 等
也不難看出來,我們對馬來-玻里尼西亞諸語的構擬*duha (*表構擬形式)
不太能直接套到台灣南島語的例子上,但馬來-玻里尼西亞語和台灣南島語
的共性仍是十分顯而易見的(抱歉這裡不多做說明),於是我們把原始南島語的2
擬作*duSa,這裡*S是一個未有定論的"s類音",可能是s/ʃ之類的
到這裡可以做個結論,*S -> h 是一種演變路線(變成原始馬來-玻里尼西亞語)
而*S變成(或仍然是)s/ʃ/θ是其它路線,造成了原始南島語朝向各語族的分枝。
(對其它的子音如開頭的d或甚至母音也能做這樣的比對)
問題2. "語言最歧異的地區,就最可能是該語系/語族的起源地"的說法
這應該算是近代歷史語言學興起後,各語言學家經過研究所得出的一個"通則"
基本上,語言的分化是需要時間的,我們看到分歧大,很大程度上是表示
(在所在地)存在了很久。也因此會說分歧最大的地方較有可能是起源地。
當然語言也不是沒有突然經歷快速演變的可能,只是就如問題1的例子提到的,
我們可以透過一些簡單的比較看出某某語言是在哪個節點跟其它語言有了不
同的演變方向。我們可以知道這些歧異,是在上層的節點,還是在下層的節點。
記得以前看過李壬癸教授的一篇文章提到這點,他對這種說法基本上是支持,
並提到過像北美原住民的Athabaskan諸語 就是西方語言學家研究出的典型例子
(分布圖: https://imgur.com/8Odh7NC.png )
其中加拿大境內的Athabaskan語之間分歧明顯 而美國西南部的幾種Athabaskan
語之間的分歧就相對來說不太大 可推得起源於北方而非南方 是一正例
但他也提到一個反例是(漢藏語系底下的)漢語族
漢語明顯是中國東南方的分歧較大(有吳湘閩粵客贛等,而且閩語內部分歧也大)
北方基本上就較為統一,以官話和晉語佔絕大多數(雖然其實官話內部分歧也沒想
像中小)。然而基本上不太有人會認為漢語是起源於中國東南再擴散至北方的。
(關於漢語為何是這樣,在此不做具體論述,對中國歷史和地理了解的應該都懂)
所以也不要覺得這種說法100%準確,尤其在尚未細究實際資料之前。
(具體來說是哪篇文章我忘了 有空再查)
問題3. 所以是什麼造就了台灣南島語的分歧比其它地方的南島語大?
其實我覺得原po你在原文倒數第二段已經自行解答了,我也是覺得此說法較有
說服力("當時可能只有少部分的族群選擇遷離台灣,......")
我猜可能是一些講原始南島語的人從台灣遷至巴丹群島或呂宋之後,這群人的
原始南島語就演變成了原始馬來-玻里尼西亞語,然後再次擴散至南洋群島
太平洋諸島等地,於是這些語言都是原始馬來-玻里尼西亞語的子孫。
也有可能原始馬來-玻里尼西亞語已經在台灣島上已從原始南島語演變而成,
但後來這群人遷移走了,在其它島嶼上開枝散葉,在台灣島上則留著其它
原始南島語的支系,如原始北台灣南島語、原始鄒語等。
至於說原po倒數第三段"南島語族的祖先來源分歧",這就比較難以驗證。
我也有設想過比方說琉球人能漂流到台灣嘛,搞不好很久以前有一群琉球人
不知怎的來到台灣,沒被趕出去或殺光反而逐漸南島化並定居下來。
當然這種理論不是不可能但很難找到證據,基本上我持保留態度。不過確實
,語言的歧異或演變有可能不單是自身分化,而是跟其它語言接觸的結果。
如果要接觸,也得是在原始南島語時期有跟各方接觸,才會導致不同的演化方向。
所以不如就假設台灣是南島語的發源地。
P.S. 其實台灣南島語應該分成幾支(幾個語族),各家說法尚無定論
李壬癸教授在不同時期的研究也不太一樣
像這篇(2006年)的研究採用四大支的分法 (https://bit.ly/3kDY7tp p.8)
台灣本島的南島語確實囊括了南島語系下除了馬來-玻里尼西亞語的所有
其它支系,但稍微研究一下會發現這不是什麼很難以理解的事。