[閒聊] 用數學分析 3500 場戰役、6600 位將領的

作者: Su22 (裝配匠)   2017-12-31 18:45:38
這是用分析棒球比賽常用的WAR來分析歷史上戰役
不過作者也說這模型還不嚴謹
只是一個有趣的實驗
當做等跨年時打發時間的閒聊看看吧
https://buzzorange.com/techorange/2017/12/28/math-prove-who-is-best-general/
用數學分析 3500 場戰役、6600 位將領的數據後,我們得出了史上最強的將軍
就像漢尼拔一樣,我想給戰爭史上有名的將領排個名。與漢尼拔不同,我希望通過數據來
評定每位將領的能力,而不是根據個人的成就。 我的模型可以給軍事歷史上的每位傑出
的指揮官排序。
方法:棒球比賽的啟發 ─ 額外勝利數(WAR)
受到棒球比賽的啟發,我選擇使用額外勝利數(WAR)作為評估體系。WAR 體系經常用來
估算棒球選手對其球隊的貢獻。它能計算出相對於替補隊員上場,選手對其球隊的貢獻。
例如,相對於一個高級別小聯盟球員的平均貢獻得分,一位 5 WAR 的棒球選手可以為其
團隊貢獻 5 個得分。 WAR 的缺陷還有很多,但它可以根據數據評估選手的能力。
因此,我希望利用 WAR 來評估每位將領作出的貢獻是處於平均水平之上還是之下。 下面
我將解釋我的模型在不同情況下如何計算出平均水平。 我甚至可以根據一位將領在相同
的情況下(假設替補將軍處於平均水平)和替補將領的差距來評估他的能力。 換句話說
,我能計算出所有將軍的 WAR。
數據:維基百科上 3580 場獨立戰爭與 6619 位將軍
我面臨的第一個挑戰是如何構建一個可靠的數據集。 由於找不到一個全面的歷史戰爭數
據集,我決定自己動手建立。維基百科的戰爭列表包括 3580 場獨立戰爭和 6619 位將軍
。雖然不夠全面,但維基百科的列表為我將要建立的模型提供了足夠的樣本。
然後,我開發了一個功能,可以為每場戰鬥提供關鍵訊息,包括參與戰鬥的所有指揮官,
指揮官可用的總兵力以及戰鬥結果。 由此產生的數據集為建立基準水平提供了大量的戰
鬥樣本。我將拿其他將軍和這個基準水平作對比。
以這個戰鬥樣本為基準,我構建了一個線性模型。 我把每場戰鬥的兵力分成步兵,騎兵
,炮兵,空軍和海軍。 根據一位將軍的對手的情況,我能計算出其優勢或劣勢的數值。
然而該模型算出的數值非常保守,這表明與其他因素(如地形或技術)相比,新兵數量的
影響相對較小,這一點值得深入探究。 然而,在這個項目的結果中,指揮官的戰術敏銳
度與其他因素相比更為重要。
我已準備好給每位將軍排名,然後深入研究排名結果。
方法如下:我先將每位將軍指揮的戰鬥分開來看,然後給每場戰鬥中他們的表現一個
WAR 分數。 例如,法國皇帝拿破崙在波羅底諾戰役中獲得 49 WAR。 由於法國軍隊略遜
於俄羅斯帝國的戰鬥力,該模型得出拿破崙位置的替補將軍有 51% 的勝算。WAR 系統認
為拿破崙百分百能夠勝利,減去替補將軍的勝算,拿破崙比替補高出 0 .49 。
對於計算失敗率,該系統也使用了類似的方法。 例如,在波羅底諾戰役中,拿破崙的對
手,俄羅斯將軍米哈伊爾‧庫圖佐夫(Mikhail Kutuzov)得到了 -0.49 WAR。 由於失敗
,他取得了 -1 個勝利,但是替補將軍也有 51% 的可能會輸。
結果:拿破崙第一名,第二名凱薩還不及他的一半
在所有的將領中,拿破崙的 WAR 最高(16.679)。 事實上,第二名是凱撒(Julius
Caesar,7.445 WAR),但他的戰績還不到拿破崙的一半。
拿破崙的優勢在於他指揮的戰鬥數量很多。 在他的 43 場戰鬥中,贏了 38 場,僅輸了
5 場。拿破崙在 17 場戰鬥中攻克艱險取得勝利,在 5 場戰鬥中轉敗為勝。在戰爭數量
上,沒有人可以與拿破崙匹敵。
拿破崙指揮了 43 場戰鬥,第二名羅伯特‧E‧李(Robert E. Lee),共指揮了 27 場戰
鬥(平均戰鬥場數為 1.5)。因為指揮戰鬥的次數多,拿破崙有更多的機會展示自己的實
力。 亞歷山大大帝雖然在總共的 9 場戰鬥中全部取勝,但由於他參戰次數過少,時間較
短,取得的 WAR 也較低。
除了拿破崙這個例外,其他的將領的 WAR 都比較平均。 這表明拿破崙的成功是因為其指
揮才能卓越,模型的結果沒有問題。拿破崙的 WAR 與數據集中將領的平均 WAR 差距為
23。
數據觀察:名聲大不代表一定好
還有一些將領,他們雖然名聲很大,但是 WAR 低的驚人。美國南方聯盟的
司令羅伯特‧E‧李(Robert E. Lee)的 WAR 為-1.89,這表明處於平均水平的將領比
Lee 還要成功。Lee 處於不利地位,因為他軍隊規模和資源都有限。 儘管如此,他也實
在稱不上戰略家這個稱號。有些歷史學家批評了他的作戰戰略和指揮關鍵戰役的方式。他
的 WAR 證明這些歷史學家的想法是對的。例如, 在葛底斯堡戰役的最後一天,Lee 指揮
的「皮克特衝鋒」真是一場災難。 用南卡羅來納大學教授托馬斯‧康利(Thomas
Connely)的話來說,「如果沒有羅伯特‧李(Robert E. Lee),南方的情況可能不會那
麼糟。
二戰期間,德國陸軍元帥歐文‧隆美爾(Erwin Rommel)因在北非的戰役取得成功,綽號
「沙漠之狐」。在這個模型中,他的成績也不佳,最終戰績為-1.953。 這和近代將領,
包括諾曼‧施瓦茨科普夫和阿里爾‧沙龍,對隆美爾的讚譽不太一致。像 Lee 一樣,隆
美爾一直是歷史上頗有爭議的人物。批評家認為他之所以被稱作作戰天才,主要是因為德
國和盟國的宣傳。 據報導,英國將領誇大隆美爾的作戰能力是為了掩蓋自己失敗。
近代將領成績差,因為參與數太低了
在模型中,近代將領的成績相對較差。美國將軍喬治‧S‧巴頓(George S. Patton)被
歷史學家特裡‧布萊頓(Terry Brighton)稱作「二戰中最偉大的將軍」之一,而他也只
獲得了 0.9WAR。 近代將領的 WAR 較低可能是因為他們參加的戰爭數量較少。
二戰後的將領中,以色列指揮官脫穎而出。以色列軍方領導人摩西‧達揚獲得了
2.109WAR(共指揮 60 場戰鬥)。他的 WAR 是近代將領中非常出色的,但與 20 世紀前
的將領相比,還是稍遜一籌。以色列前總理沙龍(Ariel Sharon)在蘇伊士危機,六日戰
爭和贖罪日戰爭中取得勝利,因此獲得了 2.171WAR(總指揮 58 場戰鬥)。
漢尼拔當年的評估:低估了自己,高估了對手
最後,我把漢尼拔對這些將領的評估與我的模型結果進行了比較。根據 WAR 值,漢尼拔
低估了自己的能力。漢尼拔的 WAR 最高,達到了 5.519(總計第六)。亞歷山大大帝被
漢尼拔(Hannibal)排在第一。
在我的模型中,他稍遜於漢尼拔,獲得了 4.391 WAR(總計第 10 位)。經歷 9 場戰鬥
後,亞歷山大就去世了,但他贏得了所有的戰鬥。漢尼拔共經歷 17 次戰鬥,贏了 13 場
,輸了 2 場,撤退 2 場。
因此,我和漢尼拔的評估是一致的,即雖然漢尼拔參與戰鬥更多,但亞歷山大才是實至名
歸的戰術家,他展示了自己的作戰能力。如果不是疾病,他可能會繼續打勝仗。
然而,我的發現不同於漢尼拔對希臘將軍 Pyrrhus of Epirus 的評估。在我的模特中,
Pyrrhus 只有 3 次戰鬥記錄,得到了-0.53 WAR。雖然漢尼拔把創新的軍事策略歸功於
Pyrrhus ,但是無法證明 Pyrrhus 的策略一定能在戰爭中取勝。因此我對他的戰術深表
懷疑。
我的模型可以更加有趣客觀地評估各將領的作戰能力。WAR 為以後的研究提供了範例,未
來的研究也可以通過擴大數據集和改進其他因素來改善這個模型。
基於讀者的反饋,我想先明確自己的立場。首先,這篇文章的目的只是為了和大家分享一
個有趣的實驗,而不是確定性的排名,也不是對軍事歷史的學術貢獻。
此外,我的很多資料都來源於維基百科,因此我的模型存在漏洞。由於缺乏資源,數據可
能不是非常精確。
我相信絕大多數讀者閱讀這篇文章是出於對我實驗的興趣。感謝大家的支持和意見!
原文作者:Ethan Arsht
作者: reich3 (月湧大江流)   2016-01-01 00:22:00
普魯士腓德烈大帝跟蘇聯朱可夫怎麼沒出現???????
作者: colin1120 (SAN:13)   2016-01-01 04:22:00
怎麼定義「一場戰鬥」 依照定義不同 經歷最多場戰鬥的指揮官可能會是某個東線的連、營指揮官或越戰的隊長或是某個空軍or航空隊指揮部的長官而又要怎麼定義戰鬥的價值和戰果的價值?盟軍傷亡人數差異不大 但迪耶普戰役跟布雷斯特戰役對盟軍的意義難道會一樣嗎?
作者: asdf95 (K神我們巴西見)   2016-01-01 06:11:00
各位的要求太高了,這不是要造出完美的比較好而是要找出可供使用的參數設計,這個嘗試只能算是原型如果照各位的意見,是完全不能做出有意義的參數的而且戰爭本就有運氣成份,好的決策品質是要去除掉運氣成份讓我們知道這個將領究竟是個人能力出眾,還是運氣好就跟股票市場當紅的公司,不一定真的是經營者高竿,可能正好撞大運,讓他一炮而紅這種參數的用途是來評價決策,而不是比大小
作者: asdf95 (K神我們巴西見)   2017-12-31 18:49:00
對這課題有興趣的,可以找找上校賽局的研究
作者: Edison1174 (Edison)   2017-12-31 18:49:00
我還以為在打棒球 還WAR咧 那Win Shares怎麼用?又不像棒球比賽 每個球員跟聯盟 每個PLAY都有紀錄
作者: asdf95 (K神我們巴西見)   2017-12-31 18:52:00
這研究的方法不太好,經濟學跟國關有相關的研究如何把運氣的成份降低,得到較為貼近能力的評價
作者: Edison1174 (Edison)   2017-12-31 18:53:00
而且棒球基本上是在公平的場地 用公平的規則競爭戰場上可沒有公平場地跟規則而且還忽視了後勤的重要性
作者: asdf95 (K神我們巴西見)   2017-12-31 18:55:00
這課題有不少經濟學家跟大數據公司投入喔因為這是改善決策品質的重要課題這篇只是方法用的還很原始,有更好的理論可以做這方面課題想法倒是不錯的
作者: kira925 (1 2 3 4 疾風炭)   2017-12-31 18:58:00
WAR拿來分析不代表湊10個AR1的可以強過一個WAR10歐XD
作者: asdf95 (K神我們巴西見)   2017-12-31 18:59:00
應該說不曉得有多少人知道這背後不是線性的?這個比較數字目標是得到較合理參數,用來更快速評價個人能力而不是拿來做線性推演的
作者: kira925 (1 2 3 4 疾風炭)   2017-12-31 19:05:00
最近MLB版還一篇文章分析了 用WAR去估算薪水&交易決策可能會得到意想不到的結果也是說明WAR不能亂用
作者: asdf95 (K神我們巴西見)   2017-12-31 19:07:00
這是拿來做決策品質改善,而不是用來亂套的因為薪水還有球員的市場價值等主觀因素,不是單純體現球員的能力
作者: kira925 (1 2 3 4 疾風炭)   2017-12-31 19:17:00
#1QBFzbGk (MLB) 純粹題外話
作者: ejsizmmy (pigChu)   2017-12-31 19:18:00
Su22,有沒有數據分析妳被飛彈射的資料xD(壞心)
作者: c22748872 (嚕嚕喵)   2017-12-31 19:55:00
不知道隆帥一戰那些第一線指揮有沒有列入阿
作者: kuma660224 (kuma660224)   2017-12-31 20:35:00
拿破崙之類不是單純將領,而是國家元首。這讓他們不用擔心上級在增援或後勤上扯後腿
作者: qlz (())   2017-12-31 20:56:00
棒球賽每一場的價值幾乎是均等的(頂多就是季後賽國際賽略高於季賽?),但每場戰爭的價值絕對是不一樣的...
作者: shiriri (CG屁屁妹)   2017-12-31 21:00:00
這種分析毫無意義 因為進入戰鬥的條件天差地遠
作者: MyohMy (我的天老爺呀!)   2017-12-31 21:06:00
亞歷山大絕對不會只打9場,輸在史官不給力 XD
作者: nawussica (暴民好弱 )   2017-12-31 21:38:00
這個很好 老美應該偷偷弄了很久
作者: k800i (K800i)   2017-12-31 21:51:00
GIGO一句話打死。資料庫哪來的?維基......
作者: vandervaal (kensu)   2017-12-31 21:56:00
想看Su22被飛彈射的統計資料+1
作者: hazel0093 (heart-work.info)   2017-12-31 22:51:00
這個真得不好說 有人會說以色列是靠垃圾阿拉伯人刷數據這篇只能算做是一種模型,把一些東西簡化再簡化不過拿皇是真的恐怖,真的可以說甚麼仗都打
作者: mtmmy (澳洲無尾熊)   2016-01-01 07:29:00
總得有個起頭 還不到二十年前 sabermetrics也常被說沒意義
作者: katana89 (月月火水木金金)   2016-01-01 09:32:00
這點真的佩服美國人 肯花時間研究會被吐槽有用嗎的議題
作者: wittmann4213 (玄武岩)   2016-01-01 09:58:00
我覺得很有趣,但大概可預期作出的數字被批評沒參考價值,不過能引起話題讓人對軍事史有興趣就不錯,搞不好還能出將軍卡牌對戰:出現吧,真·紅眼蒙哥馬利XD
作者: asdf95 (K神我們巴西見)   2016-01-01 10:01:00
這很有用,只是這方法不好,經濟學界跟政治學有更好套用的理論,不過這比較直觀,不然用其他的方法,數學程度要不錯
作者: kuma660224 (kuma660224)   2016-01-01 11:02:00
早期戰爭有完整紀錄的資訊太有限也許21世紀大規模戰爭,能用AI大數據分析會產出較有可信性的數據排名。
作者: wittmann4213 (玄武岩)   2016-01-01 12:33:00
我是覺得這本身就不是作嚴格的學術性檢視,只是用美國人習慣的棒球分析,會讓一般人比較快代入
作者: btlin7806 (MOMO)   2016-01-01 15:01:00
有趣欸,推
作者: hgt (王契赧)   2016-01-01 16:10:00
有沒有加入東方將領?? 我覺得郭侃的WAR應該會爆表
作者: kuninaka   2016-01-01 16:44:00
陳慶之呢XD
作者: stu931134 (牛蛙)   2016-01-02 00:12:00
想法不錯,只是模型有點粗糙,而且戰事背後的影響往往比戰事本身影響還大,還有太多要考量了
作者: thigefe (米麩)   2016-01-02 01:17:00
建好模型後,慢慢改良,才是學術的真諦
作者: LANCE1212 (LANCE1212)   2016-01-02 03:21:00
蠻有趣
作者: aa923310tw   2016-01-02 10:09:00
說了單純有趣一下 又有人認真?
作者: kira925 (1 2 3 4 疾風炭)   2016-01-02 11:33:00
這並不只是趣味一下的題目
作者: fw190a (las)   2016-01-02 14:36:00
讓我想到Deadliest warrior的開場白
作者: Galm (水牛)   2016-01-02 16:15:00
挺酷的XD
作者: Rinehot   2016-01-03 08:29:00
WAR有個問題 他是個累積的數據 只要平均是正的打得越多WAR就會越高 對MLB球員來說不是問題 因為WAR本來就是看貢獻度 但是將領打仗的數量又不是他能決定的
作者: ejsizmmy (pigChu)   2016-01-05 05:32:00
那就改成打數?
作者: Bz5566 (只剩協志和仁甫的5566)   2016-01-08 09:28:00
Rinehot說的沒錯 這模型把勝場看得比勝率還重要

Links booklink

Contact Us: admin [ a t ] ucptt.com