※ [本文轉錄自 Gossiping 看板 #1WJC77Ti ]
作者: mayaman ( 馬雅人) 看板: Gossiping
標題: Re: [問卦] 機器學習有可能讓我們懂馬雅文嗎
時間: Sat Mar 13 21:44:35 2021
※ 引述《Firstshadow (凱留醬><")》之銘言:
: 嗨嗨
: 大家晚上好壓壓ka~
: 就是喇
: 小魯弟妹窩最近在接觸自然語言
: 發現
: 每個語文都有一套自己標準的架構
: 而馬雅文也被證明不是圖惹 而是象形文字
: 這樣的話
: 運用現代的技術
: 有可能用那個什摸機器學習什麼的大數據還有AI
: 來讓我們更深入了解馬雅文嗎 ==
: 畢竟小魯弟妹窩 從小開始
: 玩世紀帝國、世紀帝國2 都選馬雅人噠
: 所以蠻想懂噠
: so, 有沒有機器學習有沒有可能讓我們懂馬雅文的八卦ㄋ~
: わたし、気になります~
: http://i.imgur.com/n1VzFhV.jpg
: (づ′・ω・)づ ~
你說的這個問題,我蠻有興趣的。
因為,學會馬雅文字一直是我從小的夢想。
所以我自學,也花錢到國外請教最厲害的學者。
目前已經略有小成,也開課教一些社會人士解讀的方法啦。
其實馬雅文字不是特別容易,除非長期接觸,否則也不是很好懂。
所以,我還蠻期待可以用機器學習的方式來解讀馬雅文字。
我自己不太懂機器學習的界線跟極限是什麼?
因此這篇文,我想要講一下馬雅文字解讀的幾個困難處。
再請懂機器學習或是AI的鄉民們,評估看看是不是有辦法。
就看看是我教你比較快,還是教會機器比較快啦
第一點!
瑪雅文字不是純粹的象形文字,一個馬雅文字可以有三種基本型態。
分別是純象形、表音、象形混合表音的型態。有些人會用中文的六書
來理解,但是本人覺得還是有些差異,所以不太喜歡用六書來解釋。
關於這點,我舉「Pakal」(盾牌)的三種型態寫法。
https://imgur.com/rOSStB0
從我整理的這個圖片,就可以看到一個字基本上有三種不同型態的寫法。
而且,這三種書寫型態沒有規則,完全按照書寫者當下的決定。
這個是解讀的第一個最簡單的困難。
第二點!
瑪雅文字有些特殊分類的馬雅文字。像是曆法類的文字,就沒有不同型態的問題。
馬雅主要有三種曆法,其餘的曆法種類零零總總則不超過十種。網路上有些馬雅
曆法能量的學派說有二十種或是三十種,其實是亂說。
常用的三種曆法是長紀年曆、哈布曆、卓爾金曆。後兩種,我在YT上有拍影片,
可以自己參考一下,長紀年曆的影片配合末日預言,最近要拍。
https://youtu.be/hN8UxBspa8I
這類文字比較簡單,比較有規律。所以也是最早被破解的馬雅文字。
我想要機器學習比較簡單。
第三點! CVC原則
瑪雅文字既然可以拼音,所以那些像是圖案的字符,可以表示語音。
不過,馬雅文跟日文有點像,一個音節用一個字符表示。但是馬雅語的語尾卻
會以子音結尾。因此,如果語言要書寫成文字,就要寫成補一個母音,行成音
節。
母音有A、E、I、O、U五個。要補充哪個音節,大多數狀況由前一個音節的母音
決定。像是第一點提到的Pakal,寫成拼音型態時,結尾是子音L。
因此,前一個音節是Ka,所以寫成拼音型文字時,結尾要補上A這個音。
Pakal(a),但是唸出來時A不發音。
但是,瑪雅文字並不是嚴格遵照CVC原則的,雖然有些原則可以依循,不過,
還是要看書寫者的選擇,也有可能結尾母音與前一個音節的母音不同的情形。
第四點! 字符變換原則
這點在我的教學經驗裡,算是比較困難的。
瑪雅文字是沒有統一跟固定的寫法的。前面提到三種類型的字。
基本上都會因為寫作者的寫法,而產生無限多種變化。
在象形型態的文字中,有可能出現幾個重要的辨識點,再加上許多讓人與其他字
混淆的變化。所以,如果要解讀,就是要神入馬雅人的心態跟文化脈絡。
另外,同樣的情形也會混在表音兼象形型態的情形裡,例如下面這個例子
https://imgur.com/xjKlm3h
以上這些字都代表yotoot,某人某地的房子。
而且不是全部的寫法,只是其中一個部分。
在拼音型文字中,則是每個音節都會有許多不同的寫法。
這個就是我去美國學習的老師David Stuart在18歲時候發現的規則。
字符變換原則。
例如Na這個音節,可以有以下的各種寫法
https://imgur.com/tVbCrpv
至於何時出現,一樣沒有規則,按照書寫者當時的設計。
如果是個三個音節的字,每個音節有三種寫法,可能會有27種可能性。
第五點 各種融合原則
理論上馬雅文字是一個方塊,每個方塊可以代表一個單詞,也可以代表兩個單詞。
甚至也有前半部分是前一個字後半部分的音節,後半部分是後面一個字的前半部分
音節。
又還有不同字詞可以融合的。
像是Chum、Tun這兩個單字,可以融合成一個字。
如果中規中矩的寫法是這樣
https://imgur.com/8nz2zhu
前半部分是Chum,後半部分是Tun
但是也可以融合成這樣。
https://imgur.com/r01M6Ke
把Chum 跟 Tun融合成一個字符。
同樣的,配合字符變換原則,也可以變化出很多種不同的寫法。
但是最炸鍋的事情是,這五個原則都會混在一起發生。
而且沒有規律
以上,大概就是這五點,請大家再評估一下。
我之前有開直播簡單講過,也歡迎大家參考。
https://youtu.be/2KrMWU6J6E4