大家安安好。
今天來分享一下人臉辨識的故事。
※ 引述《can18 (18號)》之銘言:
: 我覺得原 Po 犯了幾點錯誤
: 1. 人臉識別的技術
: 人臉識別最主要的目的是將相同的人視為相同的人 不同的人視為不同的人
: 數值代表的是為同一個人的機率 並不是兩個人的相似程度
: 人臉識別不會保證相似的人的分數一定會比不相似的人高
: (當然實務上相似的人分數很可能比不相似的高 但不是必然
: 事實上 有一篇論文叫做
: Measuring Face Similarity Rather than Face Identity
: (CVPR 2018 頂級的電腦視覺會議論文)
: 如果可以直接用人臉識別的分數推論相似 這篇論文根本不會存在
: 2. 相似的定義
: 假設你真的得到機器的相似分數
: 大家說的像 相似
: 通常指的是人類知覺上的相似
: 因此若兩個相似的人
: 機器如果判斷為相似
: 也只能說 人覺得相似 機器也覺得相似
: 機器如果判斷為不相似
: 也只能說 人覺得相似 但機器覺得不像
: 而不是可以用機器判斷來推論人的知覺
: 機器判斷的邏輯跟人類是差非常多
: 結論
: 1. 根本用錯方法 不能用人臉識別分數推論人臉相似程度
: 2. 就算用對方法 機器覺得像不像不能推論人覺得像不像
上面這篇已經講的很接近核心了,只是有些用詞不是很精確。
: 1. 人臉識別的技術
: 人臉識別最主要的目的是將相同的人視為相同的人 不同的人視為不同的人
: 數值代表的是為同一個人的機率 並不是兩個人的相似程度
其實人臉辨識AI算出來的數值,他的基準就是兩張照片的相似程度阿。
不然大家覺得那個數值是從哪邊冒出來的?擲茭嗎?XD
那麼問題就來了,為什麼人類認定的相似程度,跟AI認定的相似程度差別這麼大?
因為,AI判斷的基準,跟人類判斷的基準,兩者之間有很大的差異。
對於人類來說,判斷臉孔的基準和權重大概可以分為以下幾種條件:
(實際參數因人而異,這邊只是舉例)
五官形狀 200%
五官相對位置 200%
臉型 100%
髮型 20%
神韻 50%
痣、裝飾物 50%
但是對於AI來說,他的基準跟權重卻長這個樣子:
(實際參數因模型而異,這邊只是舉例)
兩眼間距 900%
鼻樑長度 600%
五官形狀 60%
五官相對位置 60%
臉型 30%
髮型 0%
神韻 0%
痣、裝飾物 0%
為什麼「兩眼間距」跟「鼻樑長度」在AI演算法中會佔這麼大的比例呢?
因為這2個因子擁有與眾不同的特性:
1. 幾乎不會因為臉部肌肉的牽動而改變
2. 不會因為拍照角度而改變
3. 不會因為化妝效果而改變
4. 幾乎不會隨年紀增長而改變
5. 對AI來說很好計算,且不容易出錯 (跟神韻什麼的比起來)
對人類來說幾乎沒有用處的2個特徵點,
在AI演算法中卻成為了極度重要的判斷依據,
因此造成了如此不同的判斷結果。
這邊用原PO的強者我朋友舉例 (出處維基百科):
這個人有著優良的基因與血緣,智商高達180,
但平常的個性吊兒啷噹,功課和體育都不行,而且非常好色。
對於朋友及工作同事 (?) 來說,他是非常優秀的隊友,
但在老師的眼中,他只是個智障 XD
不過就是判斷基準不同罷了~
好,打到這裡,一定有鄉民想吐槽,
你又不是Microsoft的工程師,你又知道Microsoft的演算法跟你講的一樣了。
所以今天除了文字說明外,下面再請到2組模特兒幫我們驗證上面的理論~
首先第一位嘉賓,有請坎城影帝兼鄉民男神的梁朝偉出場~
https://imgur.com/rmuqGVd
我們試著用物理濾鏡 (誤),把他嘴唇加厚!耳朵拉長!讓他變成另外一個人!
https://imgur.com/NJK70Er
恩...不要說另外一個人了,這根本就是另外一種生物了吧!
但是讓我們來看看AI怎麼說:
https://imgur.com/d4aBqiB
AI:我覺得他們是同一個人 ^^
雖然嘴唇讓整體評分下降了不少,但因為上半部實在是太像了,
所以信心指數還是高達0.7!Amazing!
好,看到這邊可能還是有鄉民不信邪,
覺得這2張照片相似點還是很多,換成人類也能辨識的出來啊!
所以我們再請到第二位嘉賓--基隆市長林右昌!!
讓我們先來看看他年輕時的樣子:
https://imgur.com/a5pKsB3
接著讓我們看看歲月在他身上造成了什麼樣的影響:
https://imgur.com/Son1ppK
( ′ ω ` )
哪個鄉民敢說這2張照片是同一個人的?看我不打死他。
但,讓我們來看看AI怎麼說。
https://imgur.com/ZXUsCSp
AI:矮東Care! 他們就是同一個人!
XDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
不過畢竟2張照片差了20來年,即使強如AI也還是覺得混亂,信心指數只有0.5。
換成其他照片時,有時也會出現辨識成不同人的結果。
不過整體來說的相似程度還是有0.3以上,遠遠超過了えなこ跟黃國昌的0.1。
可見AI與人類的基準真的很不一樣。
回到結論~
因為人類跟AI在判斷基準上實在差太多了,
所以我們不能因為AI的評分低,就說這2張照片以人類的觀點來說不相似。
如果把上面的判斷基準換成人類語言來表示的話,大概就像下面這樣的感覺:
鄉民:えなこ跟國昌老師的五官和神韻好像阿!!!
えな國!えな國!
AI: 兩眼間距不合格!OUT!
鼻樑長度不合格!OUT!
這根本就不同人嘛!想騙我,門都沒有!
以上。