Re: [閒聊] えなこ跟國昌真的相似嗎?人臉辨識告

作者: hsiehfat (Okami)   2020-07-09 19:28:23
※ 引述《can18 (18號)》之銘言:
: 我覺得原 Po 犯了幾點錯誤
: 1. 人臉識別的技術
: 人臉識別最主要的目的是將相同的人視為相同的人 不同的人視為不同的人
: 數值代表的是為同一個人的機率 並不是兩個人的相似程度
: 人臉識別不會保證相似的人的分數一定會比不相似的人高
: (當然實務上相似的人分數很可能比不相似的高 但不是必然
: 事實上 有一篇論文叫做
: Measuring Face Similarity Rather than Face Identity
: (CVPR 2018 頂級的電腦視覺會議論文)
: 如果可以直接用人臉識別的分數推論相似 這篇論文根本不會存在
: 2. 相似的定義
: 假設你真的得到機器的相似分數
: 大家說的像 相似
: 通常指的是人類知覺上的相似
: 因此若兩個相似的人
: 機器如果判斷為相似
: 也只能說 人覺得相似 機器也覺得相似
: 機器如果判斷為不相似
: 也只能說 人覺得相似 但機器覺得不像
: 而不是可以用機器判斷來推論人的知覺
: 機器判斷的邏輯跟人類是差非常多
: 結論
: 1. 根本用錯方法 不能用人臉識別分數推論人臉相似程度
: 2. 就算用對方法 機器覺得像不像不能推論人覺得像不像
我不是機器學習相關領域的,不過我對下面那個confidence score有點興趣,
這東西翻譯好幾種,信心指數,信賴分數,可信度 etc,
但照我的理解,應該是程式對這次判斷結果的自信度,
那意思似乎就會完全顛倒呢...
用第一張圖來看,程式判斷這兩人不同人,但信心指數只有0.1xxx...
那代表程式其實非常不確定,幹意思就是這兩張照片超像的阿!像到程式根本無法確定!
有沒有機器學習領域的版友出來打我臉,解釋一下confidence score真正的涵義,
順便幫大家漲點知識吧。
作者: hollowland (顛倒鐘)   2020-07-09 19:30:00
意思是程式判斷兩人是同一人的信心指數0.1xxx
作者: pony147369 (Ade)   2020-07-09 19:32:00
笑死
作者: SiaSi (夏希亞)   2020-07-09 19:37:00
幫高調這篇
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:37:00
拿同一張照片是結果會是1
作者: SiaSi (夏希亞)   2020-07-09 19:41:00
http://i.imgur.com/XEiwgF8.jpg意思應該是:AI認為兩人不同,但沒什麼信心
作者: REDF (RED)   2020-07-09 19:43:00
預防性 國
作者: hollowland (顛倒鐘)   2020-07-09 19:44:00
比較正確的理解法應該是 信心指數0.1xxx 所以程式表示
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:44:00
作者: aa091811004 (falaw)   2020-07-09 19:45:00
下面的前綴字會改
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:45:00
一樣的話(Same person),可信度100%
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:46:00
他後面的可信度看起來是依前面的那句話來判定可信度
作者: dnek (哪啊哪啊的合氣道)   2020-07-09 19:46:00
笑死,都不曉得該說什麼才好
作者: hollowland (顛倒鐘)   2020-07-09 19:46:00
實際上看那個值就好了
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:47:00
不能只看值了 前面那句話有不同
作者: hollowland (顛倒鐘)   2020-07-09 19:47:00
大概就那個值高於某個程度就會被判定說是同一人
作者: aa091811004 (falaw)   2020-07-09 19:48:00
前綴不同,不能只看值
作者: hollowland (顛倒鐘)   2020-07-09 19:48:00
這種東西如果有第二個判斷值會打出來給你看啦
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:49:00
他那個值不是「相似度」,是「可信度」
作者: aa091811004 (falaw)   2020-07-09 19:49:00
不然就是前面是結果,後面是數值,兩個分開看
作者: hollowland (顛倒鐘)   2020-07-09 19:50:00
應該說數值是結果 前面字句是根據結果做出的解釋
作者: mkcg5825 (比叡我老婆)   2020-07-09 19:52:00
作者: hollowland (顛倒鐘)   2020-07-09 19:54:00
我猜大概是>0.8或是0.7就說same person對於這種工程師寫的字句不要想太多 解釋都是很直接的
作者: JCS15 (馬馬狗)   2020-07-09 19:59:00
前面結論會有肯定或否定 後面只是秀數值給你看
作者: hsiehfat (Okami)   2020-07-09 20:12:00
那下面就直接寫Similarity就好啦,為什麼要寫confidence 呢?
作者: shadow0326 (非議)   2020-07-09 20:14:00
因為不是相似度
作者: leilo (Lei)   2020-07-09 20:17:00
統計…
作者: aaaaooo (路過鄉民)   2020-07-09 20:18:00
電腦的辨識就是抓幾個地方做特徵比對 那個相似度其實不過只是代表電腦覺得有幾個地方一樣而已
作者: owlman (★~Born To Be Epic~★)   2020-07-09 20:19:00
所以結論就是國爆了 AI不確定是不是不同人
作者: leilo (Lei)   2020-07-09 20:21:00
實際上來說 所謂的大數據分析也就是統計的延伸經由大量的資料計算後 所分析出可能性的高與低但本質上依舊是機率統計的概念 機率高不代表就是正確 只是正確的可能性高 反之亦然
作者: REDF (RED)   2020-07-09 20:23:00
辣個 有沒有比較完整的結論惹
作者: leilo (Lei)   2020-07-09 20:26:00
但就算樣本(資料量)再大也不能夠完全體現母體 所以他不是實際發生的機率而是 我們推測他符合正確的機率所以不能夠用相似度準確率 而是有多少信心認為符合真實情況
作者: tmpss90187 (poikuma)   2020-07-09 20:39:00
https://i.imgur.com/4Z82PSL.jpg這樣算是幫三胖驗明正身了嗎?其實原本想比看看槍間老母的但不給辨識
作者: htps0763 (Fish~月~)   2020-07-09 21:05:00
所以為什麼不去看微軟提供的定義,自己在那邊猜
作者: AMTS   2020-07-09 21:06:00
以這個例子如果題目改成從數個目標中選一個 那儘管目標中沒有正確答案 還是有可能出現很高的信心值 因為最後他所有選項的加總會是1
作者: applerev (水軍)   2020-07-09 21:07:00
給的這個已經是信心值最高的結果了 換句話說 判斷是同個人的信心指數比0.1xxx還更低
作者: kula0000 (庫醬)   2020-07-09 21:08:00
文組?
作者: applerev (水軍)   2020-07-09 21:11:00
再換句話 也就是兩張照片擷取的特徵比對有大多數都沒辦法給出高信心的"是"或"不是" 那就跟兩張照片很像沒什麼兩樣
作者: DendiQ (貔貅)   2020-07-09 21:51:00
為什麼不看文件... https://tinyurl.com/yakj2sb6tinyurl 縮不好... https://bit.ly/2Dnc3Vr
作者: played (player-)   2020-07-10 03:31:00
通常這種類似分類的神經網路最後一層都是接Softmax,把神經網路的輸出轉成機率,就會變成[0.9,0.1]這種的輸出,可能前面的值為這兩個人是同一人的可能性,然後後者相反(這看你怎麼label資料),所以這裡confidence應該是指神經網路認為這兩個人是同一人的可能性的意思。

Links booklink

Contact Us: admin [ a t ] ucptt.com