[閒聊] Neuro真的有辦法做到理解圖像嗎

作者: et310   2023-12-31 12:51:58
是這樣啦
Neuro現在似乎能做到閱讀聊天室訊息了
但Neuro理解圖像的部分是不是還不太行啊
看她(它?)玩看街景猜地方的時候還好
至少還能說中8成
可是玩拆炸彈的時候就很慘了
很難做到把說明跟Vedal的敘述還有圖像做連結
這是不是表示AI要做到理解圖像
甚至跟人說的話做結合是一件極其困難的事?
話說早上打開圖奇台
快9000人看Evil Neuro到底是三小啦
Neuro可愛
作者: attacksoil (擊壤)   2023-12-31 12:54:00
CV(視覺)和NLP(語言)是不同模型 CV可能是用BLIP之類的圖像轉語言模型
作者: hhpsjoe (Chia)   2023-12-31 12:54:00
要給她吃餅乾
作者: kohanchen (kohanchen)   2023-12-31 12:54:00
我覺得理解方式跟人類不同,也許是先用圖像辨識AI把照片轉譯成文字,然後Neuro才去解讀
作者: Antihuman   2023-12-31 12:55:00
去看neuro評論電腦桌那一集,圖片辨識和吐槽都很頂
作者: gino0717 (gino0717)   2023-12-31 12:56:00
可以 transformer模型無所不能
作者: Antihuman   2023-12-31 12:57:00
作者: wsdykssj (arj)   2023-12-31 12:58:00
Vedal一直都有不明確的說neuro是要付錢的,大概街景丟gpt-4 api辨識,拆彈才是他自己寫的
作者: Erichikaunkr (兩百四)   2023-12-31 12:59:00
他的AI不知道是自己組的架構還是用現有API
作者: wsdykssj (arj)   2023-12-31 13:00:00
拆彈根本不用辨識圖片,neuro是讀手冊的那一方
作者: Antihuman   2023-12-31 13:00:00
我覺得她不是不會玩只是聽不懂Vedal描述的符號
作者: loltrg42972 (Rui)   2023-12-31 13:03:00
拆彈跟辨識圖片無關阿 而且辨識圖片很久以前OK了你去查neuro評論觀眾電腦桌跟感恩節大餐的片段neuro能夠很清楚的辨識圖片還能做出毒舌評論
作者: Antihuman   2023-12-31 13:08:00
但她認不出自己的fumo
作者: ryoma1 (熱血小豪)   2023-12-31 13:08:00
去Amazon買東西時,她也能瞬間辨識出網頁上的資訊
作者: King5566 (王者56)   2023-12-31 13:09:00
幹死牛肉
作者: loltrg42972 (Rui)   2023-12-31 13:17:00
而且neuro之前已經成功拆彈過了 用餅乾誘惑
作者: gino9955 (臨江)   2023-12-31 13:24:00
拆彈的問題一直都是理解人類描述符號的問題
作者: S404NotFound (silence)   2023-12-31 13:25:00
ai要做到不難,一些大公司的模型都有一定能力,但neuro是vedal在搞而已
作者: a122771723 (小笨龍)   2023-12-31 13:26:00
她搞事才能讓vedal被電 更前面還有給他餅乾就給答案的
作者: zeyoshi (日陽旭)   2023-12-31 13:29:00
neuro得先聽懂vedal的圖片說明 然後搜一遍自己資料庫可能的圖片 再去比對說明書的圖案在回饋成文字給vedal
作者: loltrg42972 (Rui)   2023-12-31 13:32:00
這跟什麼大公司倒是完全無關 因為已經成功過了
作者: jay920314 (Jay_9696)   2023-12-31 13:36:00
你去看近期的房間review,很厲害
作者: tsai1453 (tsai)   2023-12-31 13:40:00
拆彈那個遊戲Neuro那一邊是看不到炸彈的吧?
作者: lsd25968 (cookie)   2023-12-31 13:43:00
可以 烏龜如果去研究transformer就沒問題了 反正cv跟NLP遲早要被這東西統一
作者: chenyeart (阿泰)   2023-12-31 13:46:00
拆炸彈她錯誤多到我覺得是故意的,讀文字應該難不倒她
作者: henry1234562 (亨利二十三)   2023-12-31 14:06:00
拆炸彈主要有問題的是 要將聽到的文字轉換成圖片
作者: j022015 ( ˊ ﹀ˋ)   2023-12-31 14:15:00
圖像辨認不是有九種方式
作者: Livin (SeaBiscuit)   2023-12-31 14:52:00
我覺得是拆彈的文字描述很難想象,然後描述出來跟說明書上的讓牛肉理解後未必一致產生的
作者: wei115 (ㄎㄎ)   2023-12-31 14:57:00
沒錯transformer就是無所不能的
作者: FXW11314 (soukai)   2023-12-31 15:13:00
Multimodal learning,已經有了只是玩不起
作者: P2 (P2)   2023-12-31 15:25:00
可是Amazon都有商品的文字說明吧
作者: mc3308321 (阿阿阿阿)   2023-12-31 16:58:00
拆彈的話,烏龜有說特殊符號比較弱。其他應該是在調教人類

Links booklink

Contact Us: admin [ a t ] ucptt.com