Re: [問卦] WinRAR不買正式版會怎樣? roger29 PTT批踢踢實業坊

Re: [問卦] WinRAR不買正式版會怎樣?

作者: roger29 (想不到) 2014-06-29 23:46:41

因為壓縮的比例存在著理論上的極限
假如我現在有A B C D 四個符號
要表示成數位資料的話直觀的方法是讓A=00 B=01 C=10 D=11
ASCII code就是類似的7碼等長度編碼方法
不過呢這五個符號出現的機率可能不是一樣的
假設Pr(A)=0.5 Pr(B)=0.2 Pr(C)=0.2 Pr(D)=0.1
那麼用上面直觀的方法編碼
我的codeword平均長度是 0.5*2+0.2*2+0.2*2+0.1*2=2
那麼我們有沒有辦法讓我的平均長度變得更小一點呢(也就是達到所謂的資料壓縮)
有的我們可以善用A B C D四個符號出現機率不相等的特性
A出現的機率最高所以我直觀上希望表示A的二進位長度可以短一點才有效率
D出現的機率最低所以我就會希望表示D的二進位長度可以長一點沒關係
那麼換一個方式表示：A=0 B=10 C=110 D=111
這樣表示的話我新的codeword平均長度就是 0.5*1+0.2*2+0.2*3+0.1*3=1.8
比原本每個符號都用2個bits來表現還要更小
(註：這個編碼方法為著名的Huffman code)
所以我們可以發現如果能善用資料間的相關性
是可以減少用數位來表示這些資料所需要的資料大小
但是當然不可能無限制的縮小
根據偉大的數學家消息理論的開山始祖 Claude Shannon的source coding theorem
簡單來說
給定一個discrete memoryless source S 就像我上面的四個字母
那麼我們能夠達到的平均codeword長度會大於等於S的entropy
S的entropy定義成 n

作者: LIONDODO (LION) 2014-06-29 23:47:00

This is an apple...

作者: SDNS (ここには神さまの殿堂) 2014-06-29 23:48:00

看八卦漲知識

作者: qcuteba 2014-06-29 23:48:00

看無,我只知道要一直按關閉挺麻煩的

作者: liaon98 (liaon98) 2014-06-29 23:49:00

Huffman只是其中一種吧

作者: alog (A肉哥) 2014-06-29 23:49:00

XDDDD...八卦優質認真文不給你推不行雖然很快又被洗掉了

作者: tigertiger (虎虎) 2014-06-29 23:50:00

稱呼Shannon數學家? 跟稱呼科P是醫師一樣不尊敬

作者: daxer (德德) 2014-06-29 23:50:00

要跟著推不然別人會以為我看不懂

作者: snowcoat (excess) 2014-06-29 23:50:00

八卦版優文...

作者: wa007123456 (大笨羊) 2014-06-29 23:51:00

她是講 00 01 10 11 這四種段碼出現的機率整合

作者: NoWashing (你好~ 我叫免洗！) 2014-06-29 23:51:00

這麼專業怎麼不聊聊超強的圓周率壓縮演算法勒 XDDD

作者: goshfju (Cola) 2014-06-29 23:51:00

我是不是來錯板

作者: john2557 (Wanger) 2014-06-29 23:51:00

精彩

作者: searoar (æš—å‘å¤§è±†) 2014-06-29 23:52:00

知識

作者: HvvH (HH) 2014-06-29 23:52:00

推

作者: tigertiger (虎虎) 2014-06-29 23:52:00

到底哪裡專業了阿? 一個叫Shannon數學家的人專業在哪?八卦板怎麼了?

作者: alog (A肉哥) 2014-06-29 23:54:00

Claude Elwood Shannon --> American mathematician,

作者: BBBroflovski (我大大在褲褲上了) 2014-06-29 23:54:00

看不懂 Orz

作者: wa007123456 (大笨羊) 2014-06-29 23:54:00

克勞德·夏農沒錯阿他也是一位數學家

作者: orz811017 (orz811017) 2014-06-29 23:54:00

推演算法

作者: CCPenis (匚匚屌) 2014-06-29 23:54:00

講中文好嗎

作者: s9007555 (我想吃地瓜) 2014-06-29 23:54:00

文組崩潰

作者: tigertiger (虎虎) 2014-06-29 23:55:00

不尊敬阿就像你會叫陳水扁律師嗎?

作者: zz7856132 (雷姆豬) 2014-06-29 23:55:00

快推不然人家以為我們看不懂

作者: s0857168 (愛乘歐妹咖) 2014-06-29 23:55:00

略懂

作者: liaon98 (liaon98) 2014-06-29 23:55:00

簡單來說你一篇文章最常出現的字叫他為a 不常出現的字

作者: liaon98 (liaon98) 2014-06-29 23:56:00

你就把它改成叫長的字這樣文章就會變短

作者: LoveMoon (我不是魔獸三國作者.....) 2014-06-29 23:56:00

嗯嗯跟我了解的差不多推專業

作者: wind137 (布穀密語) 2014-06-29 23:56:00

幹這通訊系統好懷念

作者: DEATHX (幽光) 2014-06-29 23:56:00

優質文，這種都該入精華區，誰還有上次RSA解說文的備份？

作者: liaon98 (liaon98) 2014-06-29 23:57:00

然後少用的字筆畫多一點這樣整體你會寫比較少畫

作者: JCS15 (馬馬狗) 2014-06-29 23:57:00

我把我壓縮輕輕把你也壓縮

作者: drkkimo (花貓~ 努力工作) 2014-06-29 23:57:00

霍夫曼編碼不是很基本的嗎有什麼好特別專業?

作者: sef96121 2014-06-29 23:59:00

只能朝拜了！

作者: NDSLite (Matrix in 臥虎藏龍) 2014-06-30 00:01:00

優文

作者: liar5566 (我只是她的寢具) 2014-06-30 00:01:00

不錯，實力跟我相當

作者: alog (A肉哥) 2014-06-30 00:01:00

XDDD陰森宅宅是沙小la

作者: tigertiger (虎虎) 2014-06-30 00:01:00

什麼工程師起碼也是數位教父好嗎沒他哪來的0101交換電路

作者: lolic (lolic) 2014-06-30 00:02:00

嗯摁我也這樣想可惜打到一半你先發文了

作者: ppt0726 (ppt0726) 2014-06-30 00:03:00

一優質文章

作者: cybergenie ((不要看這裏)) 2014-06-30 00:04:00

推 Shannon

作者: kissyourbi (操屄跑車↗★) 2014-06-30 00:10:00

通訊系統最簡單的章節也可以拿來炫XD三大公式 H(s) 互消息審農第三定律背起來 100分連理解都不用理解國中數學秒殺 ZZZzzz

作者: withfrog () () 2014-06-30 00:12:00

長知識謝啦

作者: QueenYi (Queen一定是女的?) 2014-06-30 00:15:00

長知識推

作者: wa007123456 (大笨羊) 2014-06-30 00:15:00

真的不專業就不要貼了

作者: dgmnewlife (你家爆炸我沒有哭) 2014-06-30 00:15:00

看不出來在炫阿... 不就是分享兒已@@

作者: awen860836 (葛瑞森) 2014-06-30 00:21:00

通原讀得不錯喔

作者: zyyym (無聊的人G) 2014-06-30 00:22:00

研究所畢業後都忘光了

作者: kissyourbi (操屄跑車↗★) 2014-06-30 00:26:00

這章節我大概半小時就融會貫通了比你打文章還快

作者: euripides31s (新參者) 2014-06-30 00:31:00

推

作者: chen20 (sOnE) 2014-06-30 00:32:00

分享推!是在悲憤什麼

作者: shinwind (風) 2014-06-30 00:58:00

某k是在悲憤什麼XDDD 只是分享又沒踐踏你的專業看不過去你也分享一拼阿

作者: evening (小夜) 2014-06-30 01:14:00

推

作者: nadekowang (庫特わふ) 2014-06-30 01:20:00

推文組不懂

作者: YuenYang5566 2014-06-30 01:37:00

所以你想表達什麼?你很厲害??

作者: amsonmoon (月光貓) 2014-06-30 01:44:00

他想解釋為什麼50mb只能壓成48.9mb這種情形啊就有人問咩

作者: aspd5306 (Cereal) 2014-06-30 01:47:00

哥的老闆專攻消息理論原po說的東西大概大二大三等級的

作者: hitman0527 (990) 2014-06-30 01:55:00

推

作者: gh26300 (尼安德塔人) 2014-06-30 02:15:00

不知道噓的在悲憤什麼……他又沒炫耀

作者: k268185 (k268185) 2014-06-30 02:26:00

霍夫曼這演算法真的簡單又強大

作者: ispy03532003 (臭酸肥它) 2014-06-30 02:34:00

推阿

作者: Orzleader (大雄) 2014-06-30 03:03:00

分開看得懂合起來看不懂

作者: a055076 (Dilemma) 2014-06-30 03:14:00

看到這篇想起一個字熵

作者: xdctjh (凍頂) 2014-06-30 03:16:00

讚

作者: a055076 (Dilemma) 2014-06-30 03:17:00

通道編碼好懷念的東西

繼續閱讀

Re: [新聞] 港府遣返陳為廷　陸委會：遺憾qaz786397 Re: [問卦] 為什麼中國不先光復蒙古？wa007123456 [新聞] 聲援香港「佔中」中國網友發起「七一佔a126sam01 [爆卦] 近79萬人參與佔中公投HKMIMI [新聞] 世足賽／希臘球員不要獎金　聯署希望總iam168888888 [問卦] 土城tingchen1991 [問卦] 有沒有young guns不畫了的八卦？jackyiou Re: [問卦] 為什麼中國不先光復蒙古？gs1 Re: [新聞] 20萬資深公僕領65億不休假獎金whiteD [新聞] 登革熱一年千例評估疫苗效益pinwheel1017