※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言:
: 那一般被創造出來的動漫腳色,甚至動漫作品,
: 如何判別或者感覺她已經過氣了呢?
: 討論程度是一個指標,
: 周邊商品的數量也是一個指標
: 還有其他指標嗎?
其實有一個方法可以快速辨別熱門程度的指標
就是把它輸入到Google搜尋趨勢(Google Trends)
https://www.google.com/trends
例如輸入 進擊的巨人 後
它會呈現近年的搜尋熱門趨勢(最高數值會被設為100)
http://i.imgur.com/JVbuzmA.png
可以看到它剛開始有一個急遽竄紅的時期,過了高峰後就會開始衰減
於是現在我們可以問:
能不能透過搜尋趨勢的曲線,來認定它是不是過氣的作品?
以及,我們要怎麼量化一個作品的過氣程度呢?
一般我們對過氣的定義是,當初全盛期的熱潮,現今已不復存在
所以最「理想」的過氣情況,就是當初急遽竄紅,然後人氣又快速衰減
最好到最後大家都如同失憶一般,紛紛吐出「OO…是誰?」這樣的情況
好,那有甚麼適合的曲線方程式可以描述這樣的趨勢呢?
有的,我們有 馬克士威-波茲曼分布(Maxwell–Boltzmann distribution)
http://i.imgur.com/CFAN5Km.gif
它的方程式寫為
http://i.imgur.com/PrDpCbE.png
波茲曼分布是用來描述理想氣體的速率分佈的曲線
它描述某個溫度下,一個盒子內的氣體在各種速度下所佔有的粒子數量
它成功地解釋了許多基本的氣體性質
撇去推導過程不說,這邊先只對它的公式做一些定性上的說明
大家可以看到,每條曲線從原點開始,粒子數目會隨著速率增加
這表示當你速率越大,你可以做出的動作越多(有更多方向的選擇)
所以橫軸上的速率越高,這個速率所"提到"的粒子數也就越多
但接著,後面是個快速衰減的曲線
原因是在統計學上,粒子被分配到高能量的機率很低
據分析,它是一個指數衰減─沒有人能抵得過指數衰減的壓制
因此圖形畫起來就像是偏向左邊集中的鐘形曲線了
值得一提的是,根據方程式的結果
當溫度提高時,整體分佈會向右平移而壓扁(紅曲線)
溫度變低時,分佈會向左集中而變得尖銳(青曲線)
看起來有點像熱門程度變化的趨勢曲線
作為比較,如果把橫軸換成時間軸,縱軸換成熱門指數
那麼氣體分子因速度增加而提升了運動的可能性
就類比於作品熱度經一段時間散播名氣而竄紅
而氣體分子因能量分佈而造成高能量粒子數有明顯的指數衰減現象
類比於長時間下,作品熱潮的退去,考驗著一個作品能不能夠久存於人心的實力
這樣看來,波茲曼分布的確是個非常適合描述熱門趨勢的曲線模型
(需要特別注意的是,Google Trends顯示的是關鍵字搜尋熱度,並非直接顯示粉絲的比例
,或到達多"鐵粉"的程度。但紛絲在一定程度上都有推廣的作用,間接引發搜尋熱度,這
同時也和”有沒有常常提到或聽到這個作品”的「過氣程度」有意義上的直接關係)
根據這樣的啟發,我們可以設計一個方程式來做data fitting
也就是模仿波茲曼分布的公式:
http://i.imgur.com/PkU4q2R.png
其中a是竄紅指數,b就是過氣指數,A僅是作為幅度的調整
(※時間統一以月為單位)
而關於調整offset的c值,可以取未竄紅前的關鍵字平均熱門程度
或者是參考作品發售的時間點取值,也可以取最靠近高峰值的前一個極值
三種取法的c值通常都會很接近,但也有例外
例如動畫化後才大紅的作品,就不適合拿輕小說的發售時間作為參考點(data fitting也
容易出現錯誤)
事不宜遲,我們先拿《神魔之塔》作為關鍵字來試水溫
http://i.imgur.com/VUThHma.png
http://i.imgur.com/MF7XVEm.png
(藍線為原始資料,綠線為fitting曲線)
經data fitting後
得到《神魔之塔》竄紅指數為0.95853676
過氣指數為0.00411
以其他同類型的資料來說,算是比較不過氣的遊戲
第二個實驗品是《開心農場》
http://i.imgur.com/rxcGIpj.png
http://i.imgur.com/WXW9cvk.png
竄紅指數2.25962323
過氣指數0.0333251
幾乎是《神魔》過氣指數10倍
其實想想也蠻正常的
我還記得開心農場上的植物由於多年沒有照料
在很久以前早就過了生氣,繁榮不在了
確認模型可使用後,當然就是開始大量的找關鍵字了
搜尋了一下版上曾經被質疑是否過氣的角色和作品
http://i.imgur.com/tU7Nzun.png
瀏覽了一些文章,找了約十幾個作品和角色的關鍵字
也參雜一些可能不過氣的角色或遊戲來做比較
下面是fitting圖,得到的數值結果將會於稍後發表
http://i.imgur.com/Z7ER81A.png
http://i.imgur.com/xvMSMeS.png
有一點必須提到的是
我在搜尋「poi」的搜尋趨勢時,結果和預期的完全不同
http://i.imgur.com/WyuUcOW.png
估狗了一下,原來poi可以是指Apache POI,一種開放源碼函式庫
為了避免用詞的混淆,將地區縮限為台灣:
http://i.imgur.com/LBoVnHR.png
可以看到peak已經很明顯被過濾出來了
雖然整體仍然提高了一個平台,但是這可以透過調整offset去除掉
其他碰到類似情況的關鍵字也可以能透過縮限地區、增加輔助關鍵字或者是指定搜尋類別
來解決
(p.s.過濾姆咪這個詞我已經放棄了XD)
另外也想嘗試在過程中盡可能找出大起大落的關鍵字(非角色或作品)
想到當時很紅的「淡定紅茶」(2012年5月)
http://i.imgur.com/3mxP9Hc.png
以及跨年活動(2015)
http://i.imgur.com/U7uyqGT.png
「跨年」的熱門程度甚至連長尾效應都非常小…
說得也是,如果到現在10月了你還說你要跨年到2016
不僅過氣,別人還會以為你腦袋的運作上有困難
「淡定紅茶」和「跨年」的計算也會於併入發表結果
於是,終於來到了結果發表時間!(登登~
==================================================
[對象] [使用關鍵字] [地區] [過氣指數]
夏娜 夏娜 台灣 0.000216
minecraft minecraft 全球 0.000232
K-ON K-ON 台灣 0.000241
LoveLive LoveLive 台灣 0.000986
神魔之塔 神魔之塔 台灣 0.00411
pokemon pokemon 全球 0.0296
開心農場 開心農場 台灣 0.0333
海老名 海老名 菜々 全球 0.061
雷姆(re0) 雷姆 台灣 0.067
乳繩 乳繩 台灣 0.0771
鬥陣特攻 Overwatch 全球 0.0932
小埋 小埋+土間埋 台灣 0.107
鬥陣特攻 鬥陣特攻 台灣 0.162
pokemon pokemon+寶可夢 台灣 0.193
無名(甲鐵城) 無名 甲鐵城 台灣 0.203
淡定紅茶 淡定紅茶 台灣 0.211
poi poi 台灣 0.5
跨年(2015) 跨年 台灣 1.452
==================================================
搜尋地區多以台灣的為準
目的是為了讓結果更貼近洽眾的感受
以ACG的角度來看,目前過氣指數最高的角色是甲鐵城的無名
最過氣的用詞是poi (不視為角色是因為口頭禪的用法比指夕立本身的情況還要多)
這個結果倒蠻驚訝的
搞不好是因為poi的語意不定,所以更適合只在動畫上映期間跟風使用吧?
大量poi的留言也會讓不懂的人去搜尋這個鬼玩意XD
而跨年的過氣指數已經高到跨越世界線了
不過離下次的跨年也不遠了,大家用愉快的心情迎接吧
※附記:
藝人或者偶像等似乎不適合套用在這個模型
藝人的熱門趨勢通常是後面一連好幾個peak,增減不一
不過同時也產生了一個新的疑問:
當一個疑似過氣的藝人因後來某些事件而增加搜尋量時
他還算是過氣嗎? 這個就很難說清了
而同樣生為偶像且常被質疑是否過氣的初音未來
其趨勢圖如下
http://i.imgur.com/RwLia8u.png
由於V家可以延伸的領域範圍很廣
所以沒有明顯衰減的曲線也不適合套入該模型使用
至少可以確定還沒到達過氣的程度
其他無法套用公式的例子:
◎Elsa (階段式的走紅)
結論:不過氣
http://i.imgur.com/k5mo15C.png
◎PPAP (現正當紅)
結論:待觀察
http://i.imgur.com/elVbNvs.png
以上就是我的分析結果
謝謝大家的觀賞~~