Re: [新聞] 柯P「開放政府」大檢驗 學界:多數資料品

作者: TYC2000 (豆沙包)   2017-12-30 18:21:50
有需求自然會有人去要求開放
在原文中的學者統計開放文件的特性時
不曉得有無考慮什麼樣的資料是民眾最需要的
如說把民眾對資料的需求也分五級
然後去檢視柯市府開放的內容是第一級需求居多 還是最末級需求居多
這還比較有意義
就本人不專業的經驗
現在一般社會人最有需求的是 地產實價登錄
對有置產購屋需求的中產階級 即便沒有 API
至少還有 XML CSV 可以載下來處理
因為這資訊變動沒那麼快
沒有API影響並不大
初步只要做到三星級就促促有餘了
做到四五星可以很久之後再做 根本不急
所以結論是這篇報導 一開始便把評價開放資料的量化標準設歪了
然後用錯誤的前提來推論開放的品質
是廢文一篇
※ 引述《liquidbox (樹枝擺擺)》之銘言:
: : 1★ 採用開放授權,讓手上的資料(任何資料格式)可以在網路上取得
: :   比方說pdf、圖片檔img等等
: :   機器可讀性幾乎是零,只能看不能夠得到數據檔
: : 2★ 讓這份資料能以結構化的方式取得(例如用 Excel 取代掃描的表格)
: :   這就是常見的office,機器可以讀內容,但需要特定的軟體開啟
: 結構化更重要是要把資料轉成起碼是key-value的形式
: 政府很多開放資料雖然近年已在檔案格式上都做到三星,
: 但一打開來其實只有一星,因為裡面根本只是開放格式版的PDF,
: 例如下載了ODS,結果打開來一堆合併儲存格、排版用的spacing、縮排、空列空欄等
: 舊一點的資料裡面可能還有從別的軟體轉檔過程中產生的髒東西
: 在真正開始分析資料以前,大概有80%的時間都用在ETL
: 如果是一般公務單位提供的資料是如此就算了
: 即使中央或地方的主計單位,也幾乎都是提供這類非結構化資料
: 不是沒有官方數據已經做成key-value,
: 但最重要、最完整的,幾乎都還是各種假開放格式、真pdf的東西
: 在我看來,政府的開放資料有95%都只有一星
: : 3★ 使用開放格式取代專屬格式(例如用 CSV 取代 Excel)
: :   大家看到範例csv,其實剛剛提到的json、xml等等常用格式也是
: :   很多網站或app能夠直接吃,就可以顯示數據的圖表或分布
: :   這樣就是三星等
作者: joe10337 (Dashu知道他不會是一個?2)   2017-12-30 18:22:00
王彥喬專寫廢文報導
作者: rabbit83035 (遠野妖怪前綫)   2017-12-30 18:23:00
導向給的都是爛貨這個結論就對了
作者: Tiphareth (Duchess)   2017-12-30 18:26:00
一般人對星級的認知是秘密程度 沒細想釐清資料的星級指的不是這個....加上亂引導看得人也沒用腦就被引導成功了
作者: MCSTRADALE (MaseratiMCstradale)   2017-12-30 18:28:00
作者: guast   2017-12-30 18:29:00
謗柯者死!
作者: devidevi (蜜蜜)   2017-12-30 18:30:00
反正一般民眾看不懂,只會看結論,結論就是達不到5星
作者: taikonkimo (太公)   2017-12-30 19:39:00
重點不是所有資料都需要達到很高星級 最高的甚至找不到實例

Links booklink

Contact Us: admin [ a t ] ucptt.com