Re: [討論] 如果這樣子呢?

作者: morris64 (morris)   2004-12-01 21:43:46
- 帳號刪除機制由 3 個月減為 2 個月
- 30 分鐘掛站踢人
- 檢討 VIP 政策
- 帳號註冊改為總量管制: 總硬碟容量, 或總註冊量管制
- BBS 上線總量管制
最重要的是, 未來一個月, 應該暫停註冊, 並增加掛站踢人設計, 以進行大修!
(這些 constraint 在大修過後, 視狀況可再重新開啟)
我們持的理由如下:
前面站長提到, 每天申請帳號 1700, 刪除帳號 700, 每個帳號平均使用 20 MB
若一個月停止註冊, 約可減少 700 * 30 = 21000 個帳號
每天減少 700 * 20MB 約莫 10 GB 硬碟使用空間
現在這麼不穩, 八成是某種內傷
如 帳號, 版面, 相簿, blog 等資料庫有問題,
甚至是更底層的如 filesystem 的 inode 問題
暫停一個月的註冊, 有兩個好處:
一是, 確定不穩定是由 "上線人數太多" 造成, 還是其他原因造成的!
若一個月的停止註冊加上掛站踢人, 還會造成系統不穩,
就代表是內傷, 而不是人數問題!
若從此系統穩定, 才代表跟上線人數有關
二是, 可以利用每天空出的 10 GB 空間,
針對 1/30 的資料庫(帳號/版面/blog/圖片)進行測試工作
測試方法可寫一個程式, 每次取一個帳號, 到他的目錄/資料庫
測試 profile 各項屬性的完整性, 相片檔案格式的正確性,
檔案權限的正確性等
30 天後 (假設每天能檢查 1/30 的資料庫), 整個檔案系統應該都被檢查完畢
也就是剩下的 (沒有處理過的) 檔案 是垃圾, 可以刪除
這個測試目的在於:
a. 我們高度懷疑是否有些帳號 profile 該有的屬性在某次內傷中 lost!
當這些帳號的主人上線時, 或有人查詢他們時, 造成系統不穩
b. 可以刪除不必要的檔案 (例如某些帳號刪除時, 正好遇到當機,
該刪除的沒刪除掉)
若測試結果發現所有帳號相關資料都很完整. 但系統還是天天不穩定
代表著可能存在著更底層的內傷, 像是 inode 有問題, 或是 OS 不適合
此時 30 天過去, 已經能清出 10 * 30 GB 空間, 也好作檔案系統調整動作
最後, 如果既不是資料層內傷, 也不是檔案系統層內傷, 而 30 天內還是當機連連
就意味著是程式層的問題
- 是不是加太多新功能了? 一個一個取消試試看!
- 是不是 db connection 數量過多? 或其他程式上, 如 threads 或 processes 問題?
限制一下測試看看吧!
站長大人也不用太操心交接問題
若系統能調到夠穩的狀態, 交接給誰應該都不是問題!

Links booklink

Contact Us: admin [ a t ] ucptt.com