作者:
chang0206 (Eric Chang)
2019-06-10 11:08:31大概快一年前,那時候進了一批ADATA + SP 這兩個廠牌的480G SSD
把還沒用SSD的伺服器都改成用這批SSD做系統碟(mdadm software raid 1)
前陣子,機器陸續回報smart error
好巧不巧的,同一批換上去的,都只有ADATA的SSD報錯
趁著還在保固內,趕快換一換。
於是就把手邊備用的換上去,raid rebuild之後,就跑RMA了
RMA來回大概要兩週左右的時間,我換了三顆
收到返修品後,一樣都是把原先備用的SSD拆掉,然後把返修品上架
這大概是五月底,六月初的事
然後今天進公司收信,又是一堆smart error的通知信件
換上去的三顆,又有兩顆掛點了
想說這頻率也太高,會不會是機器本身有問題?
可是備用的換上去大概兩週,都沒出現錯誤呀?
先把SSD抽下來,再把備用的換上去
然後把抽下來的SSD拿去別台,用外接的方式測試看看
很好,找不到...應該說一開始有找到,但是過一陣子會離線
[1821138.899521] usb 2-1: new SuperSpeed USB device number 5 using xhci_hcd
[1821138.921244] usb 2-1: New USB device found, idVendor=2109, idProduct=0715
[1821138.921253] usb 2-1: New USB device strings: Mfr=1, Product=2
[1821138.921260] usb 2-1: Product: 30848
[1821138.921265] usb 2-1: Manufacturer: Ugreen
[1821138.921270] usb 2-1: SerialNumber: 0000001111111
[1821138.924460] scsi host8: uas
[1821159.868209] scsi 8:0:0:0: tag#0 uas_eh_abort_handler 0 uas-tag 1 inflight: CMD IN
[1821159.868221] scsi 8:0:0:0: tag#0 CDB: Inquiry 12 00 00 00 24 00
[1821159.868395] scsi host8: uas_eh_bus_reset_handler start
[1821160.240533] usb 2-1: reset SuperSpeed USB device number 5 using xhci_hcd
[1821160.262437] scsi host8: uas_eh_bus_reset_handler success
[1821160.264258] scsi 8:0:0:0: tag#0 uas_eh_abort_handler 0 uas-tag 1 inflight: CMD
[1821160.264270] scsi 8:0:0:0: tag#0 CDB: Test Unit Ready 00 00 00 00 00 00
[1821160.264278] scsi host8: uas_eh_bus_reset_handler start usb 2-1: reset SuperSpeed USB device number 5 using xhci_hcd
[1821160.658764] scsi host8: uas_eh_bus_reset_handler success
[1821160.658778] scsi 8:0:0:0: Device offlined - not ready after error recovery
[1821521.833782] usb 2-1: USB disconnect, device number 5
好吧,可能是我的USB外接盒有問題?
改接主板上的SATA,這下更妙,在BIOS內就直接看不到了...
兩顆的狀況都一樣,只好繼續跑RMA ..
等看看有沒有特價,用intel 545s換掉這一批ADATA的產品
再拿去LAB跑10G LAB 操看看
是說我真的不覺得是loading太高的影響,這幾台系統平常根本就沒啥disk I/O
可能就真的是我們的環境跟 adata犯沖吧