Misteri kesalahan disk

Dengan Robin Harris | Maret 10, 2010, 05:28 PST

Rangkuman: Anda akan berpikir bahwa setelah 50 tahun dan miliaran dijual, disk drive akan dipahami dengan baik. Dan Anda akan salah. Ambil kasus kesalahan sektor laten.

Anda akan berpikir bahwa setelah 50 tahun dan miliaran dijual, disk drive akan dipahami dengan baik. Dan Anda akan salah. Ambil kasus dari luar jalur kesalahan.
Berkat sedikit dikategorikan merekam kepadatan sedikit setiap lagu secara umum konstan di seluruh disk. Tapi lebih banyak kesalahan terjadi pada track yang lebih luar - dan di beberapa drive di trek batin juga. Apa yang bisa terjadi?
Kesalahan sektor laten (LSE) adalah kesalahan yang tidak terdeteksi sampai Anda mencoba untuk membaca data dan kemudian drive mengatakan "ups!" Dalam studi penting Analisis Kesalahan Sektor Laten di Disk Drives (pdf), peneliti menemukan bahwa 8,5% dari semua disk nearline seperti yang kebanyakan dari kita pengguna konsumen dipengaruhi oleh kesalahan sektor laten.
Jika, seperti saya, Anda menggunakan lebih dari 10 drive, Anda mungkin memiliki drive dengan LSE. Mungkin bahkan dua. Dan jika drive memiliki 1 LSE, jauh lebih mungkin untuk memiliki orang lain.
Dalam menyelam
Dalam analisis lebih dalam dari data yang sama, kesalahan laten Memahami sektor dan bagaimana melindungi terhadap mereka peneliti menemukan anomali yang menarik:

Bagian pertama dari drive menunjukkan konsentrasi yang jelas lebih tinggi dari kesalahan dari sisa drive. Tergantung pada model, antara 20% dan 50% dari semua kesalahan terletak dalam 10% pertama dari ruang sektor logis drive. Begitu pula untuk beberapa model akhir drive memiliki konsentrasi yang lebih tinggi.

Berikut adalah grafik dari kertas:

Error location on various drive models. Capital letters denote SATA drives, lowercase SAS & FC drives.

Kesalahan lokasi pada model hard berbagai. Huruf besar menunjukkan drive SATA, SAS huruf kecil & FC drive.

Sekarang mengapa demikian?
Dalam Memahami penulis bertanya-tanya:

Kami berspekulasi bidang drive dengan peningkatan konsentrasi kesalahan mungkin adalah daerah yang ada pola penggunaan yang berbeda, misalnya filesystem sering menyimpan metadata pada awal drive.

Kedengarannya masuk akal. Tapi kemudian mereka mencatat:

Secara khusus, penjelasan yang mungkin. . . mungkin bahwa daerah-daerah melihat pemanfaatan yang lebih tinggi. . . . [Tetapi dalam penelitian lain di Google tidak ada] korelasi antara baik nomor dari kali dibaca atau jumlah menulis bahwa drive melihat (seperti dilansir parameter SMART drive) dan jumlah LSEs itu berkembang.

Yang mana yang benar?
Disk drive adalah kotak sibuk. Penjelasan yang mungkin adalah:

Data yang buruk. Mungkin data Google tidak halus cukup untuk melihat beban kerja yang berhubungan LSEs.
Trek luar goyah. Nomor blok rendah biasanya memetakan ke trek luar di mana kecepatan linear adalah tertinggi. Getaran rotasi dapat menyebabkan LSE untuk cluster pada trek luar.
Mulai / berhenti pemintalan drive yang memakai: bantalan dingin; stres bermotor; bahkan mungkin kepala pakai sampai terbang-tinggi tercapai..
Lube migrasi piring-piring Disk. Yang dilumasi agar tetap halus dan untuk meminimalkan keausan. Lapisan ini dapat bermigrasi ke track yang lebih luar dari waktu ke waktu, di mana itu akan meningkatkan ketinggian kepala lalat, membuat bit sulit untuk dibaca.

Bits Penyimpanan mengambil
Saat ini misteri tetap. Tapi implikasi untuk array RAID adalah penting.
Kertas RAID 1988 diasumsikan bahwa kegagalan disk drive dan kesalahan yang tidak berkorelasi. Tapi kita sekarang tahu bahwa tidak benar.
Kegagalan disk cenderung terjadi bersamaan. LSE - yang dapat membunuh RAID 5 pemulihan - juga cenderung mengelompok pada drive tertentu, tempat tertentu pada drive, dan pada waktu tertentu. Kegagalan adalah cara yang lebih berkorelasi bahwa kami menduga 20 tahun lalu.
Desktop beberapa harus menggunakan RAID . Jika Anda menggunakan eksternal SATA RAID 5, pastikan Anda memiliki cadangan dapat diandalkan karena kemungkinan besar Anda akan membutuhkannya. RAID 6 adalah cara untuk pergi ketika menggunakan drive SATA besar.
Disk drive modern adalah perangkat presisi yang luar biasa yang membuat jam tangan Swiss halus terlihat sehalus tambang strip di perbandingan. Namun kita tidak mengerti segala sesuatu tentang mereka.
Kudos untuk perusahaan seperti NetApp yang mendukung penelitian perilaku disk. Seperti lebih data di dunia berada pada disk, penelitian lebih penting ini menjadi.

bayuajisantoso

Pages

Kamis, 31 Mei 2012

Misteri kesalahan disk

Misteri kesalahan disk

0 komentar:

Posting Komentar

Blog Archive

Popular Posts

Mengenai Saya

Blogroll

About

Blogger templates

Blogger news