Опыт удаленной конфигурации RAID массива
Есть у нас сервер HP ProLiant DL380. Дисковый массив: RAID-1 (система) из 2-х и RAID-5 (данные) из 4-х винтов. И вот однажды вылетел винт с массива RAID-5. Ничего не пропало, но... Новый такой винт стоит многа денех (SCSI нынче не в моде). Делюсь опытом. Дальше - интересней )
Было принято решение винт не покупать, а массив пересобрать в зеркало. Тоесть, в результате должны получить массив: RAID-1 (система) из 2-х, RAID-1 (данные) из 2-х винтов и 1 винт на hotspare. При такой реализации получаем в 2,6 раза меньше места. Это для нас не страшно - основное место гуляло и данные расти не собираются.
Подготовка
На разделе с RAID-5 хранятся базы MS SQL Server и несколько папок данных. Общий объем около 200 Гб. Это добро нужно забэкапить, массив разломать, собрать новый RAID-1 и восстановить инфу. Чтобы не перегружать сеть большим трафиком, подключаю USB винт на 200 Гб для архивных копий. Бэкапить буду утилиткой Drive SnapShot. Она делает образ раздела, работает без установки и не требует перезагрузки.
Перестроить RAID - дело небыстрое, а простой сервера в рабочее время недопустимо. Поэтому планирую делать на выходных и дома. На всякий пожарный подключаю iLO интерфейс к коммутатору и переписываю логин/пароль, может пригодится. На этом подготовка закончена.
Реализация
Первые грабли - бортовой контроллер не поддерживает технологию hotspare. Решаю реализовать hotspare вручную: винт лежит на полочке, в случае выхода из строя руками меняем. Тем более что таких серверов у нас немало, и винт заменить мы сможем на любом из них.
Подключился по VPN, зашел терминально на сервер, остановил службы MS SQL. Теперь можно и бэкапить раздел. Запустил SnapShot и пошел гулять. Через несколько часов проверяю бэкап - вроде выполнился, но не открывается (в SnapShot-е есть возможность примонтировать снятый образ). Решаю переделать бэкап, запустив SnapShot консольно:
snapshot.exe F: G:\sh05\%computername%_f.sna -t > G:\sh05\%computername%_f.log
Перевод вывода в файл позволит логировать процесс бэкапа. И снова гулять на несколько часов. На этот раз и лог показал "Success!" и образ примонтировался.
Переделываем RAID
С помощью HP Array Configuration Utility удаляю массив (Delete Array) из 4-х и создаю массив (Create Array) из 2-х винтов. Создаю логический диск в RAID-1, жму ок - раздел создан. Форматирую по-быстрому его в NTFS. Восстановить - а не все так просто... Оказывается что SnapShot, создав бэкап раздела в 800 Гб, не хочет восстанавливать его на раздел в 300 Гб, хотя данных и не много. Я такого, честно, не ожидал. Но есть выход. Монтирую бэкап как раздел и копированием переношу данные. Копировал программой Total Commander (с опцией Copy NTFS permissions), и не зря - не скопировались файлы одной "старой" базы (проводник в таком случае обрывает копирование). Процесс восстановления затянулся (много файлов), но успешно завершился (не считая "старой" базы, а она оказалась и не нужна). При этом восстановились разрешения и "шары" папок.
Решаем проблемы
Доволен результатом, решаю перезагрузить сервер и...
...сервер не поднимается. Вот и понадобился iLO. Из браузера подключаюсь к серверу на iLO, запускаю Remote Console и вижу, что сервер загружается с диска Smart Start, "любезно" оставленного коллегой в приводе. После получасовых манипуляций и многократных перезагрузок удается сменить приоритет загрузки на рейд-контроллер. Проблема возникла из-за того, что сервер увидел загрузочный диск и USB-девайс. Да и еще в BIOS заходить через Ctrl-S не сразу догадался )
В результате таки поднялся сервер, винда загрузилась и все сервисы стартонули нормально.
Вывод
- SnapShot классный для образов дисков, но в моем случае достаточно было и ntbackup-а
- Когда планируешь удаленно ребутать сервер ОБЯЗАТЕЛЬНО проверить CD-ROM на предмет "лишних" дисков
- Если есть возможность использовать iLO или IP-KVM - используй )
Post new comment