Всем хайлоада!
Кто не поехал (Москва, Сколково, 7 и 8 ноября -
http://www.highload.ru/) - тот сам виноват.
Пример:
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
1. Велосипед уже изобретен. Что умеют промышленные СХД? Антон Жбанков, Nutanix
2. Мифы о СХД
3. Распространенные мифы • Корпоративные СХД – это очень дорого. Но при этом они не говорят сколько стоит. • Вендоры СХД берут деньги ни за что. • Я на коленке соберу не хуже из «писюков». • СХД – это просто куча дисков. • СХД надо сравнивать по руб/ТБ емкости.
4. Производительность – это МБ/с
5. Ikea Style – не всегда ОК
02.11.11 Недоступность сервиса По версии Селектел – сбой ПО
3.03.12 Недоступность сервиса, даунтайм Проблемы с программной СХД – баг в mdraid
28.03.12 Недоступность сервиса, даунтайм Проблемы с программной СХД – баг в mdraid
04.06.12 Недоступность сервиса Проблемы с программной СХД
17.08.12 Недоступность сервиса, даунтайм Цитата: “Один доблестный сотрудник (с которым будет очень серьёзный разговор) так скоммутировал SAN, что мы два часа разгребали последствия в сетях.”
24.09.12 Недоступность сервиса, даунтайм Неполадки с ядром сети на основе коммутаторов Juniper, повреждение оптического кабеля
6. Ikea Style – не всегда ОК • 22 000 пользователей • 2 дня простоя • Полная потеря данных
7. Общая проблематика
8. Самая медленная часть СХД • Производительность измеряется в IOPS • А совсем не в МБ/с • Ограничено законами физики • Seek latency • Rotational latency • 15 000 об/м – предел • Скорость звука • Не менялось с 2000 года
9. RAID
10. RAID • Redundant Array of Inexpensive Disks • Избыточный массив недорогих дисков
11. Проклятие RAID • Каждая операция записи превращается в несколько • RAID Penalty • RAID 0 = 1 • RAID 1 = 2 • RAID 5 = 4 • RAID 6 = 6 RAID 0 RAID 1 RAID 5 RAID 6
12. Производительность
13. Что же отличает СХД от полки с дисками? • СХД не хочет обращаться к диску • Кэш в оперативной памяти контроллера • Flash-кэш второго уровня • Предиктивное чтение • СХД избегает случайной записи • Писать полными страйпами • RAID Penalty = (N+1) / N, где N – число дисков
14. Не все данные одинаково полезны
15. Flash cache • Кэш второго уровня • Энергонезависим • В сотни раз больше оперативного • В десятки раз быстрее магнитных дисков • Две реализации логики • Read-only • Read/Write • Две аппаратных реализации • Специализированная PCI карта • Стандартный диск SSD (EFD)
16. Контроль и управляемость • Мониторинг • Мощный встроенный мониторинг • Интеграция с корпоративными системами мониторинга
17. Контроль и управляемость • Мониторинг • Мощный встроенный мониторинг • Интеграция с корпоративными системами мониторинга • Quality of Service (QoS) • Спасение от «шумного соседа» • Гарантия производительности • Ограничение по производительности
18. Экономия
19. Многоуровневое хранение (tiering) • В большинстве случаев – оптимизация по стоимости • Холодные данные на дешевые, но емкие носители • Перемещение данных 1 раз в сутки • Большой размер блока (256 МБ) • Улучшение производительности • Для систем с большим запасом вычислительной мощности • Hi End • Гиперконвергентные системы и SDS
20. Многоуровневое хранение (tiering) • Будьте внимательны • Реализация тиринга иногда специфична • Знайте свой профиль нагрузки • Тиринг вам может не помочь от слова СОВСЕМ • Маркетинг работает
21. Защита данных
22. Снимки (snapshots) • Защита от логических сбоев • Развалилась БД • Удалили файл • Использование в качестве тестовой площадки • Тесты на реальных данных • Резервное копирование • Бэкап снимка, а не самих данных • Поддержка почти всеми СРК корпоративного класса
23. Журналирование • Журнал • Отдельное хранилище данных • Циклично записывает все операции записи • Спасает от логических сбоев с высочайшей гранулярностью • Вплоть до единичной дисковой операции • Интегрируется с прикладным софтом (на конкретный commit)
24. Катастрофоустойчивость
25. Репликация данных • Создание удаленной копии данных • Всегда схема Active-Passive • Cинхронная • <100 км • Идентичная копия • Асинхронная • Любые расстояния • Близко к идентичной
26. Метрокластер • СХД в активном зеркале • Active-Active • Синхронная • <100 км • Приложение не знает где работает • Полная автоматика
27. Выводы
28. Что же делать? • Узнай свои данные и нагрузку • Сколько стоит простой бизнеса • Сколько стоит потеря данных • Насколько схема «сделай сам» в политике компании? • Справится ли компания с разработкой? • А с поддержкой? • А если вот ты персонально уйдешь из компании?
29. Антон Жбанков • 8x VMware vExpert • VCP, MCITP • EMC Cloud Architect Expert •
http://blog.vadmin.ru•