Розподілена файлова система виступає в ролі особливої системи, яка виконує доступ до файлів в мережі, забезпечує доступність і збереження даних на більшості серверних машин. Аналогом мережевої платформи вважається традиційна локальна файлова система, що управляє апаратами масової пам’яті, розміщеними на ПК.
Основи мережевих БД
Ці елементи відносяться до мережевих файлових систем і гарантують доступ до них на серверах. З їх підтримкою користувач має можливість сформувати цілісну міжмережеву файлову систему. Вона включає різні засоби для серверів.
Розподілені файлові системи (РФС) забезпечують віддзеркалення, реплікацію і резервне копіювання БД на будь-накопичувачах, що дозволяє розробнику редагувати власні файли, усувати або зберігати конфігурації.
Існує кілька РФС, які розрізняються в додатку, інтерфейс і протоколі, а також різні функції, такі як кешування, ведення журналу, багатоканальне використання в локальних мережах. Оскільки пропускна здатність розподілених файлових систем для кластерів надзвичайно низька, ці програми мають спеціальні системи зі швидкостями передачі понад 100 МБ/с. До них відносяться Глобальна система (GFS) і проприетарная загальна система (GPFS).
РФС ієрархічно структурована і має єдине логічне угода про імена. Це мережевий протокол, який дозволяє користувачеві отримувати доступ до файлів, не знаючи місця розташування сервера. Центральна структура дерева спрощує пошук файлів по всій компанії. Вони зберігаються надлишково і повністю доступні навіть у разі збою основного жорсткого диска. У більш широкому сенсі під РФС розуміється мережевий протокол доступу до файлової системи.
Прикладами є:
Відомими реалізаціями РФС є:
Порівняння розподілених файлових систем.
Обслуговування і види системних послуг
Така система надає наступні послуги:
Необхідні функції РФС:
Модель перенесення на рівні блоку
У файлових системах, що використовують модель кешування даних, важливою проблемою проектування є вибір одиниці передачі даних. Це відноситься до частки файлу, який переноситься і формується клієнтами у результаті однієї операції читання або запису.
У моделі переносу на рівні файлів, коли дані повинні бути передані, весь файл переміщується. Переваги моделі:
Недоліки моделі:
Для моделі переносу одиниця передачі – це байт. Модель забезпечує максимальну гнучкість, оскільки вона дозволяє зберігати і витягувати довільний об’єм файлу, заданий зміщенням всередині і довжини. Недоліком є те, що управління кешем складніше за даних змінної довжини для різних запитів доступу.
Модель перенесення на рівні запису використовується зі структурованими файлами, а одиниця передачі – це запис. Декілька користувачів можуть одночасно звертатися до спільно використовуваного файлу. Важливою проблемою проектування для будь-якої файлової системи є визначення того, коли зміни файлів даних, зроблені користувачем, спостерігаються іншими користувачами.
Форми і розташування кеша
Кожна розподілена файлова система Windows використовує свою форму кешування.
Причини створення кешу:
Основні рішення, які повинні бути прийняті в схемі кешування файлів для РФС:
Розташування кеша відноситься до місця зберігання кешованих даних. Припускаючи, що початкове місце розташування файлу на диску його сервера. В РФС є кілька можливих розташувань кеша:
Модифікація розповсюдження
Коли кеш розташований на вузлах clients, дані файлу можуть одночасно кешуватися на декількох вузлах. Можливо, що кеші стають неузгодженими, коли дані файлу змінюються одним з клієнтів, а відповідні дані, кешовані в інших вузлах, не змінюються і не відкидаються.
Існують дві проблеми з дизайном:
Використовувана схема розповсюдження модифікації надає критичний вплив на продуктивність і надійність системи.
Метод «Схема запису» застосовується, коли запис кешу змінюється, нове значення негайно відправляється на сервер для оновлення основної копії файлу. Перевага методу висока ступінь надійності та придатності для UNIX-подібної семантики. Це пов’язано з тим, що ризик відновлення даних, втрачених в разі збою клієнта, дуже низький, оскільки кожна модифікація негайно поширюється на сервер, що має основну копію.
Недолік – ця схема підходить тільки тоді, коли співвідношення звернень до читання запису досить велике. Він не знижує мережевий трафік для запису. Це пов’язано з тим, що кожен доступ на запис повинен чекати, поки дані будуть записані на головну копію сервера.
Схема із затримкою запису
Щоб зменшити мережний трафік для запису, використовується схема з затримкою запису. У цьому випадку нове значення даних записується тільки в кеш, і всі оновлені запису кеша відправляються на сервер пізніше.
Існує три часто використовуваних підходу з затримкою запису:
Переваги схеми з затримкою-записом:
Недолік схеми з затримкою запису – надійність все ще може бути проблемною, оскільки зміни, надіслані на сервер з кеша клієнта, будуть втрачені.
Реплікація, як механізм доступності
Висока доступність – це потрібна функція хорошою розподіленої файлової системи, а реплікації файлів є основним механізмом поліпшення доступності файлів.
Реплицированный файл являє собою файл, який має кілька копій, при цьому кожен на окремому сервері.
Різниця між реплікацією і кешуванням
Переваги реплікації:
Настройка роботи клієнта при відключенні
Частою проблемою при роботі системи DFS є поява повідомлення «Відключений клієнт розподіленої файлової системи DFS». Microsoft має вирішення цієї проблеми, для цього потрібно включити клієнта на сервері, наприклад, Windows Server 2012 R2.
Алгоритм дій:
Система для спільного використання мережевих ресурсів в Лінукс
NFS – найбільш поширена файлова система для спільного використання мережевих ресурсів. Найбільш поширеною версією, є NFS v2. Ця розподілена файлова система Linux веде себе як верхній рівень локальної файлової системи. Доступ до віддалених файлів здійснюється через виклики процедур RPC. Він не піклується про стан сервера доступному або недоступному і використовує дуже мало технологій кешування файлів. Крім того, безпека цієї системи заснована на довірі клієнта. Дійсно, це ідентифікатор клієнта, який передається для ознайомлення з правами доступу до ресурсів.
NFS v3 – це еволюція NFS і в даний час використовується в сучасній запатентованої Unix, яка заповнює деякі прогалини останнього. Таке визначення розподіленої файлової системи, конструкційно дозволяє підтримувати великі файли розміром 2 64-розрядної потужності, а також перевіряти права доступу на сервері. Вони можуть бути засновані на традиційних аутентифікації Unix або використовувати додаткову аутентификацию, наприклад Kerberos. Версія забезпечує можливість запису даних асинхронно, що дає їй кращу продуктивність. Однак більшість інших операцій залишаються синхронними. Підтримка NFS v3 в даний час знаходиться на експериментальній фазі ядра Linux, і вона дуже ефективна.
Маштабируемое блочне сховище
Ceph – це ПО, призначене для забезпечення масштабованого об’єктного, блочного і файлового сховища в системі. Кластери зберігання розподіленої файлової системи Ceph призначений для роботи на товарному обладнанні з використанням алгоритму CRUSH, щоб забезпечити рівномірний розподіл даних по кластеру, тоді всі вузли кластера можуть швидко отримувати дані без будь-яких централізованих вузьких місць.
Ceph доступний через Amazon Simple (S3) і OpenStack Swift (REST) на основі інтерфейсів прикладного програмування, і рідний API для інтеграції з програмними додатками. В блочному сховище Ceph використовується блокування, яка є віртуальним диском і може бути підключена до серверів на базі Linux або віртуальним машинам з відкритим кодом. Надійне автономне сховище розподілених об’єктів Ceph (RADOS) забезпечує можливості зберігання блоків, такі як моментальні знімки і реплікацію.
Блочний пристрій Ceph RADOS інтегровано для роботи в якості задньої частини з блоковим сховищем OpenStack. Сховище файлів Ceph використовує сумісної з POSIX файлову систему CephFS (CephFS) для зберігання даних в кластері зберігання Ceph. CephFS використовує ту ж кластерну систему, що і сховище блоків Ceph і сховище об’єктів Ceph.
Переваги розподіленої файлової системи
Технічно вона забезпечує доступ до загальної директорії, яка не містить файли, а тільки переходи і необов’язкові піддиректорії з великою кількістю переходів. Переходи аналогічні м’яким посиланнях, як відомо з файлових систем Unix, але відносяться до загальних каталогів і можуть вказувати на загальні каталоги на інших серверах. Спочатку клієнти запитують сервер DFS з’єднання, потім звертаються до сервера файл, на який вказує це з’єднання.
Основне завдання використання розподіленої файлова система DFS – створити альтернативне простір імен (подання дерева каталогів), яке приховує деталі базової інфраструктури від користувачів. Шляхи, які користувачі бачать і називаються іменами DFS, не змінюються при перейменуванні серверів або при переміщенні деяких з каталогів на інший сервер.
Адміністратори можуть просто замінити застаріле ім’я на нове, що вказує на нову мету. Ім’я може вказувати на більш ніж одну мету, тобто надати клієнтові кілька альтернативних з’єднань для різних спільних папок. В цьому випадку клієнти розподіленої файлової системи DFS можуть отримати доступ до будь-якої з цілей. Це забезпечує балансування навантаження та автоматичний перехід на інший сервер, якщо один із серверів виходить з ладу.
Завдяки DFS більше немає суворого з’єднання з сервером загальним доступом. Пам’ять представлена у вигляді пулу великої ємності, за яким стоять файлові системи, приховані для користувача. На самому ділі це неймовірно корисний інструмент для вирішення зростаючих вимог до того, щоб файлова система розподіляла дискову пам’ять нових серверів виходячи з вимог доступності.
Технологія, подібна Windows DFS, приносить користь будь-яким компаніям і великим, і маленьким. Для великих компаній окупається аспект більш гнучкого використання ресурсів зберігання. Оскільки всі диски є частиною віртуальної пам’яті, більше немає невикористовуваних або переповнених дисків і масивів.
Менші компанії, проте, цінують стандартизацію адміністрації. Завдяки своїм обмеженим ресурсів складно відстежувати повні сервери, своєчасно оновлювати їх до великих дисків і розподіляти простір між додатками.
DFS, не представляє простір для зберігання таким чином, що користувачі і додатки хочуть його бачити, оскільки він дійсно існує. І оскільки сервер та клієнтський компонент є невід’ємною частиною операційної системи Windows, процес встановлення та налаштування вимагає невеликих зусиль з боку адміністратора і практично не впливає на роботу користувачів.
Розробники інтегрували всебічне управління розподіленої файлової системи DFS Windows, консоль являє собою єдину точку управління для декількох кореневих систем DFS. Графічні інструменти полегшують огляд і моніторинг. Управління можливо навіть на веб-сайтах.