Distribuované systémy pro ukládání dat

Z DCEwiki
Skočit na navigaci Skočit na vyhledávání

Distribuované systémy pro ukládání dat, jsou alternativou sdíleného datového úložiště. Z pohledu klientské stanice mezi fyzickým datovým polem a úložištěm distribuovaným mezi více fyzických strojů není rozdíl.

distributed systems.png
Velké datové pole (storage)- ač v jedné krabici - může být složeno z několika "žiletkových" (blade) serverů (nodů) s jedním distribuovaným souborovým systém.
  • Jeho uživatelé neřeší interní HW uspořádání. Pro ně je podstatné pouze síťové rozhraní, kterým ho připojí do síťové infrastruktury a tlačítko ON/OFF
  • Každé datové pole má k dispozici rozhraní, přes které si mohou vybrat, v jaké formě má být datový prostor zprostředkován koncovému uživateli - jestli jako síťový souborový systém (NFS, nebo CIFS), nebo blokové zařízení (iSCSI, AoE)
distributed systems crash.png
single system crash.png

Z hlediska vnitřního uspořádání má datové pole velkou výhodu v tom, že může využívat rychlé interní propojení mezi nody (RDMA), takže může poskytovat velké objemy dat s vysokou datovou propustností.

Nevýhodou velkého datového pole je, obvykle cena a fakt, že jde o jedno fyzické zařízení s velkým objemem dat, jehož ztráta může být za určitých okolností kritická. Je tedy žádoucí, aby mělo alespoň jednu repliku v jiné lokalitě - což je ovšem poměrně nákladná záležitost.

Alternativou velkého datového pole jsou distribuované systémy, u kterých je redundance dat zajištěná jejich rozložením mezi větší množství strojů v různých lokalitách - z hlediska výkonu při I/O operacích však jde z principu o řešení méně výkonné, a to z těchto důvodů:

  • spojení mezi nody je limitováno propustností sítě
  • rychlost I/O operací je dána nejenom vlastnostmi fyzického HW ale také počtem nodů. Čím více jich je, tím je výkon I/O ve srovnání s datovým polem lepší

Jako jeden distribuovaný systém tak mohou sloužit skupiny kancelářských strojů, učebny, servery ve vzdálených lokalitách atp.

Ditribuovaný systém je také výhodný pro clusterová řešení - datové pole je v podstatě cluster - kdy v případě výpadku některého z nodů se přesunou poskytované služby na jiný nod.