Distribuované systémy pro ukládání dat

Z DCEwiki
Verze z 1. 12. 2015, 12:47, kterou vytvořil Keny (diskuse | příspěvky)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)
Skočit na navigaci Skočit na vyhledávání

Distribuované systémy pro ukládání dat, jsou alternativou sdíleného datového úložiště. Z pohledu klientské stanice mezi fyzickým datovým polem a úložištěm distribuovaným mezi více fyzických strojů není rozdíl.

distributed systems.png
Velké datové pole (storage)- ač v jedné krabici - může být složeno z několika "žiletkových" (blade) serverů (nodů) s jedním distribuovaným souborovým systém.
  • Jeho uživatelé neřeší interní HW uspořádání. Pro ně je podstatné pouze síťové rozhraní, kterým ho připojí do síťové infrastruktury a tlačítko ON/OFF
  • Každé datové pole má k dispozici rozhraní, přes které si mohou vybrat, v jaké formě má být datový prostor zprostředkován koncovému uživateli - jestli jako síťový souborový systém (NFS, nebo CIFS), nebo blokové zařízení (iSCSI, AoE)
distributed systems crash.png
single system crash.png

Z hlediska vnitřního uspořádání má datové pole velkou výhodu v tom, že může využívat rychlé interní propojení mezi nody (RDMA), takže může poskytovat velké objemy dat s vysokou datovou propustností.

Nevýhodou velkého datového pole je, obvykle cena a fakt, že jde o jedno fyzické zařízení s velkým objemem dat, jehož ztráta může být za určitých okolností kritická. Je tedy žádoucí, aby mělo alespoň jednu repliku v jiné lokalitě - což je ovšem poměrně nákladná záležitost.

Alternativou velkého datového pole jsou distribuované systémy, u kterých je redundance dat zajištěná jejich rozložením mezi větší množství strojů v různých lokalitách - z hlediska výkonu při I/O operacích však jde z principu o řešení méně výkonné, a to z těchto důvodů:

  • spojení mezi nody je limitováno propustností sítě
  • rychlost I/O operací je dána nejenom vlastnostmi fyzického HW ale také počtem nodů. Čím více jich je, tím je výkon I/O ve srovnání s datovým polem lepší

Jako jeden distribuovaný systém tak mohou sloužit skupiny kancelářských strojů, učebny, servery ve vzdálených lokalitách atp.

Ditribuovaný systém je také výhodný pro clusterová řešení - datové pole je v podstatě cluster - kdy v případě výpadku některého z nodů se přesunou poskytované služby na jiný nod.

GlusterFS

GlusterFS je škálovatelný distribuovaný síťový souborový systém, určený pro velká datová úložiště. Aktuálně patří do portfolia produktů fy. Red Hat (stejně jako Ceph, do kterého se dostal tím že Red Hat v r. 2011 spolkl společnost Gluster (založenou v r. 2005) která s jeho vývojem začala. Lze dynamicky zvětšovat, nebo zmenšovat jeho kapacitu, podobně je tomu u LVM, ovšem s tím rozdílem, že základním prvkem zde není lokální blokové zařízení, ale souborové systémy vzájemně komunikujících strojů.

direction a suivre 3 yve 01.svgČíst dále..

Sheepdog

Sheepdog je škálovatelný systém, který poskytuje virtuálním strojům distribuovaná bloková zařízení. Za jeho vývojem, který začal v r. 2009, stojí vývojáři japonské firmy Nippon Telegraph and Telephone Corporation. Sheepdog je opensource aplikace s GPL2 licencí. Zatím poslední verzi 0.9.3, vydanou v listopadu 2015, by měla následovat verze 1.0 použitelná i pro komerční nasazení[1].

direction a suivre 3 yve 01.svgČíst dále..