आज हम big data के tutorial में एक बहुत महत्वपूर्ण topic HDFS- (Distributed file system) feature and goals को अच्छे से जानेंगे . तो चलिये शुरू करते है . hello दोस्तों आपका Hindi me iT में बहुत – बहुत अभिनन्दन है .
HDFS – (Distributed file system)
HDFS को हम initially एक format structure में stared करते हैं एक distributed mode में stared किया जाता हैं.
Commands
अगर हमें start करना हैं HDFS को तो उससे पहले हमको format करना होगा . इसके लिये हमको $, hadoop , name node, high fun formate लिखते हैं फिर start करने के लिये हमें .
$start -dfs .sh लिखते हैं .
आसान शब्दों में आपको HDFS को start करना हैं करना हैं तो start करने से पहले format करना पड़ता हैं .उसके बाद start हो सकता हैं.
इनको भी पढ़े
Feature of HDFS in hindi
HDFS के total 5 feature हैं .
Highly Scalable
HDFS (Distributed file system) का जो data होता हैं वह Highly Scalable होता हैं यानी की जो system होता हैं वो Highly Scalable होता हैं अगर आप large data की बात करे या small data की बात करे ये सारे data के लिये आपने आप को adept कर लेता हैं.
Replication
replication में जो node होते हैं वह same type के data को contain करते हैं . क्योंकि एक machine में data ख़राब हो गया तो वह वाकी machine में data मोजूद होता हैं इसलिये data का loss नहीं होता हैं.
Fault tolerance
अगर data को आप replicate करते हैं तो कोई भी fault आयेगा तो उस चीज को वो easily recover कर लेगा . क्योंकि data अभी भी मोजूद हैं
fault tolerance का मतलब होता हैं . अगर system में कोई failure हो जाता हैं उसको overcome करने के लिये जो capability होती हैं use fault tolerance कहते हैं और capability hadoop file distraction system में हैं यानी की ये system error free रखता हैं.
Portable
HDFS (Distributed file system) hadoop distributed file system हैं उसको इस तरीके से design किया जाता हैं . जहाँ पर हम एक platform दुसरे platform में अपने data को रख सकते हैं. Portable यहाँ पर आ जाती हैं जब different platform में एक ही काम हो रहा हो.
इनको भी पढ़े
Goals of HDFS (Distributed file system)
HDFS (Distributed file system) के basically तीन objective होता हैं.
Handling the hardware failure
Handling the hardware failure का काम basically hardware failure को handle करना होता हैं. HDFS (Distributed file system)में बहुत सारे machine होते हैं अगर एक machine fail हो जाती हैं तो HDFS (Distributed file system) quickly recover कर लेगा दूसरी machine से इस तरीके से hardware failure नहीं होता हैं और इसे handle कर लेता हैं.
जो HDFS (Distributed file system)होता हैं वह general purpose file में run करता हैं और इस general purpose file को read करता हैं.
Streaming data access
HDFS (Distributed file system) में हम streaming data access कर सकते हैं .लेकिन latency data access नहीं कर सकते हैं . latency data access में data को access fast करना होता है वो इसमें possible नहीं होता अगर आप data को पूरी तरह से read करना चाहते हैं एक बार में तो use stream data access कहते हैं और ये काम HDFS (Distributed file system) करता हैं.
Coherence model
coherence model का मतलब बो application जो HDFS (Distributed file system) में rum करते हैं उनका करना होता हैं इसमें रक बार लिखना तथा बहुत बार पढना होता हैं. अगर हम इसमें एक file को create करते हैं HDFS (Distributed file system) में तो हम उसको फिर से change नहीं कर सकते हैं . उसके अंदर के data को . लेकिन अगर उस file के अंदर और data add करना हो या फिर पहले से मोजूद data को delete करना चाहते हो तो वो काम कर सकते हैं .
आसान शब्दों में कहे तो coherence model का मतलब जो पहले से data मोजूद की value को change नहीं कर सकते हैं .click
इनको भी पढ़े
- Public, private, hybrid and community cloud model (in Hindi)
- waterfall model in hindi | linear sequence model in hindi
आशा करता हूँ आपको topic HDFS- (Distributed file system) feature and goals समझ में गया होगा . अगर आपको इससे related कोई question पूछना है तो आप comment करके पूछ सकते है . हम आपकी comment का जबाब जरुर देंगे . अगर हमारे द्वारा दी गयी जानकारी अच्छी लगी हो तो हमे comment करके जरुर बताये और आपका हमको कोई सुझाब हो तो उसे भी जरुर बताये . दोस्तों आपसे एक request है . आप इस जानकारी को आपने दोस्तों , रेस्तेदारो के साथ जरुर शेयर करे | धन्यबाद