প্রযুক্তিগত হোয়াইট পেপারঃ এনভিআইডিআইএ মেলানোক্স 920-9B210-00FN-0D0 ইনফিনিব্যান্ড সুইচ সলিউশন

January 6, 2026

প্রযুক্তিগত হোয়াইট পেপারঃ এনভিআইডিআইএ মেলানোক্স 920-9B210-00FN-0D0 ইনফিনিব্যান্ড সুইচ সলিউশন
1প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ

এক্সাসকেল এআই প্রশিক্ষণ এবং উচ্চ-বিশ্বস্ততা এইচপিসি সিমুলেশনগুলির দিকে কম্পিউটিং ওয়ার্কলোডগুলির বিবর্তন মূলত পারফরম্যান্স বোতলগলাটিকে কম্পিউটিং থেকে আন্তঃসংযোগে স্থানান্তরিত করেছে।আধুনিক আরডিএমএ-নির্ভর ক্লাস্টারগুলি এমন একটি ফ্যাব্রিকের প্রয়োজন যা কেবল উচ্চ ব্যান্ডউইথই নয় বরং নির্ধারিত অতি-নিম্ন বিলম্বিততা সরবরাহ করে, ন্যূনতম ঝামেলা, এবং নির্বিঘ্নে স্কেলযোগ্যতা। লিগ্যাসি নেটওয়ার্কগুলি প্রায়শই পরিবর্তনশীল বিলম্ব, জমে থাকা-প্ররোচিত প্যাকেট ক্ষতি এবং পরিচালনার জটিলতা প্রবর্তন করে,যা সরাসরি দীর্ঘতর সমাধানের সময়কে অনুবাদ করে, GPU/CPU রিসোর্স কম ব্যবহার করা, এবং অপারেশনাল ওভারহেড বাড়ানো।

এই প্রযুক্তিগত সমাধানটি পরবর্তী প্রজন্মের ডেটা সেন্টার এবং গবেষণা কেন্দ্রগুলির মূল প্রয়োজনীয়তাগুলি মোকাবেলা করেঃ একটি ইউনিফাইড,ক্লাসিকাল এইচপিসি (এমপিআই-ভিত্তিক) এবং আধুনিক এআই (সমষ্টিগত যোগাযোগ) ওয়ার্কলোডগুলিকে একত্রিত করতে সক্ষম উচ্চ-পারফরম্যান্স ফ্যাব্রিকপ্রধান প্রযুক্তিগত চাহিদাগুলির মধ্যে রয়েছে-সাব-মাইক্রোসেকেন্ড সুইচ ল্যাটেনসি, অ-ব্লকিং থ্রুপুট সব-সব যোগাযোগের প্যাটার্নের জন্য, বুদ্ধিমান জমে থাকা নিয়ন্ত্রণ,এবং একটি ব্যবস্থাপনা কাঠামো যা গভীর দৃশ্যমানতা এবং অটোমেশন প্রদান করে.920-9B210-00FN-0D0 InfiniBand সুইচ OPN সমাধানএই কঠোর মান পূরণের জন্য ডিজাইন করা হয়েছে।

2. নেটওয়ার্ক/সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত আর্কিটেকচারটি সর্বাধিক দ্বি-বিভাগীয় ব্যান্ডউইথ এবং স্কেলযোগ্যতার জন্য ডিজাইন করা একটি স্পিন-লেফ্ট ফ্যাব্রিক, এনডিআর 400 গিগাবাইট / সেকেন্ড ইনফিনিব্যান্ড প্রযুক্তিতে নির্মিত।এনভিআইডিআইএ মেলানোক্স ৯২০-৯বি২১০-০০এফএন-০ডি০সুইচগুলি, অতি-উচ্চ-ব্যান্ডউইথ কোর গঠন করে। পাতার স্তরটি এনডিআর বা এইচডিআর সুইচগুলির মিশ্রণ নিয়ে গঠিত হতে পারে, কম্পিউটারের নোডগুলি সংযুক্ত করে (এনভিআইডিআইএ ডিজিএক্স সিস্টেমের মতো জিপিইউ সার্ভার, সিপিইউ ক্লাস্টার),হাই পারফরম্যান্স প্যারালাল স্টোরেজ (এনভিএমই-ওএফ), এবং ম্যানেজমেন্ট নোড।

এই বিচ্ছিন্ন নকশাটি পূর্বাভাসযোগ্য বিলম্ব নিশ্চিত করে এবং ফ্যাব্রিকের মধ্যে ওভারসাবস্ক্রিপশন দূর করে। মূল স্থাপত্য নীতিগুলির মধ্যে রয়েছেঃ

  • ইউনিফাইড ফ্যাব্রিক:একক নেটওয়ার্ক (পূর্ব-পশ্চিম) কম্পিউটিং এবং স্টোরেজ ট্র্যাফিকের জন্য, পরিচালনা সহজতর এবং ক্যাপেক্স হ্রাস।
  • ক্ষতিহীন অপারেশন:আরডিএমএ এবং এমপিআই পারফরম্যান্সের জন্য সমালোচনামূলক শূন্য প্যাকেট ক্ষতি নিশ্চিত করার জন্য ইনফিনিব্যান্ডের নেটিভ জ্যাম কন্ট্রোল এবং ট্র্যাফিক ফ্লো ম্যানেজমেন্ট ব্যবহার করা।
  • সফটওয়্যার-সংজ্ঞায়িত নেটওয়ার্কিং:এনভিআইডিআইএ কামুলাস লিনাক্স এবং ইউএফএম® প্ল্যাটফর্মের সাথে সংহতকরণ প্রোগ্রামযোগ্য ফ্যাব্রিক অটোমেশন এবং নীতি-ভিত্তিক পরিচালনার অনুমতি দেয়।
3. এনভিআইডিআইএ মেলানোক্স 920-9B210-00FN-0D0 এর ভূমিকা এবং মূল বৈশিষ্ট্য

দ্য920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRসুইচ হল এই আর্কিটেকচারের কৌশলগত ভিত্তি, উচ্চ-কার্যকারিতা মেরুদণ্ড হিসাবে কাজ করে। এর ভূমিকা সহজ সুইচিং অতিক্রম করে; এটি বুদ্ধিমান ইঞ্জিন যা সর্বোত্তম ডেটা চলাচল নিশ্চিত করে।

এর মূল প্রযুক্তিগত বৈশিষ্ট্য, যা অফিসিয়াল920-9B210-00FN-0D0 তথ্য পত্র, সরাসরি কম বিলম্বিত অপ্টিমাইজেশান মোকাবেলাঃ

  • কট-থ্রু সুইচিং এবং অতি-নিম্ন বিলম্বঃসুইচটি উন্নত কাট-থ্রু সুইচিং আর্কিটেকচার ব্যবহার করে, 100 ন্যানোসেকেন্ডের নিচে পোর্ট-টু-পোর্ট লেটেন্সি অর্জন করে। এটি আরডিএমএ অপারেশনগুলির সামগ্রিক শেষ থেকে শেষ লেটেন্সি হ্রাস করার জন্য অত্যন্ত গুরুত্বপূর্ণ।.
  • NDR 400Gb/s ব্যান্ডউইথঃপ্রতিটি পোর্ট 400Gb / s সরবরাহ করে, বিতরণকৃত এআই প্রশিক্ষণ চেকপয়েন্ট বা বড় আকারের MPI_allreduce ক্রিয়াকলাপের মতো শীর্ষ কাজের সময় ঘনত্ব রোধের জন্য প্রয়োজনীয় হেডরুম সরবরাহ করে।
  • অ্যাডাপ্টিভ রুটিং এবং জ্যাম কন্ট্রোলঃএনভিআইডিআইএর স্কেলেবল হেরার্কিয়াল এগ্রিগেশন অ্যান্ড রিডাকশন প্রোটোকল (SHARP) TM v3 প্রযুক্তি, সুইচে অন্তর্নির্মিত, সিপিইউ থেকে সমষ্টিগত অপারেশনগুলি অফলোড করে,ব্যাপকভাবে সিঙ্ক্রোনাইজেশন ওভারহেড হ্রাসডায়নামিক অ্যাডাপ্টিভ রুটিংয়ের সাথে মিলিয়ে এটি হট স্পট প্রতিরোধ করে এবং সুষম ফ্যাব্রিক ব্যবহার নিশ্চিত করে।
  • ব্যাকগ্রাউন্ড এবং ফরওয়ার্ড সামঞ্জস্যঃএটি একটি মসৃণ মাইগ্রেশন কৌশল অবিচ্ছেদ্য অংশ।সামঞ্জস্যপূর্ণবিদ্যমান এইচডিআর (২০০ গিগাবাইট/সেকেন্ড) এবং ইডিআর (১০০ গিগাবাইট/সেকেন্ড) সরঞ্জামগুলির সাথে, ধাপে ধাপে আপগ্রেড করার অনুমতি দেয়।920-9B210-00FN-0D0 স্পেসিফিকেশনএটি বন্দর সংযোগ এবং তারের ধরন পরিকল্পনা করার জন্য অত্যন্ত গুরুত্বপূর্ণ।
4. স্থাপনার এবং স্কেলিং সুপারিশ (সাধারণ টপোলজি বর্ণনা সহ)

প্রাথমিক মোতায়েন একটি মডুলার "পড" পদ্ধতি অনুসরণ করা উচিত।920-9B210-00FN-0D0রিডান্ডান্সির জন্য একটি স্পিন রোলের সুইচ, একাধিক এইচডিআর বা এনডিআর পাতার সুইচগুলির সাথে সংযুক্ত যা কয়েক ডজন কম্পিউটারের নোডকে সমর্থন করে।

সর্বোত্তম পারফরম্যান্সের জন্য প্রস্তাবিত টপোলজিঃদুই স্তরের নন-ব্লকিং ক্লোজ (ফ্যাট-ট্রি) টপোলজি।স্পিন সুইচ সংখ্যা (920-9B210-00FN-0D0 ইউনিট) প্রতিটি পাতা সুইচ থেকে আপলিংক সংখ্যা এবং পছন্দসই ওভারসাবস্ক্রিপশন অনুপাত দ্বারা নির্ধারিত হয় (আদর্শত 1এইচপিসি/এআই এর জন্য ১) ।

  • স্কেল আউট:ক্লাস্টার স্কেল করার জন্য, আরো পাতা সুইচ যোগ করুন এবং আনুপাতিকভাবে আরো যোগ করুন920-9B210-00FN-0D0UFM® ম্যানেজমেন্টের অধীনে ফ্যাব্রিকের অ্যাড্রেসিং এবং রাউটিং স্কেল নির্বিঘ্নে।
  • স্কেল আপঃপৃথক নোডগুলি এনডিআর এনআইসিতে আপগ্রেড করা যেতে পারে, তাত্ক্ষণিকভাবে মেরুদণ্ডে পূর্ণ 400 গিগাবাইট / সেকেন্ডের ব্যান্ডউইথ ব্যবহার করে।সামঞ্জস্যপূর্ণপ্রকৃতি এই বৈচিত্র্যময় পরিবেশকে সমর্থন করে।
  • ক্যাবলিং এবং পাওয়ারঃস্থাপনার পরিকল্পনায় এনডিআর-সামঞ্জস্যপূর্ণ অপটিক্যাল ক্যাবল (যেমন, ওএসএফপি) বিবেচনা করা উচিত।920-9B210-00FN-0D0 স্পেসিফিকেশনডাটা সেন্টারের সঠিক শক্তি এবং শীতল নকশা জন্য সঠিক শক্তি খরচ এবং তাপ তথ্য প্রদান।

যখন এই সমাধান পাওয়া যায়বিক্রির জন্য, সার্টিফাইড অংশীদারদের সাথে কাজ করার পরামর্শ দেওয়া হয়920-9B210-00FN-0D0 দামএবং আপনার নির্দিষ্ট স্কেলিং পরিকল্পনার জন্য পরিমাণ।

5অপারেশন, মনিটরিং, সমস্যা সমাধান এবং অপ্টিমাইজেশান সুপারিশ

অপারেশনাল শ্রেষ্ঠত্ব NVIDIA UFM® প্ল্যাটফর্মের মাধ্যমে অর্জন করা হয়। এটি প্রতিটি ফ্যাব্রিক সহ পুরো ফ্যাব্রিকের জন্য ব্যাপক জীবনচক্র পরিচালনা সরবরাহ করে920-9B210-00FN-0D0স্যুইচ করুন।

  • সক্রিয় পর্যবেক্ষণঃইউএফএম® সুইচ স্বাস্থ্য, পোর্ট ব্যবহার, তাপমাত্রা, ত্রুটি কাউন্টার এবং অ্যাপ্লিকেশন-স্তরের ট্র্যাফিক প্যাটার্নগুলির গভীর বিশ্লেষণ সম্পর্কে রিয়েল-টাইম টেলিমেট্রি সরবরাহ করে,এমপিআই এবং আরডিএমএ যোগাযোগ ম্যাট্রিক্স সহ.
  • অটোমেটেড ফ্যাব্রিক ম্যানেজমেন্টঃপ্রাথমিক প্রভিজিনিং এবং ক্যাবল ভ্যালিডেশন থেকে ফার্মওয়্যার আপডেট এবং কনফিগারেশন ব্যাকআপ পর্যন্ত, ইউএফএম® রুটিন কাজগুলি স্বয়ংক্রিয় করে, মানব ত্রুটি এবং অপারেশনাল ওভারহেড হ্রাস করে।
  • সমস্যা সমাধানঃউন্নত সরঞ্জামগুলি পারফরম্যান্স অস্বাভাবিকতা চিহ্নিত করতে পারে, যানজটের কারণ হতে পারে এমন ভুল আচরণ প্রবাহগুলি সনাক্ত করতে পারে এবং ব্যর্থ লিঙ্ক বা উপাদানগুলি দ্রুত বিচ্ছিন্ন করতে ফ্যাব্রিক টপোলজি ভিজ্যুয়ালাইজ করতে পারে।
  • ক্রমাগত অপ্টিমাইজেশানঃসঠিক আকারের ওয়ার্কলোডগুলিতে ইউএফএম® অন্তর্দৃষ্টি ব্যবহার করুন, যাচাই করুন যে কর্মক্ষমতাতথ্য পত্রজমে থাকা এবং বিলম্বিত মেট্রিক্সের নিয়মিত পর্যালোচনা সর্বোচ্চ ফ্যাব্রিক পারফরম্যান্স বজায় রাখার মূল চাবিকাঠি।
6উপসংহার এবং মূল্য মূল্যায়ন

একটি ফ্যাব্রিক আর্কিটেকচার বাস্তবায়নএনভিআইডিআইএ মেলানোক্স ৯২০-৯বি২১০-০০এফএন-০ডি০ইনফিনিব্যান্ড সুইচ উচ্চ-পারফরম্যান্স কম্পিউটিংয়ের উপর নির্ভরশীল সংস্থাগুলির জন্য একটি মৌলিক প্রতিযোগিতামূলক সুবিধা প্রদান করে।এই প্রযুক্তিগত সমাধান একাধিক মাত্রা জুড়ে পরিমাপযোগ্য মান প্রদান করে:

মূল্য মাত্রা বাস্তবায়িত ফলাফল
প্রযুক্তিগত পারফরম্যান্স ডিটারমিনিস্টিক সাব-মাইক্রোসেকেন্ড লেটেন্সি, নন-ব্লকিং 400Gb/s ব্যান্ডউইথ, এবং RDMA এবং MPI এর জন্য ঘনত্ব মুক্ত অপারেশন।
ব্যবসা/গবেষণা ত্বরণ অ্যাপ্লিকেশনের রানটাইম ২০-৪০% কমেছে, আবিষ্কারের সময় এবং পণ্য বিকাশের চক্র ত্বরান্বিত হচ্ছে।
অপারেশনাল দক্ষতা ইউনিফাইড ম্যানেজমেন্ট, অটোমেটেড প্রভিজনিং এবং গভীর টেলিমেট্রি TCO কমাতে এবং ডাউনটাইমকে ন্যূনতম করতে পারে।
বিনিয়োগ সুরক্ষা ব্যাকওয়ার্ড সামঞ্জস্যতা এবং স্কেলযোগ্য আর্কিটেকচার বিদ্যমান বিনিয়োগগুলিকে রক্ষা করে এবং ভবিষ্যতের প্রযুক্তিগুলির জন্য একটি পরিষ্কার পথ সরবরাহ করে।

সংক্ষেপে,920-9B210-00FN-0D0এটি কেবলমাত্র একটি উপাদান নয়, এটি একটি উচ্চ-কার্যকারিতা, সংহত অবকাঠামোর সক্ষমতা।এটি নেটওয়ার্ককে একটি সম্ভাব্য দায় থেকে একটি কৌশলগত সম্পদে রূপান্তরিত করে যা আধুনিক কম্পিউটিং ক্লাস্টারের শক্তিকে সম্পূর্ণরূপে মুক্ত করে।.