NVIDIA Mellanox MQM9790-NS2F ইনফিনিব্যান্ড সুইচ প্রযুক্তিগত সমাধান
April 13, 2026
এই প্রযুক্তিগত হোয়াইটপেপারটি নেটওয়ার্ক আর্কিটেক্ট, প্রাক-সেল ইঞ্জিনিয়ার এবং অপারেশন লিডারদের জন্য ডিজাইন করা হয়েছে।MQM9790-NS2F৪০০ গিগাবাইট/সেকেন্ডের এনডিআর ইনফিনিব্যান্ড সুইচ। এতে আর্কিটেকচার ডিজাইন, মূল প্রযুক্তি, স্থাপনার ব্যবস্থা এবং স্কেলিং, পাশাপাশি অপারেশন ও মনিটরিং সংক্রান্ত বিস্তারিত নির্দেশিকা রয়েছে।বিশেষভাবে RDMA/HPC/AI ক্লাস্টার কম লেটেন্সি ইন্টারকানেকশন অপ্টিমাইজেশনের জন্য.
1. প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ
আধুনিক এআই প্রশিক্ষণ এবং এইচপিসি ওয়ার্কলোডগুলি হাজার হাজার থেকে কয়েক হাজার জিপিইউতে ক্লাস্টার চালাচ্ছে। এই জাতীয় পরিবেশে নেটওয়ার্ক ইন্টারকানেকশন একটি প্রাথমিক বোতলঘাট হয়ে উঠেছে।ঐতিহ্যবাহী ইথারনেট ফ্যাব্রিকগুলি লেট লেটেন্সি এবং সিপিইউ ওভারহেডের সাথে লড়াই করে, যদিও পুরানো ইনফিনিব্যান্ড স্থাপনার পর্যাপ্ত পোর্ট ঘনত্ব এবং ব্যান্ডউইথের অভাব থাকতে পারে। মূল প্রয়োজনীয়তাগুলিতে সাব-মাইক্রোসেকেন্ড সুইচিং লেটেন্সি, প্যাকেট ক্ষতি ছাড়াই পূর্ণ লাইন-রেট ফরোয়ার্ডিং অন্তর্ভুক্ত রয়েছে,দক্ষ RDMA সমর্থন, এবং সিমলেস স্কেলযোগ্যতা শত শত সুইচ.এনভিডিয়া মেলানোক্স এমকিউএম৯৭৯০-এনএস২এফএই চাহিদাগুলি সরাসরি তার এনডিআর 400 গিগাবাইট / সেকেন্ডের ক্ষমতা এবং উন্নত ইন-নেটওয়ার্ক কম্পিউটিং বৈশিষ্ট্যগুলির সাথে সমাধান করে।
2. সামগ্রিক নেটওয়ার্ক ও সিস্টেম আর্কিটেকচার ডিজাইন
প্রস্তাবিত আর্কিটেকচারটি একটি দ্বি-স্তরীয় ফ্যাট-ট্রি (যা ভাঁজ ক্লোজ নামেও পরিচিত) টপোলজি গ্রহণ করে, যা বিসেকশন ব্যান্ডউইথ, ব্যয় এবং স্কেলযোগ্যতাকে ভারসাম্য করে।কানেক্টএক্স-৭ এনডিআর অ্যাডাপ্টারের সাথে সজ্জিত জিপিইউ সার্ভারগুলি পাতার সুইচগুলিতে সংযোগ স্থাপন করেমেরুদণ্ডের স্তরে,MQM9790-NS2F ইনফিনিব্যান্ড সুইচইউনিটগুলি পাতাগুলির মধ্যে অ-ব্লকিং সংযোগ সরবরাহ করে। এই নকশাটি পূর্ণ বিসাকশন ব্যান্ডউইথ নিশ্চিত করেঃ যে কোনও পাতার সুইচ তারের গতিতে অন্য যে কোনও পাতার সাথে যোগাযোগ করতে পারে। বড় আকারের ক্লাস্টারগুলির জন্য,একটি তিন স্তরীয় টপোলজি (পাতা-পিঁড়ির-সুপার-পিঁড়ির) স্থাপন করা যেতে পারে, হাজার হাজার জিপিইউ নোড সমর্থন করে।
- পাতার সুইচ:64-পোর্ট ওএসএফপি মডেল, প্রতিটি 32 সার্ভারের সাথে সংযোগ স্থাপন করে (ডুয়াল-পোর্ট) প্লাস স্পাইনে আপলিংক।
- মেরুদণ্ডের স্তর: MQM9790-NS2F 400Gb/s NDR 64-পোর্ট OSFPসুইচ, প্রতিটি পোর্ট একটি পাতার থেকে একটি আপলিংক হিসাবে কাজ করে। একটি সম্পূর্ণ অ-ব্লকিং ডিজাইনের জন্য পাতার সুইচগুলির সংখ্যার সমান স্পাইন পোর্ট প্রয়োজন।
- সাবনেট ব্যবস্থাপনাঃএকটি ডেডিকেটেড বা অতিরিক্ত সাবনেট ম্যানেজার পাথ গণনা, অভিযোজিত রাউটিং এবং ব্যর্থতার সাথে মোকাবিলা করে।
3. NVIDIA Mellanox MQM9790-NS2F এর ভূমিকা ও মূল বৈশিষ্ট্য
কোর মেরুদণ্ড এবং ঐচ্ছিকভাবে পাতা ডিভাইস হিসাবে,MQM9790-NS2Fবেশ কয়েকটি গুরুত্বপূর্ণ ক্ষমতা প্রদান করে:
- 400Gb/s NDR লাইন রেট পারফরম্যান্সঃ৬৪টি ওএসএফপি পোর্টের প্রত্যেকটি পূর্ণ ডুপ্লেক্স ৪০০ গিগাবাইট/সেকেন্ডে কাজ করে, যার ফলে ৫১.২টিবি/সেকেন্ডের সামগ্রিক সুইচিং ক্ষমতা পাওয়া যায়।
- অতি-নিম্ন বিলম্ব এবং অভিযোজিত রাউটিং:কট-থ্রু সুইচিং পোর্ট-টু-পোর্ট ল্যাটেনসিকে ১৩০ns এর নিচে রাখে। অভিযোজিত রাউটিং গতিশীলভাবে একাধিক পথ জুড়ে ট্র্যাফিককে ভারসাম্য করে, হট স্পটগুলি এড়ায়।
- নেটওয়ার্ক কম্পিউটিং (SHARPv3):স্কেলেবল হিয়ারারকিকেল সমষ্টি এবং হ্রাসকে সমর্থন করে, সিপিইউ / জিপিইউ থেকে সম্মিলিত ক্রিয়াকলাপগুলিকে অপসারণ করে এবং ডেটা চলাচলকে 10x পর্যন্ত হ্রাস করে।
- আরডিএমএ-নেটিভ ডিজাইনঃহার্ডওয়্যার ত্বরিত আরডিএমএ সরাসরি জিপিইউ মেমরি অ্যাক্সেস সক্ষম করে, সিপিইউর জড়িততা দূর করে এবং যোগাযোগের ওভারহেডকে নাটকীয়ভাবে হ্রাস করে।
- বিস্তৃত টেলিমেট্রি ও কোয়ালিটি অফ সার্ভিসঃসূক্ষ্ম দানাযুক্ত ঘনত্ব নিয়ন্ত্রণ, বাফার মনিটরিং এবং প্রবাহ শ্রেণীবিভাগ মিশ্র কাজের বোঝার জন্য নির্ধারক কর্মক্ষমতা নিশ্চিত করে।
এর মতেMQM9790-NS2F তথ্য পত্র, সুইচটি হট-স্টাপেবল পাওয়ার সাপ্লাই এবং ফ্যান, অতিরিক্ত ম্যানেজমেন্ট পোর্ট এবং ডায়াগনস্টিকের একটি সম্পূর্ণ স্যুট সমর্থন করে, যা এটিকে 7 × 24 উত্পাদন পরিবেশের জন্য উপযুক্ত করে তোলে।
4. ডিপ্লয়মেন্ট এবং স্কেলিং সুপারিশ (সাধারণ টপোলজি সহ)
একটি সাধারণ ২,০৪৮-জিপিইউ ক্লাস্টার ৬৪ টি পাতার সুইচ এবং ৩২ টি স্পিন সুইচ ব্যবহার করে তৈরি করা যেতে পারে। প্রতিটি পাতার ৩২ টি জিপিইউ সার্ভারের সাথে সংযোগ স্থাপন করে (দ্বৈত-পোর্ট) এবং স্পিনগুলিতে ৩২ টি আপলিংক সরবরাহ করে। স্পিন স্তরটিMQM9790-NS2F সামঞ্জস্যপূর্ণএনডিআর অপটিক্স বা ডিএসি ক্যাবল চালানো ইউনিটগুলি। 8,192 জিপিইউতে সম্প্রসারণের জন্য, একটি সুপার-স্পাইন স্তর যুক্ত করা হয়, একাধিক পডকে আন্তঃসংযোগ করে।
স্কেলিং করার সময়, নিচের বিষয়গুলো বিবেচনা করুন:
- ক্যাবলিং এবং অপটিক্সঃOSFP থেকে OSFP DACs ব্যবহার করুন সংক্ষিপ্ত ইনট্রা-র্যাক লিঙ্কগুলির জন্য, এবং OSFP থেকে 4xOSFP ব্রেকআউট ক্যাবল বা অপটিক্যাল মডিউলগুলি দীর্ঘ দূরত্বের জন্য।MQM9790-NS2F স্পেসিফিকেশনপরিসীমা এবং বিদ্যুৎ বাজেটের বিষয়ে।
- সাবনেট সাইজিংঃএকটি একক সাবনেট ম্যানেজার ২,০০০ পর্যন্ত নোড পরিচালনা করতে পারে; এর বাইরে, একাধিক সাবনেট স্থাপন করুন বা বিতরণকৃত সাবনেট ম্যানেজার ডিজাইন ব্যবহার করুন।
- অপ্রয়োজনীয়তা:ডুয়াল-হোমড সার্ভার এবং অতিরিক্ত স্পিন সুইচগুলি একক ব্যর্থতার পয়েন্টগুলিকে বাদ দেয়।MQM9790-NS2F ইনফিনিব্যান্ড সুইচ সমাধানসঠিক এসএম কনফিগারেশনে হিটলেস ফেইলওভার সমর্থন করে।
5অপারেশন, মনিটরিং, সমস্যা সমাধান ও অপ্টিমাইজেশান
কার্যকর অপারেশনগুলির জন্য দৃশ্যমানতা এবং অটোমেশন প্রয়োজন। নিম্নলিখিত অনুশীলনগুলি সুপারিশ করা হয়ঃ
- পর্যবেক্ষণঃNVIDIA এর ফ্যাব্রিক ম্যানেজার এবং টেলিমেট্রি এপিআই ব্যবহার করুন পোর্ট ত্রুটি, তাপমাত্রা, শক্তি খরচ এবং লিঙ্ক ব্যবহার ট্র্যাক করতে। CRC ত্রুটি বা প্রতীক ত্রুটিগুলির জন্য সতর্কতা সেট করুন যা থ্রেশহোল্ড অতিক্রম করে।
- সমস্যা সমাধানঃদ্যMQM9790-NS2Fপ্রতি পোর্ট কাউন্টার, বাফার দখল হিস্টোগ্রাম, এবং ঘনত্ব লগ প্রদান করে। কর্মক্ষমতা অবনতি ক্ষেত্রে, অভিযোজিত রাউটিং কনফিগারেশন চেক করুন, সব ফ্যাব্রিক লিঙ্ক সমতুল্য নিশ্চিত করুন,এবং নিশ্চিত করুন যে সমর্থিত সমষ্টিগুলির জন্য SHARP সমষ্টি সক্ষম করা হয়েছে.
- অপ্টিমাইজেশনঃওয়ার্কলোডের উপর ভিত্তি করে অভিযোজিত রাউটিং পরামিতিগুলি সুর করুন (উদাহরণস্বরূপ, বিলম্ব-সংবেদনশীল বনাম থ্রুপুট-সংবেদনশীল) । বড় এআই মডেলগুলির জন্য, ভিড় নিয়ন্ত্রণ সক্ষম করুন এবং পিএফসি ব্লকগুলি রোধ করতে বাফার সীমা সেট করুন।নিয়মিত পর্যালোচনা করুনMQM9790-NS2F দামকর্মক্ষমতা সমঝোতা যখন পরিকল্পনা ক্ষমতা সংযোজন প্রায়ই, spines আপগ্রেড আরো পাতা যোগ তুলনায় ভাল ROI yields।
মূল্যায়নকারী সংস্থাগুলির জন্যবিক্রির জন্য MQM9790-NS2F, আপনার সফ্টওয়্যার স্ট্যাক (যেমন, এনসিসিএল, ওপেনএমপিআই) SHARPv3 এবং হার্ডওয়্যার ভিত্তিক হ্রাসের মতো এনডিআর বৈশিষ্ট্যগুলি সমর্থন করে তা নিশ্চিত করুন।
6. সংক্ষিপ্ত বিবরণ এবং মূল্য মূল্যায়ন
দ্যMQM9790-NS2F ইনফিনিব্যান্ড সুইচ সমাধানএটি কম বিলম্বের, উচ্চ ব্যান্ডউইথের ফ্যাব্রিক তৈরির জন্য একটি পরিষ্কার পথ সরবরাহ করে যা RDMA/HPC/AI ক্লাস্টারগুলির জন্য প্রয়োজনীয়। এর 64-পোর্ট 400Gb/s ঘনত্ব, সাব-মাইক্রোসেকেন্ড সুইচিং,এবং ইন-নেটওয়ার্ক কম্পিউটিং ক্ষমতা সরাসরি আধুনিক ওয়ার্কলোডের স্কেলাবিলিটি এবং পারফরম্যান্সের চ্যালেঞ্জগুলি মোকাবেলা করে. উপরে বর্ণিত আর্কিটেকচার গ্রহণ করে Fat-Tree টপোলজি, NDR কোর সুইচ, এবং RDMA- নেটিভ অপারেশন ∙ সংস্থাগুলি রৈখিক জিপিইউ স্কেলিং অর্জন করতে পারে, কাজের সমাপ্তির সময় 30% এরও বেশি হ্রাস করতে পারে,বিস্তারিত পরিকল্পনার জন্য, অফিসিয়ালMQM9790-NS2F তথ্য পত্রএকটি কাস্টমাইজড নকশা নিয়ে আলোচনা করতে বাMQM9790-NS2F দামএবং প্রাপ্যতা, একটি অনুমোদিত NVIDIA অংশীদার সাথে যোগাযোগ করুন.

