মেলানক্স (এনভিআইডিআইএ মেলানক্স) 920-9B210-00FN-0D0 ইনফিনিব্যান্ড সুইচ প্রযুক্তিগত সমাধান
April 15, 2026
1. প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ
আধুনিক AI ট্রেনিং ক্লাস্টার এবং উচ্চ-পারফরম্যান্স কম্পিউটিং (HPC) পরিবেশগুলি একটি সাধারণ স্কেলিং চ্যালেঞ্জের মুখোমুখি: GPU গণনা এবং গণনা ঘনত্ব বৃদ্ধির কারণে, TCP/IP ওভারহেড, প্যাকেটের ক্ষতি এবং অপ্রত্যাশিত টেল লেটেন্সির কারণে প্রথাগত ইথারনেট কাপড় প্রাথমিক বাধা হয়ে দাঁড়িয়েছে। RDMA (রিমোট ডাইরেক্ট মেমরি অ্যাক্সেস) এর উপর নির্ভরশীল কাজের চাপের জন্য, এমনকি মাইক্রোসেকেন্ড-স্তরের জিটার কার্যকর GPU ব্যবহার 30-40% কমিয়ে দিতে পারে। দMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0InfiniBand সুইচ সরাসরি এই চ্যালেঞ্জ মোকাবেলা করে একটি ক্ষতিহীন, নির্ধারক ফ্যাব্রিক সরবরাহ করে যা যৌথ ক্রিয়াকলাপের জন্য অপ্টিমাইজ করা, সব-কমানোর অ্যালগরিদম এবং উচ্চ-ফ্রিকোয়েন্সি MPI যোগাযোগের জন্য।
পরবর্তী প্রজন্মের AI/HPC নেটওয়ার্কগুলির জন্য মূল প্রয়োজনীয়তাগুলির মধ্যে রয়েছে: সাব-মাইক্রোসেকেন্ড সুইচিং লেটেন্সি, 400Gb/s NDR গতির জন্য সমর্থন, হার্ডওয়্যার-ভিত্তিক ইন-নেটওয়ার্ক কম্পিউটিং (SHARP v2), এবং বিদ্যমান HDR পরিকাঠামোর সাথে বিরামহীন পশ্চাদগামী সামঞ্জস্য। দ920-9B210-00FN-0D0এন্টারপ্রাইজ-গ্রেড পরিচালনাযোগ্যতা এবং টেলিমেট্রি অফার করার সময় এই সমস্ত মানদণ্ড পূরণ করে।
2. সামগ্রিক নেটওয়ার্ক এবং সিস্টেম আর্কিটেকচার ডিজাইন
প্রস্তাবিত স্থাপত্যগুলি একটি দ্বি-স্তর-ফ্যাট-ট্রি (মেরুদন্ড-পাতা) টপোলজিতে কেন্দ্র করে, যা বিতরণ করা প্রশিক্ষণে সাধারণভাবে সমস্ত-টু-অল যোগাযোগের ধরণগুলির জন্য সম্পূর্ণ দ্বিখণ্ডিত ব্যান্ডউইথ এবং নির্ধারক লেটেন্সি প্রদান করে। মেরুদণ্ডের স্তর গঠিতNVIDIA Mellanox 920-9B210-00FN-0D0সুইচ, প্রতিটি এনডিআর ফ্যাব্রিক মেরুদণ্ড হিসাবে কাজ করে। পাতার সুইচগুলি (যেমন, QM9700 সিরিজ) ConnectX-7 বা BlueField-3 অ্যাডাপ্টারের মাধ্যমে কম্পিউট নোডের সাথে সংযোগ করে, যখন মেরুদণ্ডের আপলিঙ্কগুলি 400Gb/s NDR গতিতে চলে।
2,000 GPU-এর বেশি বড় আকারের স্থাপনার জন্য, একটি তিন-স্তরের আর্কিটেকচার (কোর-এগ্রিগ্রেশন-অ্যাক্সেস) প্রয়োগ করা যেতে পারে,920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRমূল এবং একত্রীকরণ উভয় সুইচ হিসাবে পরিবেশন করা ইউনিট। এই ডিজাইনটি লিনিয়ার পারফরম্যান্স স্কেলিং নিশ্চিত করে এবং ফর্কলিফ্ট আপগ্রেডের প্রয়োজন ছাড়াই NDR200 (800Gb/s) তে ভবিষ্যতের সম্প্রসারণকে সমর্থন করে। কর্মকর্তা920-9B210-00FN-0D0 InfiniBand সুইচ OPNমাল্টি-সাইট সংগ্রহকে সহজ করে এবং পুরো ফ্যাব্রিক জুড়ে ফার্মওয়্যারের ধারাবাহিকতা নিশ্চিত করে।
3. সমাধানে 920-9B210-00FN-0D0 এর ভূমিকা ও মূল বৈশিষ্ট্য
দ920-9B210-00FN-0D0ইনফিনিব্যান্ড ফ্যাব্রিকের মধ্যে উচ্চ-কার্যক্ষমতা সম্পন্ন মেরুদণ্ড/মূল উপাদান হিসেবে কাজ করে। এর মূল ক্ষমতাগুলির মধ্যে রয়েছে:
- 400Gb/s NDR পোর্টের ঘনত্ব:প্রতিটি920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRসুইচ 32 400Gb/s পর্যন্ত পোর্ট সরবরাহ করে, 500 মিটার পর্যন্ত নমনীয় ক্যাবলিংয়ের জন্য তামা এবং অপটিক্যাল ট্রান্সসিভার উভয়কেই সমর্থন করে (একক-মোড)।
- ইন-নেটওয়ার্ক কম্পিউটিং (SHARP v2):হার্ডওয়্যার-এক্সিলারেটেড অল-রিডুস ক্রিয়াকলাপগুলি AI প্রশিক্ষণের কাজের চাপের জন্য যৌথ যোগাযোগের সময়কে 8x পর্যন্ত কমিয়ে দেয়, সরাসরি GPU ব্যবহার উন্নত করে।
- অভিযোজিত রাউটিং এবং যানজট নিয়ন্ত্রণ:গতিশীল পথ নির্বাচন হটস্পট গঠন এড়ায় এবং ইনকাস্ট ট্র্যাফিক প্যাটার্নের অধীনে নির্ধারক লেটেন্সি নিশ্চিত করে।
- RDMA ওভার কনভার্জড ইথারনেট (RoCE) বিকল্প:RoCE এর বিপরীতে, নেটিভ ইনফিনিব্যান্ড920-9B210-00FN-0D0কোনো PFC কনফিগারেশনের প্রয়োজন নেই এবং 95% লিঙ্ক ব্যবহারেও ধারাবাহিক কর্মক্ষমতা প্রদান করে।
প্রকৌশলীরা পরামর্শ করতে পারেন920-9B210-00FN-0D0 ডেটাশিটএবং920-9B210-00FN-0D0 স্পেসিফিকেশনবিস্তারিত পাওয়ারের জন্য (সাধারণত 350W), তাপ, এবং লেটেন্সি পরিসংখ্যান (সাব-200ns স্যুইচিং বিলম্ব)। সুইচ সম্পূর্ণরূপে920-9B210-00FN-0D0 সামঞ্জস্যপূর্ণসমস্ত প্রধান NVIDIA InfiniBand এন্ডপয়েন্ট এবং তৃতীয় পক্ষের NDR অপটিক্স সহ।
4. স্থাপনা এবং স্কেলিং সুপারিশ (টপোলজি উদাহরণ)
ছোট ক্লাস্টার (128-256 GPU):2x এর একক মেরুদণ্ড920-9B210-00FN-0D0সুইচ, প্রতিটি 8-16টি পাতার সুইচের সাথে সংযুক্ত। সম্পূর্ণ দ্বিখণ্ডিত ব্যান্ডউইথ এবং রিডানডেন্সি প্রদান করে।মাঝারি ক্লাস্টার (512-1024 GPUs):একটি নন-ব্লকিং কনফিগারেশনে চারটি মেরুদণ্ডের সুইচ, প্রতিটি পাতার সুইচের সাথে 4টি আপলিঙ্ক রয়েছে (প্রতি মেরুদণ্ডে 2টি)। এই টপোলজি নিশ্চিত করে যে কোনো একক লিঙ্ক সর্বোচ্চ ট্র্যাফিকের অধীনে 80% এর বেশি ব্যবহার না করে।বড় ক্লাস্টার (2048+ GPU):8x এর কোর স্তরNVIDIA Mellanox 920-9B210-00FN-0D0সুইচ, একই মডেল ব্যবহার করে একত্রিত স্তর, এবং QM9700 সিরিজের সাথে অ্যাক্সেস স্তর। ঐচ্ছিক NDR200 প্রস্তুতি সহ 400Gb/s NDR-এ সমস্ত আন্তঃসংযোগ।
খরচ মূল্যায়ন প্রতিষ্ঠানের জন্য,920-9B210-00FN-0D0 মূল্যমালিকানার মোট খরচ (TCO) ফ্যাক্টর করার সময় উচ্চ-সম্পদ ইথারনেট সুইচগুলির বিরুদ্ধে প্রতিযোগিতামূলকভাবে অবস্থান করা হয়। ইউনিট হিসাবে উপলব্ধ920-9B210-00FN-0D0 বিক্রয়ের জন্যNVIDIA এর অনুমোদিত বিতরণ নেটওয়ার্কের মাধ্যমে, সাধারণত 4-6 সপ্তাহের লিড টাইম সহ।
5. অপারেশন, মনিটরিং, ট্রাবলশুটিং এবং অপ্টিমাইজেশান
ব্যবস্থাপনা NVIDIA ইউনিফাইড ফ্যাব্রিক ম্যানেজার (UFM) এর মাধ্যমে কেন্দ্রীভূত হয়, যা রিয়েল-টাইম টেলিমেট্রি, ভবিষ্যদ্বাণীমূলক ব্যর্থতা বিশ্লেষণ এবং স্বয়ংক্রিয় প্রতিকার প্রদান করে। জন্য কী অপারেশনাল অনুশীলন920-9B210-00FN-0D0 InfiniBand সুইচ OPN সমাধানঅন্তর্ভুক্ত:
- কর্মক্ষমতা বেসলাইন:মাইক্রো-বার্স্ট সনাক্ত করতে UFM এর লেটেন্সি হিটম্যাপ ব্যবহার করুন। দ920-9B210-00FN-0D0 স্পেসিফিকেশনECN চিহ্ন এবং বাফার দখলের জন্য হার্ডওয়্যার কাউন্টার নিশ্চিত করুন।
- ফার্মওয়্যার ব্যবস্থাপনা:একই NDR ফার্মওয়্যার শাখায় সমস্ত ইউনিট বজায় রাখুন। দ920-9B210-00FN-0D0 ডেটাশিটConnectX-7 এবং BlueField-3 এর জন্য একটি সামঞ্জস্যতা ম্যাট্রিক্স অন্তর্ভুক্ত।
- দোষ পরিস্থিতি:অপ্রয়োজনীয় পাওয়ার সাপ্লাই এবং ফ্যান মডিউল N+1 রিডানডেন্সির জন্য অনুমতি দেয়। UFM স্বয়ংক্রিয়ভাবে ব্যর্থ লিঙ্ক বা সুইচের চারপাশে ট্র্যাফিককে পুনরায় রুট করতে পারে।
- অপ্টিমাইজেশন টিপস:সমস্ত মেরুদণ্ডের পোর্টে অভিযোজিত রাউটিং সক্ষম করুন; বিশ্বব্যাপী বিরতি ফ্রেম নিষ্ক্রিয়; সমস্ত-কমানোর-নিবিড় কাজের চাপের জন্য SHARP কনফিগার করুন; ব্যবহার করুন920-9B210-00FN-0D0 InfiniBand সুইচ OPNভৌত পোর্টগুলিকে যৌক্তিক ভূমিকায় ম্যাপ করতে শনাক্তকারী।
6. সারাংশ এবং মূল্য মূল্যায়ন
দMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0উচ্চ-পারফরম্যান্স এআই এবং এইচপিসি কাপড়ের জন্য একটি ভিত্তিগত বিল্ডিং ব্লকের প্রতিনিধিত্ব করে। 400Gb/s NDR ব্যান্ডউইথ, সাব-মাইক্রোসেকেন্ড সুইচিং লেটেন্সি, এবং SHARP v2 ইন-নেটওয়ার্ক কম্পিউটিং প্রদান করে, এটি নেটওয়ার্কের বাধাগুলি দূর করে যা সাধারণত GPU স্কেলিং সীমাবদ্ধ করে। দ920-9B210-00FN-0D0এটি নিছক একটি সুইচ নয় - এটি একটি সম্পূর্ণ920-9B210-00FN-0D0 InfiniBand সুইচ OPN সমাধানযেটিতে বিদ্যমান HDR পরিকাঠামোর সাথে সম্পূর্ণ সামঞ্জস্যতা, UFM-এর মাধ্যমে এন্টারপ্রাইজ-গ্রেড পরিচালনাযোগ্যতা এবং ভবিষ্যতের NDR200 গতিতে একটি পরিষ্কার মাইগ্রেশন পথ অন্তর্ভুক্ত রয়েছে। নেটওয়ার্ক আর্কিটেক্ট এবং আইটি ম্যানেজারদের জন্য যারা RDMA/HPC/AI ক্লাস্টার ইন্টারকানেক্ট পারফরম্যান্সকে অপ্টিমাইজ করতে চাইছেন, এই সুইচটি উচ্চতর GPU ব্যবহার, কম কাজ শেষ করার সময় এবং নিম্ন অপারেশনাল ওভারহেডের মাধ্যমে পরিমাপযোগ্য ROI প্রদান করে।
মূল স্পেসিফিকেশন রেফারেন্স
| প্যারামিটার | মান |
|---|---|
| মডেল | NVIDIA Mellanox 920-9B210-00FN-0D0 |
| ডেটা রেট | 400Gb/s NDR (প্রতি পোর্ট) |
| বেস OPN | 920-9B210-00FN-0D0 InfiniBand সুইচ OPN |
| সম্পূর্ণ কনফিগারেশন | 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR |
| সুইচিং লেটেন্সি | <200ns |
| শক্তি খরচ | ~350W (সাধারণ) |

