মেলানক্স (এনভিআইডিআইএ মেলানক্স) 920-9B210-00FN-0D0 ইনফিনিব্যান্ড সুইচ প্রযুক্তিগত সমাধান

April 15, 2026

মেলানক্স (এনভিআইডিআইএ মেলানক্স) 920-9B210-00FN-0D0 ইনফিনিব্যান্ড সুইচ প্রযুক্তিগত সমাধান

1. প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ

আধুনিক AI ট্রেনিং ক্লাস্টার এবং উচ্চ-পারফরম্যান্স কম্পিউটিং (HPC) পরিবেশগুলি একটি সাধারণ স্কেলিং চ্যালেঞ্জের মুখোমুখি: GPU গণনা এবং গণনা ঘনত্ব বৃদ্ধির কারণে, TCP/IP ওভারহেড, প্যাকেটের ক্ষতি এবং অপ্রত্যাশিত টেল লেটেন্সির কারণে প্রথাগত ইথারনেট কাপড় প্রাথমিক বাধা হয়ে দাঁড়িয়েছে। RDMA (রিমোট ডাইরেক্ট মেমরি অ্যাক্সেস) এর উপর নির্ভরশীল কাজের চাপের জন্য, এমনকি মাইক্রোসেকেন্ড-স্তরের জিটার কার্যকর GPU ব্যবহার 30-40% কমিয়ে দিতে পারে। দMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0InfiniBand সুইচ সরাসরি এই চ্যালেঞ্জ মোকাবেলা করে একটি ক্ষতিহীন, নির্ধারক ফ্যাব্রিক সরবরাহ করে যা যৌথ ক্রিয়াকলাপের জন্য অপ্টিমাইজ করা, সব-কমানোর অ্যালগরিদম এবং উচ্চ-ফ্রিকোয়েন্সি MPI যোগাযোগের জন্য।

পরবর্তী প্রজন্মের AI/HPC নেটওয়ার্কগুলির জন্য মূল প্রয়োজনীয়তাগুলির মধ্যে রয়েছে: সাব-মাইক্রোসেকেন্ড সুইচিং লেটেন্সি, 400Gb/s NDR গতির জন্য সমর্থন, হার্ডওয়্যার-ভিত্তিক ইন-নেটওয়ার্ক কম্পিউটিং (SHARP v2), এবং বিদ্যমান HDR পরিকাঠামোর সাথে বিরামহীন পশ্চাদগামী সামঞ্জস্য। দ920-9B210-00FN-0D0এন্টারপ্রাইজ-গ্রেড পরিচালনাযোগ্যতা এবং টেলিমেট্রি অফার করার সময় এই সমস্ত মানদণ্ড পূরণ করে।

2. সামগ্রিক নেটওয়ার্ক এবং সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত স্থাপত্যগুলি একটি দ্বি-স্তর-ফ্যাট-ট্রি (মেরুদন্ড-পাতা) টপোলজিতে কেন্দ্র করে, যা বিতরণ করা প্রশিক্ষণে সাধারণভাবে সমস্ত-টু-অল যোগাযোগের ধরণগুলির জন্য সম্পূর্ণ দ্বিখণ্ডিত ব্যান্ডউইথ এবং নির্ধারক লেটেন্সি প্রদান করে। মেরুদণ্ডের স্তর গঠিতNVIDIA Mellanox 920-9B210-00FN-0D0সুইচ, প্রতিটি এনডিআর ফ্যাব্রিক মেরুদণ্ড হিসাবে কাজ করে। পাতার সুইচগুলি (যেমন, QM9700 সিরিজ) ConnectX-7 বা BlueField-3 অ্যাডাপ্টারের মাধ্যমে কম্পিউট নোডের সাথে সংযোগ করে, যখন মেরুদণ্ডের আপলিঙ্কগুলি 400Gb/s NDR গতিতে চলে।

2,000 GPU-এর বেশি বড় আকারের স্থাপনার জন্য, একটি তিন-স্তরের আর্কিটেকচার (কোর-এগ্রিগ্রেশন-অ্যাক্সেস) প্রয়োগ করা যেতে পারে,920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRমূল এবং একত্রীকরণ উভয় সুইচ হিসাবে পরিবেশন করা ইউনিট। এই ডিজাইনটি লিনিয়ার পারফরম্যান্স স্কেলিং নিশ্চিত করে এবং ফর্কলিফ্ট আপগ্রেডের প্রয়োজন ছাড়াই NDR200 (800Gb/s) তে ভবিষ্যতের সম্প্রসারণকে সমর্থন করে। কর্মকর্তা920-9B210-00FN-0D0 InfiniBand সুইচ OPNমাল্টি-সাইট সংগ্রহকে সহজ করে এবং পুরো ফ্যাব্রিক জুড়ে ফার্মওয়্যারের ধারাবাহিকতা নিশ্চিত করে।

3. সমাধানে 920-9B210-00FN-0D0 এর ভূমিকা ও মূল বৈশিষ্ট্য

920-9B210-00FN-0D0ইনফিনিব্যান্ড ফ্যাব্রিকের মধ্যে উচ্চ-কার্যক্ষমতা সম্পন্ন মেরুদণ্ড/মূল উপাদান হিসেবে কাজ করে। এর মূল ক্ষমতাগুলির মধ্যে রয়েছে:

  • 400Gb/s NDR পোর্টের ঘনত্ব:প্রতিটি920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRসুইচ 32 400Gb/s পর্যন্ত পোর্ট সরবরাহ করে, 500 মিটার পর্যন্ত নমনীয় ক্যাবলিংয়ের জন্য তামা এবং অপটিক্যাল ট্রান্সসিভার উভয়কেই সমর্থন করে (একক-মোড)।
  • ইন-নেটওয়ার্ক কম্পিউটিং (SHARP v2):হার্ডওয়্যার-এক্সিলারেটেড অল-রিডুস ক্রিয়াকলাপগুলি AI প্রশিক্ষণের কাজের চাপের জন্য যৌথ যোগাযোগের সময়কে 8x পর্যন্ত কমিয়ে দেয়, সরাসরি GPU ব্যবহার উন্নত করে।
  • অভিযোজিত রাউটিং এবং যানজট নিয়ন্ত্রণ:গতিশীল পথ নির্বাচন হটস্পট গঠন এড়ায় এবং ইনকাস্ট ট্র্যাফিক প্যাটার্নের অধীনে নির্ধারক লেটেন্সি নিশ্চিত করে।
  • RDMA ওভার কনভার্জড ইথারনেট (RoCE) বিকল্প:RoCE এর বিপরীতে, নেটিভ ইনফিনিব্যান্ড920-9B210-00FN-0D0কোনো PFC কনফিগারেশনের প্রয়োজন নেই এবং 95% লিঙ্ক ব্যবহারেও ধারাবাহিক কর্মক্ষমতা প্রদান করে।

প্রকৌশলীরা পরামর্শ করতে পারেন920-9B210-00FN-0D0 ডেটাশিটএবং920-9B210-00FN-0D0 স্পেসিফিকেশনবিস্তারিত পাওয়ারের জন্য (সাধারণত 350W), তাপ, এবং লেটেন্সি পরিসংখ্যান (সাব-200ns স্যুইচিং বিলম্ব)। সুইচ সম্পূর্ণরূপে920-9B210-00FN-0D0 সামঞ্জস্যপূর্ণসমস্ত প্রধান NVIDIA InfiniBand এন্ডপয়েন্ট এবং তৃতীয় পক্ষের NDR অপটিক্স সহ।

4. স্থাপনা এবং স্কেলিং সুপারিশ (টপোলজি উদাহরণ)

ছোট ক্লাস্টার (128-256 GPU):2x এর একক মেরুদণ্ড920-9B210-00FN-0D0সুইচ, প্রতিটি 8-16টি পাতার সুইচের সাথে সংযুক্ত। সম্পূর্ণ দ্বিখণ্ডিত ব্যান্ডউইথ এবং রিডানডেন্সি প্রদান করে।মাঝারি ক্লাস্টার (512-1024 GPUs):একটি নন-ব্লকিং কনফিগারেশনে চারটি মেরুদণ্ডের সুইচ, প্রতিটি পাতার সুইচের সাথে 4টি আপলিঙ্ক রয়েছে (প্রতি মেরুদণ্ডে 2টি)। এই টপোলজি নিশ্চিত করে যে কোনো একক লিঙ্ক সর্বোচ্চ ট্র্যাফিকের অধীনে 80% এর বেশি ব্যবহার না করে।বড় ক্লাস্টার (2048+ GPU):8x এর কোর স্তরNVIDIA Mellanox 920-9B210-00FN-0D0সুইচ, একই মডেল ব্যবহার করে একত্রিত স্তর, এবং QM9700 সিরিজের সাথে অ্যাক্সেস স্তর। ঐচ্ছিক NDR200 প্রস্তুতি সহ 400Gb/s NDR-এ সমস্ত আন্তঃসংযোগ।

খরচ মূল্যায়ন প্রতিষ্ঠানের জন্য,920-9B210-00FN-0D0 মূল্যমালিকানার মোট খরচ (TCO) ফ্যাক্টর করার সময় উচ্চ-সম্পদ ইথারনেট সুইচগুলির বিরুদ্ধে প্রতিযোগিতামূলকভাবে অবস্থান করা হয়। ইউনিট হিসাবে উপলব্ধ920-9B210-00FN-0D0 বিক্রয়ের জন্যNVIDIA এর অনুমোদিত বিতরণ নেটওয়ার্কের মাধ্যমে, সাধারণত 4-6 সপ্তাহের লিড টাইম সহ।

5. অপারেশন, মনিটরিং, ট্রাবলশুটিং এবং অপ্টিমাইজেশান

ব্যবস্থাপনা NVIDIA ইউনিফাইড ফ্যাব্রিক ম্যানেজার (UFM) এর মাধ্যমে কেন্দ্রীভূত হয়, যা রিয়েল-টাইম টেলিমেট্রি, ভবিষ্যদ্বাণীমূলক ব্যর্থতা বিশ্লেষণ এবং স্বয়ংক্রিয় প্রতিকার প্রদান করে। জন্য কী অপারেশনাল অনুশীলন920-9B210-00FN-0D0 InfiniBand সুইচ OPN সমাধানঅন্তর্ভুক্ত:

  • কর্মক্ষমতা বেসলাইন:মাইক্রো-বার্স্ট সনাক্ত করতে UFM এর লেটেন্সি হিটম্যাপ ব্যবহার করুন। দ920-9B210-00FN-0D0 স্পেসিফিকেশনECN চিহ্ন এবং বাফার দখলের জন্য হার্ডওয়্যার কাউন্টার নিশ্চিত করুন।
  • ফার্মওয়্যার ব্যবস্থাপনা:একই NDR ফার্মওয়্যার শাখায় সমস্ত ইউনিট বজায় রাখুন। দ920-9B210-00FN-0D0 ডেটাশিটConnectX-7 এবং BlueField-3 এর জন্য একটি সামঞ্জস্যতা ম্যাট্রিক্স অন্তর্ভুক্ত।
  • দোষ পরিস্থিতি:অপ্রয়োজনীয় পাওয়ার সাপ্লাই এবং ফ্যান মডিউল N+1 রিডানডেন্সির জন্য অনুমতি দেয়। UFM স্বয়ংক্রিয়ভাবে ব্যর্থ লিঙ্ক বা সুইচের চারপাশে ট্র্যাফিককে পুনরায় রুট করতে পারে।
  • অপ্টিমাইজেশন টিপস:সমস্ত মেরুদণ্ডের পোর্টে অভিযোজিত রাউটিং সক্ষম করুন; বিশ্বব্যাপী বিরতি ফ্রেম নিষ্ক্রিয়; সমস্ত-কমানোর-নিবিড় কাজের চাপের জন্য SHARP কনফিগার করুন; ব্যবহার করুন920-9B210-00FN-0D0 InfiniBand সুইচ OPNভৌত পোর্টগুলিকে যৌক্তিক ভূমিকায় ম্যাপ করতে শনাক্তকারী।

6. সারাংশ এবং মূল্য মূল্যায়ন

Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0উচ্চ-পারফরম্যান্স এআই এবং এইচপিসি কাপড়ের জন্য একটি ভিত্তিগত বিল্ডিং ব্লকের প্রতিনিধিত্ব করে। 400Gb/s NDR ব্যান্ডউইথ, সাব-মাইক্রোসেকেন্ড সুইচিং লেটেন্সি, এবং SHARP v2 ইন-নেটওয়ার্ক কম্পিউটিং প্রদান করে, এটি নেটওয়ার্কের বাধাগুলি দূর করে যা সাধারণত GPU স্কেলিং সীমাবদ্ধ করে। দ920-9B210-00FN-0D0এটি নিছক একটি সুইচ নয় - এটি একটি সম্পূর্ণ920-9B210-00FN-0D0 InfiniBand সুইচ OPN সমাধানযেটিতে বিদ্যমান HDR পরিকাঠামোর সাথে সম্পূর্ণ সামঞ্জস্যতা, UFM-এর মাধ্যমে এন্টারপ্রাইজ-গ্রেড পরিচালনাযোগ্যতা এবং ভবিষ্যতের NDR200 গতিতে একটি পরিষ্কার মাইগ্রেশন পথ অন্তর্ভুক্ত রয়েছে। নেটওয়ার্ক আর্কিটেক্ট এবং আইটি ম্যানেজারদের জন্য যারা RDMA/HPC/AI ক্লাস্টার ইন্টারকানেক্ট পারফরম্যান্সকে অপ্টিমাইজ করতে চাইছেন, এই সুইচটি উচ্চতর GPU ব্যবহার, কম কাজ শেষ করার সময় এবং নিম্ন অপারেশনাল ওভারহেডের মাধ্যমে পরিমাপযোগ্য ROI প্রদান করে।

মূল স্পেসিফিকেশন রেফারেন্স

প্যারামিটার মান
মডেল NVIDIA Mellanox 920-9B210-00FN-0D0
ডেটা রেট 400Gb/s NDR (প্রতি পোর্ট)
বেস OPN 920-9B210-00FN-0D0 InfiniBand সুইচ OPN
সম্পূর্ণ কনফিগারেশন 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR
সুইচিং লেটেন্সি <200ns
শক্তি খরচ ~350W (সাধারণ)