Mellanox (NVIDIA) MQM9790-NS2F InfiniBand স্যুইচ ইন অ্যাকশন | RDMA/HPC/AI-এর জন্য লো-লেটেন্সি ইন্টারকানেক্ট অপ্টিমাইজেশান

May 28, 2026

Mellanox (NVIDIA) MQM9790-NS2F InfiniBand স্যুইচ ইন অ্যাকশন | RDMA/HPC/AI-এর জন্য লো-লেটেন্সি ইন্টারকানেক্ট অপ্টিমাইজেশান

যেহেতু বড় আকারের এআই প্রশিক্ষণ ক্লাস্টার এবং উচ্চ-পারফরম্যান্স কম্পিউটিং (এইচপিসি) কেন্দ্রগুলি নেটওয়ার্ক ব্যান্ডউইথ এবং লেটেন্সির প্রয়োজনীয়তাকে অভূতপূর্ব স্তরে নিয়ে যায়,ঐতিহ্যবাহী ইথারনেট সমাধান ক্রমবর্ধমান RDMA ওয়ার্কলোড অধীনে ঘনত্ব নিয়ন্ত্রণ এবং অনির্দেশ্য লেটেনসি সঙ্গে সংগ্রামএকটি নেতৃস্থানীয় জাতীয় সুপারকম্পিউটিং কেন্দ্র সম্প্রতি তার পরবর্তী প্রজন্মের জিপিইউ ক্লাস্টার আপগ্রেড করার সময় ঠিক এই চ্যালেঞ্জের মুখোমুখি হয়েছিল। একাধিক আন্তঃসংযোগ বিকল্পের মূল্যায়ন করার পরে, দলটিমেলানক্স (এনভিআইডিআইএ) এমকিউএম৯৭৯০-এনএস২এফএই সিদ্ধান্ত তাদের ক্লাস্টারগুলির পারফরম্যান্স প্রোফাইলকে মৌলিকভাবে রূপান্তরিত করে।

পটভূমি ও চ্যালেঞ্জঃ স্কেলাবিলিটি ওয়াল

সুপারকম্পিউটিং সেন্টার এর বিদ্যমান এইচডিআর ইনফিনিব্যান্ড ফ্যাব্রিক প্রায় স্যাচুরেশনে কাজ করছিল।সমষ্টিগত যোগাযোগের অপারেশন যেমন-অল-রেডুস এবং-অল-টু-অল-এর মত অপারেশনগুলোতে উল্লেখযোগ্য লেটেনসি স্পাইক দেখা গেছে।নেটওয়ার্কটি প্রধান বোতলঘাট হয়ে উঠেছে, যার ফলে জিপিইউর অলটাইম সময় নষ্ট হচ্ছে যা কম্পিউটিং রিসোর্স এবং শক্তি উভয়ই নষ্ট করে।প্রকৌশলীরা অনুমান করেছেন যে প্রায় 30% গণনা চক্রগুলি বড় আকারের বিতরণ প্রশিক্ষণ রানগুলির সময় যোগাযোগের ওভারহেডের কারণে হারিয়ে গেছে.

দলের যা দরকার ছিল তা ছিল একটি সুইচ যাপোর্ট প্রতি 400 গিগাবাইট/সেকেন্ডএইচডিআর নেটওয়ার্কের সাথে পূর্ববর্তী সামঞ্জস্যতা বজায় রেখে, নেটিভ আরডিএমএ সমর্থন এবং নেটওয়ার্ক কম্পিউটিং ত্বরণ।MQM9790-NS2F তথ্য পত্রএবংMQM9790-NS2F স্পেসিফিকেশন, তারা সিদ্ধান্ত নিয়েছে যেMQM9790-NS2F ইনফিনিব্যান্ড সুইচএটি ঘনত্ব, কর্মক্ষমতা এবং বৈশিষ্ট্য সেটের আদর্শ ভারসাম্য প্রদান করে।

সমাধান ও বাস্তবায়নঃ একটি 64-পোর্ট এনডিআর ফ্যাব্রিক আপগ্রেড

কেন্দ্র চারটিMQM9790-NS2F 400Gb/s NDR 64-পোর্ট OSFPএকটি স্পিন-লেফ টোপোলজিতে সুইচ করে, 64 টি কম্পিউটিং নোড জুড়ে 2,048 জিপিইউকে আন্তঃসংযোগ করে। প্রতিটি নোড একটি একক OSFP-to-4x100Gb/s স্প্লিটার ক্যাবলের মাধ্যমে সংযোগ করে,ক্যাবল ম্যানেজমেন্ট ঘনত্ব অপ্টিমাইজ করার সময় প্রতি সার্ভারে 400Gb / s সমষ্টিগত ব্যান্ডউইথ সরবরাহ করে.

ডিপ্লয়িং প্যারামিটার কনফিগারেশন
সুইচ মডেল এনভিডিয়া মেলানোক্স এমকিউএম৯৭৯০-এনএস২এফ(4 ইউনিট)
পোর্ট কনফিগারেশন 64x OSFP, 400Gb/s NDR প্রতি পোর্টে
মোট GPU 2,048 (NVIDIA H100)
নেটওয়ার্কের বৈশিষ্ট্য SHARPv3, অ্যাডাপ্টিভ রাউটিং, জ্যাম কন্ট্রোল

এই কর্মসূচির মূল লক্ষ্য ছিল সম্পূর্ণMQM9790-NS2F সামঞ্জস্যপূর্ণবিদ্যমান এইচডিআর এন্ডপয়েন্ট অ্যাডাপ্টারের সাথে অপারেশন। The switch’s automatic speed negotiation and link-layer translation allowed a phased migration strategy — legacy nodes operate at HDR speeds while new NDR-capable servers leverage full 400Gb/s bandwidthকেন্দ্রটি SHARPv3 ইন-নেটওয়ার্ক সমষ্টি ব্যবহার করে, এলএলএম প্রশিক্ষণে সাধারণভাবে পাওয়া বড় বার্তার আকারের জন্য 65% এরও বেশি ট্র্যাফিক হ্রাস করে।

যারা অনুরূপ আপগ্রেডের মূল্যায়ন করছেন,MQM9790-NS2F দামঅনুসন্ধান এবংবিক্রির জন্য MQM9790-NS2Fএগুলি ব্যবসায়িক এবং গবেষণা গ্রাহকদের মধ্যে উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে।স্যুইচটির প্রতিযোগিতামূলক মোট মালিকানার খরচ ৬৪টি পোর্টের ঘনত্বের কারণে কম স্যুইচ গণনা করে এটি নতুন বিল্ড এবং রিফ্রেশ প্রকল্প উভয়ের জন্য আকর্ষণীয় বিকল্প করে তোলে.

ফলাফল ও উপকারিতাঃ পরিমাপযোগ্য কর্মক্ষমতা লাভ

  • অল-রেডুয়েট লেটেন্সি (১ জিবি মেসেজ):৪৮ মাইক্রো সেকেন্ড থেকে ১৯ মাইক্রো সেকেন্ডে হ্রাস (৬০% উন্নতি)
  • কার্যকর জিপিইউ ব্যবহারঃবড় আকারের প্রশিক্ষণের সময় 71% থেকে 93% বৃদ্ধি
  • কাজের সমাপ্তির সময় (GPT-3 175B সমতুল্য):৪১% কমেছে
  • নেটওয়ার্ক-প্ররোচিত লেটেনসি (৯৯তম পার্সেনটাইল):210μs থেকে 35μs এর নিচে কাটা

যেমন একটিMQM9790-NS2F ইনফিনিব্যান্ড সুইচ সমাধান, স্থাপনটি দেখিয়েছে যে 400Gb/s এনডিআর ফ্যাব্রিকগুলি তাদের তাত্ত্বিক প্রতিশ্রুতিগুলি প্রদান করতে পারে।জ্যাম কন্ট্রোল অ্যালগরিদম এবং অভিযোজিত রাউটিং এর সমন্বয় "ইনকাস্ট" পতন প্যাটার্নগুলি দূর করেছে যা পূর্ববর্তী এইচডিআর ফ্যাব্রিককে সমস্ত-সব যোগাযোগের পর্যায়ে আঘাত করেছিল.

সংক্ষিপ্ত বিবরণ এবং দৃষ্টিভঙ্গিঃ এক্সাসকেল এআই এর জন্য একটি ভিত্তি

সুপারকম্পিউটিং সেন্টারের সাফল্যMQM9790-NS2Fতারা এখন দ্বিতীয় ধাপের পরিকল্পনা করছে যা অতিরিক্ত ব্যবহার করে জিপিইউ সংখ্যা দ্বিগুণ করে ৪,০৯৬ করবে।MQM9790-NS2F 400Gb/s NDR 64-পোর্ট OSFPসুইচগুলি একটি তিন স্তরের ফ্যাট-ট্রি টোপোলজিতে রয়েছে। সুইচগুলির টেলিমেট্রি এবং ব্যান্ডের বাইরে পরিচালনার বৈশিষ্ট্যগুলি পূর্বাভাসমূলক ঘনত্ব এড়াতে সক্ষম করেছে,নেটওয়ার্ক টিমের জন্য অপারেটিং ওভারহেড হ্রাস করা.

নেটওয়ার্ক আর্কিটেক্ট এবং আইটি ম্যানেজারদের জন্য পরবর্তী প্রজন্মের ফ্যাব্রিকগুলি মূল্যায়ন করার জন্য,এনভিডিয়া মেলানোক্স এমকিউএম৯৭৯০-এনএস২এফএটি একটি পরিপক্ক, উৎপাদন-প্রমাণিত সমাধান। আপনি একটি নতুন এআই গবেষণা ক্লাস্টার তৈরি করছেন বা একটি বিদ্যমান এইচপিসি সুবিধা আপগ্রেড করছেন কিনা, এই সুইচটি কম বিলম্বের সরবরাহ করে,আধুনিক সমান্তরাল ওয়ার্কলোডের জন্য উচ্চ ব্যান্ডউইথ ভিত্তি প্রয়োজন.