NVIDIA Mellanox MQM8790-HS2F প্রযুক্তিগত সমাধান: RDMA/HPC/AI ক্লাস্টারের জন্য লো-ল্যাটেন্সি ইন্টারকানেক্ট অপ্টিমাইজেশন

April 10, 2026

NVIDIA Mellanox MQM8790-HS2F প্রযুক্তিগত সমাধান: RDMA/HPC/AI ক্লাস্টারের জন্য লো-ল্যাটেন্সি ইন্টারকানেক্ট অপ্টিমাইজেশন

এই প্রযুক্তিগত সমাধানটি নেটওয়ার্ক আর্কিটেক্ট, প্রাক বিক্রয় প্রকৌশলী এবং অপারেশন লিডের জন্য ডিজাইন করা হয়েছে। এটি আর্কিটেকচারিং, স্থাপন,এবং উচ্চ কার্যকারিতা InfiniBand কাপড় কেন্দ্রিকএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএইচপিসি এবং এআই প্রশিক্ষণ ক্লাস্টারগুলিকে লক্ষ্য করে।

1ব্যাকগ্রাউন্ড ও প্রয়োজনীয়তা বিশ্লেষণ

আধুনিক এআই প্রশিক্ষণ এবং বৈজ্ঞানিক কম্পিউটিং ক্লাস্টারগুলি ক্রমবর্ধমানভাবে নেটওয়ার্ক ইন্টারকানেকশনকে প্রাথমিক পারফরম্যান্স বোতলঘাট হিসাবে মুখোমুখি করে।লেটেনসি, এবং সিপিইউ অফলোড ক্ষমতা, যেমন সমস্ত-হ্রাস এবং সমস্ত-সব-এর মতো বিতরণ প্রশিক্ষণ যোগাযোগের নিদর্শনগুলির চাহিদা পূরণ করতে ব্যর্থ। মূল প্রয়োজনীয়তাগুলির মধ্যে রয়েছেঃসাব-মাইক্রোসেকেন্ডের শেষ থেকে শেষ লেটেন্সি,ক্ষতিহীন, ড্রপ-মুক্ত পরিবহন,জিপিইউ ডাইরেক্ট আরডিএমএ সমর্থন, এবং ক্ষমতাহাজার হাজার নোড পর্যন্ত লিনিয়ার স্কেলএই আন্তঃসংযোগ দক্ষতা চ্যালেঞ্জগুলি মৌলিকভাবে সমাধান করার জন্য একটি ডেডিকেটেড ইনফিনিব্যান্ড সুইচিং আর্কিটেকচার প্রয়োজন।

2. নেটওয়ার্ক/সিস্টেম আর্কিটেকচার ডিজাইন

এই সমাধানটি নন-ব্লকিং, পূর্ণ-বিসেকশনাল ব্যান্ডউইথ অর্জনের জন্য একটি দ্বি-স্তরীয় ফ্যাট-ট্রি টোপোলজি প্রস্তাব করে। উভয় পাতা এবং মেরুদণ্ড স্তরMQM8790-HS2F ইনফিনিব্যান্ড সুইচ, যা 200Gb / s HDR QSFP56 এর 40 টি পোর্ট সরবরাহ করে। উদাহরণস্বরূপ 512 নোডের ক্লাস্টার ব্যবহার করে নকশাটি নিম্নরূপঃ

  • পাতার স্তর: প্রতিটি এমকিউএম৮৭৯০-এইচএস২এফ ২০টি কম্পিউটারের নোড (ডুয়াল-আপলিংক) এবং ৮টি আপলিংককে মেরুদণ্ড স্তরের সাথে সংযুক্ত করে।
  • মেরুদণ্ডের স্তর: ৮টি এমকিউএম৮৭৯০-এইচএস২এফ সুইচ মেরুদণ্ডের সমতল গঠন করে, প্রতিটি পাতার এবং প্রতিটি মেরুদণ্ডের সুইচগুলির মধ্যে পূর্ণ জাল সংযোগ রয়েছে।
  • স্টোরেজ ও ম্যানেজমেন্ট নেটওয়ার্ক: কম্পিউটার ট্রাফিকের সাথে হস্তক্ষেপ এড়াতে একটি পৃথক ইনফিনিব্যান্ড সাবনেট বা আউট-অফ-ব্যান্ড ইথারনেট।

এই আর্কিটেকচারটি যে কোনও দুটি নোডের মধ্যে 200 গিগাবাইট / সেকেন্ডের ব্যান্ডউইথ গ্যারান্টি দেয়, একাধিক অতিরিক্ত পথের সাথে নিশ্চিত করে যে একটি একক ব্যর্থতা পয়েন্ট বিশ্বব্যাপী সংযোগকে প্রভাবিত করে না।এই বন্দরের উচ্চ ঘনত্বের কারণেMQM8790-HS2F 200Gb/s HDR 40-পোর্ট QSFP56পূর্ববর্তী প্রজন্মের ইডিআর সমাধানগুলির তুলনায় প্রয়োজনীয় সুইচগুলির সংখ্যা 50% হ্রাস করে, একই সাথে ফ্যাব্রিক জটিলতা হ্রাস করে।

3. এনভিআইডিআইএ মেলানোক্স এমকিউএম 8790-এইচএস 2 এফের ভূমিকা ও মূল বৈশিষ্ট্য

দ্যএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএই সমাধানের মূল সুইচিং ইউনিট হিসেবে কাজ করে, নিম্নলিখিত গুরুত্বপূর্ণ ভূমিকা পালন করেঃ

  • ক্ষতিহীন সুইচিং ইঞ্জিন: ইনফিনিব্যান্ড লিঙ্ক-লেয়ার ফ্লো কন্ট্রোল প্যাকেট ক্ষতি দূর করে, আরডিএমএ পরিবহন দক্ষতা নিশ্চিত করে।
  • অভিযোজিত রুটিং: একাধিক পথের ট্রাফিককে গতিশীলভাবে ভারসাম্যপূর্ণ করে তোলে, যানজটের হটপয়েন্ট এড়ানো এবং কার্যকর থ্রুপুট উন্নত করে।
  • SHARPv3 ইন-নেটওয়ার্ক কম্পিউটিং: সুইচ থেকে হ্রাস অপারেশন অপসারণ, 2 ¢ 3 * দ্বারা সমস্ত হ্রাস ত্বরান্বিত।
  • উচ্চ ঘনত্ব এবং কম শক্তি: 40 টি পোর্ট 200 গিগাবাইট / সেকেন্ডে শিল্পের শীর্ষস্থানীয় পোর্ট প্রতি শক্তি খরচ, TCO হ্রাস।

এর মতেMQM8790-HS2F তথ্য পত্রএবংMQM8790-HS2F স্পেসিফিকেশন, সুইচটি 16Tb / s সমষ্টিগত সুইচিং ক্ষমতা সরবরাহ করে, পোর্ট-টু-পোর্ট লেটেন্সি 130ns এর নিচে, এবং 24/7 উত্পাদন পরিবেশের জন্য হট-স্টাপেবল পাওয়ার সাপ্লাই এবং ফ্যানগুলিকে সমর্থন করে।ডিভাইসটি NVIDIA ConnectX-6/7 HDR অ্যাডাপ্টার এবং HDR অপটিক্যাল/কপার তারের বিস্তৃত পরিসরের সাথে সম্পূর্ণরূপে সামঞ্জস্যপূর্ণ, ঋণের মেয়াদ যাচাই করেMQM8790-HS2F সামঞ্জস্যপূর্ণইকোসিস্টেম।

4. ডিপ্লয়িং এবং স্কেলিং সুপারিশ (সাধারণ টপোলজি সহ)

সমাধানটি স্থাপন করার সময় এই পদক্ষেপগুলি অনুসরণ করুনঃ

  • সাবনেট ব্যবস্থাপনা: সক্রিয় স্ট্যান্ডবাই সাবনেট ম্যানেজার (এসএম) স্থাপন করুন; কেন্দ্রীয় ব্যবস্থাপনা এবং টেলিমেট্রি জন্য এনভিআইডিআইএ ইউএফএম প্ল্যাটফর্ম প্রস্তাবিত।
  • পার্টিশন এবং পরিষেবা স্তর: ভাড়াটে বা ওয়ার্কলোড বিচ্ছিন্ন করতে পার্টিশন কী (পি_কি) ব্যবহার করুন; এআই প্রশিক্ষণ ট্র্যাফিককে অগ্রাধিকার দেওয়ার জন্য SL2VL ম্যাপিং কনফিগার করুন।
  • ক্যাবল নির্বাচন: সংকেত অখণ্ডতা বজায় রাখার জন্য স্বল্প দূরত্বের জন্য (≤3m) প্যাসিভ তামার তার এবং দীর্ঘ দূরত্বের জন্য সক্রিয় অপটিক্যাল তার বা ট্রান্সিভার ব্যবহার করুন।

২,০০০ নোডের বেশি বড় ক্লাস্টারগুলির জন্য, একটি তিন স্তরের ফ্যাট-ট্রি বা ড্রাগনফ্লাই + টোপোলজি গ্রহণ করা যেতে পারে, কোর স্তরটিMQM8790-HS2Fঅতিরিক্ত ইউনিট ক্রয় করার সময়, চেক করুনMQM8790-HS2F দামএবং অনুমোদিত পরিবেশকদের মাধ্যমে উপলব্ধ; যাচাই করা হয়েছেবিক্রির জন্য MQM8790-HS2Fতালিকা সাধারণত সর্বশেষতম ফার্মওয়্যার এবং পাটা অন্তর্ভুক্ত।MQM8790-HS2F ইনফিনিব্যান্ড সুইচ সমাধানডিপার্টমেন্টাল এআই রিসার্চ থেকে শুরু করে এক্সাসকেল সুপার কম্পিউটিং সেন্টারে।

5অপারেশন, মনিটরিং, সমস্যা সমাধান ও অপ্টিমাইজেশান

ইনফিনিব্যান্ড ফ্যাব্রিকের কার্যকর অপারেশনের জন্য সক্রিয় পর্যবেক্ষণ এবং শৃঙ্খলাবদ্ধ সমস্যা সমাধানের প্রয়োজনঃ

  • পর্যবেক্ষণ: ব্যবহারআইবনেটডিস্কভারটপোলজি যাচাইয়ের জন্য,পারফেকচারপোর্ট কাউন্টারগুলির জন্য, এবং রিয়েল-টাইম ঘনত্বের দৃশ্যমানতার জন্য ইউএফএম টেলিমেট্রি।
  • সাধারণ সমস্যা ও সমাধান:
    • লিংক ফ্ল্যাপিং: ক্যাবলের আসন যাচাই করুন এবং ক্যাবলের ডায়াগনস্টিক পরীক্ষা চালান; ত্রুটিযুক্ত অপটিক্স প্রতিস্থাপন করুন।
    • সাবনেট ম্যানেজারের ব্যর্থতা: এসএম অগ্রাধিকার সঠিকভাবে কনফিগার করা হয় এবং সেকেন্ডারি এসএম একটি বৈধ ডাটাবেস আছে তা নিশ্চিত করুন।
    • অসম অভিযোজিত রুটিং: রুটিং অ্যালগরিদম প্যারামিটার সামঞ্জস্য করুন (যেমন,routing_engine=ftree) এবং লোড ছড়িয়ে দেওয়ার অনুমতি দেয়।
  • অপ্টিমাইজেশান টিপস: সমষ্টিগত ক্রিয়াকলাপের জন্য SHARP সমষ্টি সক্ষম করুন; বড় বার্তা স্থানান্তরের জন্য 4096 বাইটে এমটিইউ টিউন করুন; নিয়ন্ত্রণ, ডেটা এবং পরিচালনা ট্র্যাফিক পৃথক করতে পরিষেবা মান ব্যবহার করুন।

এনভিআইডিআইএ সাপোর্ট পোর্টালের মাধ্যমে নিয়মিত ফার্মওয়্যার আপগ্রেডগুলি সুরক্ষা প্যাচ এবং কর্মক্ষমতা উন্নতি নিশ্চিত করে।MQM8790-HS2F তথ্য পত্রবিশদ পারফরম্যান্স বেসলাইন এবং স্বাস্থ্যকর অবস্থার অধীনে প্রত্যাশিত কাউন্টার মানের জন্য।

6. সংক্ষিপ্ত বিবরণ এবং মূল্য মূল্যায়ন

দ্যএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএকটি ভবিষ্যত-প্রমাণ ইনফিনিব্যান্ড সুইচিং প্ল্যাটফর্ম সরবরাহ করে যা আরডিএমএ / এইচপিসি / এআই ক্লাস্টার আন্তঃসংযোগের মূল চ্যালেঞ্জগুলি সমাধান করেঃ বিলম্ব, ক্ষতি, সিপিইউ ওভারহেড এবং স্কেলযোগ্যতা।উপরে বর্ণিত দুই স্তরের ফ্যাট-ট্রি আর্কিটেকচার বাস্তবায়ন করে, সংস্থাগুলি লিনিয়ার পারফরম্যান্স স্কেলিং, পূর্বাভাসযোগ্য কাজের সমাপ্তির সময় এবং ঐতিহ্যবাহী ইথারনেট সমাধানগুলির তুলনায় উল্লেখযোগ্যভাবে TCO হ্রাস করতে পারে।200Gb/s HDR গতির সংমিশ্রণ, 40-পোর্ট ঘনত্ব, এবং নেটওয়ার্কের মধ্যে কম্পিউটিং ক্ষমতা এটি গ্রিনফিল্ড স্থাপনার জন্য একটি আদর্শ পছন্দ বা EDR / HDR ফ্যাব্রিক থেকে ধাপে ধাপে আপগ্রেড করে।পরবর্তী প্রজন্মের ক্লাস্টারগুলি মূল্যায়ন করার জন্য আর্কিটেকচার টিমের জন্য,MQM8790-HS2F ইনফিনিব্যান্ড সুইচ সমাধানএটি একটি পরীক্ষিত, উৎপাদন-প্রস্তুত রেফারেন্স ডিজাইন প্রদান করে।