NVIDIA Mellanox MQM8790-HS2F প্রযুক্তিগত সমাধান: RDMA/HPC/AI ক্লাস্টারের জন্য লো-ল্যাটেন্সি ইন্টারকানেক্ট অপ্টিমাইজেশন
April 10, 2026
এই প্রযুক্তিগত সমাধানটি নেটওয়ার্ক আর্কিটেক্ট, প্রাক বিক্রয় প্রকৌশলী এবং অপারেশন লিডের জন্য ডিজাইন করা হয়েছে। এটি আর্কিটেকচারিং, স্থাপন,এবং উচ্চ কার্যকারিতা InfiniBand কাপড় কেন্দ্রিকএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএইচপিসি এবং এআই প্রশিক্ষণ ক্লাস্টারগুলিকে লক্ষ্য করে।
আধুনিক এআই প্রশিক্ষণ এবং বৈজ্ঞানিক কম্পিউটিং ক্লাস্টারগুলি ক্রমবর্ধমানভাবে নেটওয়ার্ক ইন্টারকানেকশনকে প্রাথমিক পারফরম্যান্স বোতলঘাট হিসাবে মুখোমুখি করে।লেটেনসি, এবং সিপিইউ অফলোড ক্ষমতা, যেমন সমস্ত-হ্রাস এবং সমস্ত-সব-এর মতো বিতরণ প্রশিক্ষণ যোগাযোগের নিদর্শনগুলির চাহিদা পূরণ করতে ব্যর্থ। মূল প্রয়োজনীয়তাগুলির মধ্যে রয়েছেঃসাব-মাইক্রোসেকেন্ডের শেষ থেকে শেষ লেটেন্সি,ক্ষতিহীন, ড্রপ-মুক্ত পরিবহন,জিপিইউ ডাইরেক্ট আরডিএমএ সমর্থন, এবং ক্ষমতাহাজার হাজার নোড পর্যন্ত লিনিয়ার স্কেলএই আন্তঃসংযোগ দক্ষতা চ্যালেঞ্জগুলি মৌলিকভাবে সমাধান করার জন্য একটি ডেডিকেটেড ইনফিনিব্যান্ড সুইচিং আর্কিটেকচার প্রয়োজন।
এই সমাধানটি নন-ব্লকিং, পূর্ণ-বিসেকশনাল ব্যান্ডউইথ অর্জনের জন্য একটি দ্বি-স্তরীয় ফ্যাট-ট্রি টোপোলজি প্রস্তাব করে। উভয় পাতা এবং মেরুদণ্ড স্তরMQM8790-HS2F ইনফিনিব্যান্ড সুইচ, যা 200Gb / s HDR QSFP56 এর 40 টি পোর্ট সরবরাহ করে। উদাহরণস্বরূপ 512 নোডের ক্লাস্টার ব্যবহার করে নকশাটি নিম্নরূপঃ
- পাতার স্তর: প্রতিটি এমকিউএম৮৭৯০-এইচএস২এফ ২০টি কম্পিউটারের নোড (ডুয়াল-আপলিংক) এবং ৮টি আপলিংককে মেরুদণ্ড স্তরের সাথে সংযুক্ত করে।
- মেরুদণ্ডের স্তর: ৮টি এমকিউএম৮৭৯০-এইচএস২এফ সুইচ মেরুদণ্ডের সমতল গঠন করে, প্রতিটি পাতার এবং প্রতিটি মেরুদণ্ডের সুইচগুলির মধ্যে পূর্ণ জাল সংযোগ রয়েছে।
- স্টোরেজ ও ম্যানেজমেন্ট নেটওয়ার্ক: কম্পিউটার ট্রাফিকের সাথে হস্তক্ষেপ এড়াতে একটি পৃথক ইনফিনিব্যান্ড সাবনেট বা আউট-অফ-ব্যান্ড ইথারনেট।
এই আর্কিটেকচারটি যে কোনও দুটি নোডের মধ্যে 200 গিগাবাইট / সেকেন্ডের ব্যান্ডউইথ গ্যারান্টি দেয়, একাধিক অতিরিক্ত পথের সাথে নিশ্চিত করে যে একটি একক ব্যর্থতা পয়েন্ট বিশ্বব্যাপী সংযোগকে প্রভাবিত করে না।এই বন্দরের উচ্চ ঘনত্বের কারণেMQM8790-HS2F 200Gb/s HDR 40-পোর্ট QSFP56পূর্ববর্তী প্রজন্মের ইডিআর সমাধানগুলির তুলনায় প্রয়োজনীয় সুইচগুলির সংখ্যা 50% হ্রাস করে, একই সাথে ফ্যাব্রিক জটিলতা হ্রাস করে।
দ্যএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএই সমাধানের মূল সুইচিং ইউনিট হিসেবে কাজ করে, নিম্নলিখিত গুরুত্বপূর্ণ ভূমিকা পালন করেঃ
- ক্ষতিহীন সুইচিং ইঞ্জিন: ইনফিনিব্যান্ড লিঙ্ক-লেয়ার ফ্লো কন্ট্রোল প্যাকেট ক্ষতি দূর করে, আরডিএমএ পরিবহন দক্ষতা নিশ্চিত করে।
- অভিযোজিত রুটিং: একাধিক পথের ট্রাফিককে গতিশীলভাবে ভারসাম্যপূর্ণ করে তোলে, যানজটের হটপয়েন্ট এড়ানো এবং কার্যকর থ্রুপুট উন্নত করে।
- SHARPv3 ইন-নেটওয়ার্ক কম্পিউটিং: সুইচ থেকে হ্রাস অপারেশন অপসারণ, 2 ¢ 3 * দ্বারা সমস্ত হ্রাস ত্বরান্বিত।
- উচ্চ ঘনত্ব এবং কম শক্তি: 40 টি পোর্ট 200 গিগাবাইট / সেকেন্ডে শিল্পের শীর্ষস্থানীয় পোর্ট প্রতি শক্তি খরচ, TCO হ্রাস।
এর মতেMQM8790-HS2F তথ্য পত্রএবংMQM8790-HS2F স্পেসিফিকেশন, সুইচটি 16Tb / s সমষ্টিগত সুইচিং ক্ষমতা সরবরাহ করে, পোর্ট-টু-পোর্ট লেটেন্সি 130ns এর নিচে, এবং 24/7 উত্পাদন পরিবেশের জন্য হট-স্টাপেবল পাওয়ার সাপ্লাই এবং ফ্যানগুলিকে সমর্থন করে।ডিভাইসটি NVIDIA ConnectX-6/7 HDR অ্যাডাপ্টার এবং HDR অপটিক্যাল/কপার তারের বিস্তৃত পরিসরের সাথে সম্পূর্ণরূপে সামঞ্জস্যপূর্ণ, ঋণের মেয়াদ যাচাই করেMQM8790-HS2F সামঞ্জস্যপূর্ণইকোসিস্টেম।
সমাধানটি স্থাপন করার সময় এই পদক্ষেপগুলি অনুসরণ করুনঃ
- সাবনেট ব্যবস্থাপনা: সক্রিয় স্ট্যান্ডবাই সাবনেট ম্যানেজার (এসএম) স্থাপন করুন; কেন্দ্রীয় ব্যবস্থাপনা এবং টেলিমেট্রি জন্য এনভিআইডিআইএ ইউএফএম প্ল্যাটফর্ম প্রস্তাবিত।
- পার্টিশন এবং পরিষেবা স্তর: ভাড়াটে বা ওয়ার্কলোড বিচ্ছিন্ন করতে পার্টিশন কী (পি_কি) ব্যবহার করুন; এআই প্রশিক্ষণ ট্র্যাফিককে অগ্রাধিকার দেওয়ার জন্য SL2VL ম্যাপিং কনফিগার করুন।
- ক্যাবল নির্বাচন: সংকেত অখণ্ডতা বজায় রাখার জন্য স্বল্প দূরত্বের জন্য (≤3m) প্যাসিভ তামার তার এবং দীর্ঘ দূরত্বের জন্য সক্রিয় অপটিক্যাল তার বা ট্রান্সিভার ব্যবহার করুন।
২,০০০ নোডের বেশি বড় ক্লাস্টারগুলির জন্য, একটি তিন স্তরের ফ্যাট-ট্রি বা ড্রাগনফ্লাই + টোপোলজি গ্রহণ করা যেতে পারে, কোর স্তরটিMQM8790-HS2Fঅতিরিক্ত ইউনিট ক্রয় করার সময়, চেক করুনMQM8790-HS2F দামএবং অনুমোদিত পরিবেশকদের মাধ্যমে উপলব্ধ; যাচাই করা হয়েছেবিক্রির জন্য MQM8790-HS2Fতালিকা সাধারণত সর্বশেষতম ফার্মওয়্যার এবং পাটা অন্তর্ভুক্ত।MQM8790-HS2F ইনফিনিব্যান্ড সুইচ সমাধানডিপার্টমেন্টাল এআই রিসার্চ থেকে শুরু করে এক্সাসকেল সুপার কম্পিউটিং সেন্টারে।
ইনফিনিব্যান্ড ফ্যাব্রিকের কার্যকর অপারেশনের জন্য সক্রিয় পর্যবেক্ষণ এবং শৃঙ্খলাবদ্ধ সমস্যা সমাধানের প্রয়োজনঃ
- পর্যবেক্ষণ: ব্যবহার
আইবনেটডিস্কভারটপোলজি যাচাইয়ের জন্য,পারফেকচারপোর্ট কাউন্টারগুলির জন্য, এবং রিয়েল-টাইম ঘনত্বের দৃশ্যমানতার জন্য ইউএফএম টেলিমেট্রি। - সাধারণ সমস্যা ও সমাধান:
- লিংক ফ্ল্যাপিং: ক্যাবলের আসন যাচাই করুন এবং ক্যাবলের ডায়াগনস্টিক পরীক্ষা চালান; ত্রুটিযুক্ত অপটিক্স প্রতিস্থাপন করুন।
- সাবনেট ম্যানেজারের ব্যর্থতা: এসএম অগ্রাধিকার সঠিকভাবে কনফিগার করা হয় এবং সেকেন্ডারি এসএম একটি বৈধ ডাটাবেস আছে তা নিশ্চিত করুন।
- অসম অভিযোজিত রুটিং: রুটিং অ্যালগরিদম প্যারামিটার সামঞ্জস্য করুন (যেমন,
routing_engine=ftree) এবং লোড ছড়িয়ে দেওয়ার অনুমতি দেয়।
- অপ্টিমাইজেশান টিপস: সমষ্টিগত ক্রিয়াকলাপের জন্য SHARP সমষ্টি সক্ষম করুন; বড় বার্তা স্থানান্তরের জন্য 4096 বাইটে এমটিইউ টিউন করুন; নিয়ন্ত্রণ, ডেটা এবং পরিচালনা ট্র্যাফিক পৃথক করতে পরিষেবা মান ব্যবহার করুন।
এনভিআইডিআইএ সাপোর্ট পোর্টালের মাধ্যমে নিয়মিত ফার্মওয়্যার আপগ্রেডগুলি সুরক্ষা প্যাচ এবং কর্মক্ষমতা উন্নতি নিশ্চিত করে।MQM8790-HS2F তথ্য পত্রবিশদ পারফরম্যান্স বেসলাইন এবং স্বাস্থ্যকর অবস্থার অধীনে প্রত্যাশিত কাউন্টার মানের জন্য।
দ্যএনভিআইডিআইএ মেলানোক্স এমকিউএম৮৭৯০-এইচএস২এফএকটি ভবিষ্যত-প্রমাণ ইনফিনিব্যান্ড সুইচিং প্ল্যাটফর্ম সরবরাহ করে যা আরডিএমএ / এইচপিসি / এআই ক্লাস্টার আন্তঃসংযোগের মূল চ্যালেঞ্জগুলি সমাধান করেঃ বিলম্ব, ক্ষতি, সিপিইউ ওভারহেড এবং স্কেলযোগ্যতা।উপরে বর্ণিত দুই স্তরের ফ্যাট-ট্রি আর্কিটেকচার বাস্তবায়ন করে, সংস্থাগুলি লিনিয়ার পারফরম্যান্স স্কেলিং, পূর্বাভাসযোগ্য কাজের সমাপ্তির সময় এবং ঐতিহ্যবাহী ইথারনেট সমাধানগুলির তুলনায় উল্লেখযোগ্যভাবে TCO হ্রাস করতে পারে।200Gb/s HDR গতির সংমিশ্রণ, 40-পোর্ট ঘনত্ব, এবং নেটওয়ার্কের মধ্যে কম্পিউটিং ক্ষমতা এটি গ্রিনফিল্ড স্থাপনার জন্য একটি আদর্শ পছন্দ বা EDR / HDR ফ্যাব্রিক থেকে ধাপে ধাপে আপগ্রেড করে।পরবর্তী প্রজন্মের ক্লাস্টারগুলি মূল্যায়ন করার জন্য আর্কিটেকচার টিমের জন্য,MQM8790-HS2F ইনফিনিব্যান্ড সুইচ সমাধানএটি একটি পরীক্ষিত, উৎপাদন-প্রস্তুত রেফারেন্স ডিজাইন প্রদান করে।

