NVIDIA Mellanox MCX653105A-HDAT সার্ভার অ্যাডাপ্টার প্রযুক্তিগত সমাধান

June 15, 2026

NVIDIA Mellanox MCX653105A-HDAT সার্ভার অ্যাডাপ্টার প্রযুক্তিগত সমাধান
1. প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ

ডিস্ট্রিবিউটেড স্টোরেজ, কনভার্জড ডাটাবেস এবং এআই ট্রেনিং প্ল্যাটফর্ম 100GbE/200GbE নেটওয়ার্কের দিকে বিকশিত হওয়ার কারণে, প্রথাগত TCP/IP স্ট্যাক একটি প্রাথমিক কর্মক্ষমতা বাধা হয়ে দাঁড়িয়েছে। ডেটা রেপ্লিকেশন এবং লগ সিঙ্ক্রোনাইজেশনের মতো জটিল ক্রিয়াকলাপগুলি লেটেন্সির জন্য অত্যন্ত সংবেদনশীল, তবুও কার্নেল নেটওয়ার্ক স্ট্যাক দশ হাজার মাইক্রোসেকেন্ড বিলম্বের প্রবর্তন করে এবং প্রোটোকল প্রক্রিয়াকরণের জন্য উল্লেখযোগ্য CPU সংস্থান গ্রহণ করে, থ্রুপুট স্কেলেবিলিটি মারাত্মকভাবে সীমিত করে। আধুনিক ডেটা সেন্টারগুলির একটি নেটওয়ার্ক সমাধান প্রয়োজন যা কাছাকাছি-মেমরি লেটেন্সি, লাইন-রেট থ্রুপুট এবং ন্যূনতম CPU হস্তক্ষেপ প্রদান করে।

এই প্রযুক্তিগত সমাধান কেন্দ্রNVIDIA Mellanox MCX653105A-HDATসার্ভার অ্যাডাপ্টার, নিম্নলিখিত মূল প্রয়োজনীয়তাগুলি সমাধান করার জন্য ডিজাইন করা হয়েছে:

  • বিতরণ করা স্টোরেজ এবং HPC ওয়ার্কলোডের জন্য সাব-মাইক্রোসেকেন্ড ইন্টার-নোড লেটেন্সি
  • নেটওয়ার্ক প্রক্রিয়াকরণের জন্য উপ-10% CPU ব্যবহার, অ্যাপ্লিকেশন লজিকের জন্য কোর মুক্ত করা
  • লেজ-লেটেন্সি স্পাইক এড়াতে যানজট নিয়ন্ত্রণ সহ ক্ষতিহীন পরিবহন
  • বিদ্যমান ইথারনেট অবকাঠামোর সাথে বিরামহীন একীকরণ
  • NVMe-ওভার-ফ্যাব্রিক্স (NVMe‑oF) এবং GPUDirect RDMA-এর জন্য হার্ডওয়্যার অফলোড
2. সামগ্রিক নেটওয়ার্ক/সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত স্থাপত্যটি প্রাথমিক পরিবহন প্রোটোকল হিসাবে মোতায়েন RoCE (আরডিএমএ ওভার কনভার্জড ইথারনেট) সহ একটি দ্বি-স্তরের CLOS (স্পাইন-লিফ) টপোলজি গ্রহণ করে। সমস্ত গণনা এবং স্টোরেজ সার্ভারের সাথে সজ্জিতMCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড, RoCE-সক্ষম পাতার সুইচের সাথে সংযুক্ত। PFC (অগ্রাধিকার প্রবাহ নিয়ন্ত্রণ) এবং ECN (এক্সপ্লিসিট কনজেশন নোটিফিকেশন) RDMA ট্র্যাফিকের জন্য ক্ষতিহীন ইথারনেট ডোমেন তৈরি করতে সক্ষম করা হয়েছে, যখন পৃথক অগ্রাধিকার সারিগুলি সঞ্চয়স্থান, HPC এবং পরিচালনা প্রবাহকে বিচ্ছিন্ন করে।

মূল স্থাপত্য সিদ্ধান্তের মধ্যে রয়েছে:

  • RoCEv2স্তর 3 সীমানা জুড়ে রাউটিং অনুমতি দিতে UDP-IP-এর উপরে
  • DCQCN (ডেটা সেন্টার কোয়ান্টাইজড কনজেশন নোটিফিকেশন)সক্রিয় যানজট ব্যবস্থাপনার জন্য
  • বিভাজিত PCIeএকই অ্যাডাপ্টারে কম্পিউট ট্রাফিক বনাম স্টোরেজের জন্য ব্যান্ডউইথ উৎসর্গ করতে
  • মাল্টি-হোস্ট সমর্থনএকটি একক অ্যাডাপ্টার ভাগ করতে চারটি সার্ভার পর্যন্ত সক্ষম করা (বিচ্ছিন্ন স্টোরেজ পরিস্থিতি)
3. NVIDIA Mellanox MCX653105A-HDAT-এর ভূমিকা ও মূল বৈশিষ্ট্য

এই সমাধান হৃদয়ে,NVIDIA Mellanox MCX653105A-HDAT- একটি ডুয়াল-পোর্ট 100GbE ConnectX-6 Dx অ্যাডাপ্টার - গুরুত্বপূর্ণ অফলোড ইঞ্জিন হিসাবে কাজ করে৷ অনুযায়ীMCX653105A-HDAT ডেটাশিট, কার্ডটি হার্ডওয়্যার এক্সিলারেটরকে সংহত করে যা সার্ভারগুলি কীভাবে নেটওয়ার্ক I/O পরিচালনা করে তা মৌলিকভাবে পরিবর্তন করে।

নিম্নলিখিত সারণী হাইলাইট করে যে কীভাবে নির্দিষ্ট বৈশিষ্ট্যগুলি স্থাপত্যের প্রয়োজনীয়তাগুলি পূরণ করে:

বৈশিষ্ট্য ফাংশন সুবিধা
RoCE হার্ডওয়্যার অফলোড অ্যাডাপ্টারে সম্পূর্ণ RDMA স্ট্যাক সাব‑1µs লেটেন্সি, শূন্য CPU কপি
NVMe‑oF টার্গেট অফলোড NVMe কমান্ডের জন্য হার্ডওয়্যার ত্বরণ 5x স্টোরেজ থ্রুপুট, 90% CPU হ্রাস
ASAP2 (এক্সিলারেটেড সুইচিং) হার্ডওয়্যারে vSwitch অফলোড খুলুন লাইন-রেট ভার্চুয়ালাইজেশন ওভারলে
নিরাপদ বুট এবং ইন-লাইন ক্রিপ্টো হার্ডওয়্যার IPsec/TLS অফলোড পারফরম্যান্স পেনাল্টি ছাড়া এনক্রিপশন

MCX653105A-HDAT ConnectX অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ডএছাড়াও উন্নত টেলিমেট্রি অন্তর্ভুক্ত - প্রতিটি প্যাকেটে হার্ডওয়্যার টাইমস্ট্যাম্প এবং ফ্লো কাউন্টার রয়েছে, হোস্ট সিপিইউ পোলিং ছাড়াই রিয়েল-টাইম কনজেশন দৃশ্যমানতা প্রদান করে। সংগ্রহের সাথে সংশ্লিষ্ট সংস্থাগুলির জন্য,MCX653105A-HDAT মূল্যসিপিইউ-কেবল স্কেলিং বা FPGA-ভিত্তিক বিকল্পগুলির তুলনায় একটি আকর্ষণীয় ROI প্রদান করে।

4. স্থাপনা এবং স্কেলিং সুপারিশ (টপোলজি সহ)

একটি সাধারণ 200-নোড ক্লাস্টারের জন্য, আমরা নিম্নলিখিত স্থাপনা পদ্ধতির সুপারিশ করি:

  • পাতার স্তর:RoCE-সক্ষম সুইচগুলি (যেমন, NVIDIA SN3700) যার সাথে PFC/ECN সক্ষম, DCQCN প্যারামিটারের জন্য কনফিগার করা হয়েছে কাজের চাপের ভারসাম্যের জন্য।
  • মেরুদণ্ডের স্তর:পর্যাপ্ত ওভারসাবস্ক্রিপশন অনুপাত সহ নন-ব্লকিং সুইচ (সঞ্চয়স্থান ট্র্যাফিকের জন্য সর্বোচ্চ 3:1)।
  • সার্ভার সাইড:একMCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানশেয়ার্ড স্টোরেজ ক্লাস্টারের জন্য প্রতি দুটি নোড, অথবা কম্পিউট-ইনটেনসিভ HPC-এর জন্য প্রতি নোডের জন্য একটি।
  • বাফার এবং MTU:9000-বাইট জাম্বো ফ্রেম এন্ড-টু-এন্ড কনফিগার করুন এবং ক্ষতিহীন গ্যারান্টির জন্য অগ্রাধিকার গোষ্ঠী প্রতি 10-20% সুইচ বাফার বরাদ্দ করুন।

সামঞ্জস্য যাচাই করার সময়, বেশিরভাগ প্রধান সার্ভার প্ল্যাটফর্ম হয়MCX653105A-HDAT সামঞ্জস্যপূর্ণ- Dell PowerEdge, HPE ProLiant, Lenovo ThinkSystem, এবং Supermicro সহ। অ্যাডাপ্টারের PCIe 4.0/5.0 x16 ইন্টারফেস পরবর্তী প্রজন্মের CPU-এর জন্য ভবিষ্যৎ-প্রুফ ব্যান্ডউইথ নিশ্চিত করে।

5. অপারেশন, মনিটরিং, ট্রাবলশুটিং এবং অপ্টিমাইজেশান

উৎপাদন RoCE স্থাপনার জন্য সক্রিয় দৃশ্যমানতা প্রয়োজন। আমরা নিম্নলিখিত অপারেশনাল অনুশীলন সুপারিশ:

  • টেলিমেট্রি সংগ্রহ:NVIDIA ব্যবহার করুনmft(Mellanox Firmware Tools) এবংethtool -Sপ্রতি-বন্দর এবং প্রতি-সারি কাউন্টারগুলি প্রমিথিউস বা অনুরূপ সিস্টেমে রপ্তানি করতে।
  • নিরীক্ষণের জন্য মূল মেট্রিক্স:প্রতি সেকেন্ডে PFC পজ ফ্রেম, ECN চিহ্নিত প্যাকেট রেট, RoCE রিট্রান্সমিশন এবং অ্যাডাপ্টারের তাপমাত্রা।
  • যানজট সনাক্তকরণ:PFC বিরামের আকস্মিক বৃদ্ধি প্রায়ই ধীর রিসিভারের সংকেত দেয়; চেকMCX653105A-HDAT স্পেসিফিকেশনবাফার-থ্রেশহোল্ড টিউনিং প্যারামিটারের জন্য।
  • ফার্মওয়্যার ব্যবস্থাপনা:রক্ষণাবেক্ষণ উইন্ডোর সময় ফার্মওয়্যার আপগ্রেডের সময়সূচী; অ্যাডাপ্টার ডাউনটাইম কমাতে RoCE সংযোগের লাইভ মাইগ্রেশন সমর্থন করে।
  • পারফরম্যান্স টিউনিং চেকলিস্ট:IRQ কোলেসিং সক্ষম করুন, সঠিক Rx/Tx রিং মাপ সেট করুন (4096 প্রস্তাবিত), ডেডিকেটেড কোরে পিন ইন্টারাপ্ট করুন এবং PCIe লিঙ্ক প্রস্থ (x16 @ Gen4/5) যাচাই করুন।
6. সারাংশ এবং মূল্য মূল্যায়ন

NVIDIA Mellanox MCX653105A-HDATRDMA/RoCE-ভিত্তিক নিম্ন-বিলম্বিত কাপড়ের জন্য একটি সম্পূর্ণ, উৎপাদন-প্রস্তুত ভিত্তি প্রদান করে। স্টোরেজ কমান্ড থেকে ভার্চুয়াল সুইচিং এবং সিকিউরিটি এনক্রিপশন পর্যন্ত - সমগ্র ডেটা পাথ অফলোড করার মাধ্যমে এটি সার্ভার নেটওয়ার্কিংকে একটি বাধা থেকে একটি এক্সিলারেটরে রূপান্তরিত করে। এই সমাধান গ্রহণকারী সংস্থাগুলি আশা করতে পারে:

  • ডিটারমিনিস্টিক সাব-2µs লেটেন্সিশত শত নোড জুড়ে
  • 5-10x থ্রুপুট উন্নতিNVMe‑oF এবং HPC কর্মপ্রবাহের জন্য
  • 80-90% হ্রাসনেটওয়ার্ক-সম্পর্কিত CPU ওভারহেডে
  • রৈখিক মাপযোগ্যতাযানজট পতন ছাড়া

অপশন মূল্যায়ন ইঞ্জিনিয়ারদের জন্য,MCX653105A-HDAT ডেটাশিটএবং অফিসিয়াল কম্প্যাটিবিলিটি গাইড হল প্রামাণিক রেফারেন্স। অ্যাডাপ্টারের সাথে এখন ব্যাপকভাবেMCX653105A-HDAT বিক্রয়ের জন্যNVIDIA-এর চ্যানেল অংশীদারদের মাধ্যমে, একটি উচ্চ-কর্মক্ষমতা, কম-বিলম্বিত ডেটা প্লেনের পথ পরিষ্কার এবং অর্জনযোগ্য। এই প্রযুক্তিগত সমাধানটি RDMA এবং RoCE-এর সাথে 100GbE নেটওয়ার্কিংয়ের সম্পূর্ণ সম্ভাবনা আনলক করতে চাওয়া যে কোনও সংস্থার জন্য একটি নীলনকশা প্রদান করে।