প্রযুক্তিগত সমাধানঃ NVIDIA Mellanox MCX631102AN-ADAT সার্ভার অ্যাডাপ্টার

April 27, 2026

প্রযুক্তিগত সমাধানঃ NVIDIA Mellanox MCX631102AN-ADAT সার্ভার অ্যাডাপ্টার

এই প্রযুক্তিগত হোয়াইট পেপারটি নেটওয়ার্ক আর্কিটেক্ট, প্রি-সেলস ইঞ্জিনিয়ার এবং অপারেশনস লিডারদের জন্য একটি ব্যাপক রেফারেন্স প্রদান করে যারা উচ্চ-পারফরম্যান্স ডেটা সেন্টার পরিবেশে NVIDIA Mellanox MCX631102AN-ADAT সার্ভার অ্যাডাপ্টার স্থাপন করার পরিকল্পনা করছেন। সমাধানটি TCP/IP স্ট্যাক ওভারহেড দূরীকরণ, RDMA/RoCEv2 লো-লেটেন্সি ট্রান্সপোর্ট সক্ষম করা এবং স্টোরেজ, ডেটাবেস এবং এআই ওয়ার্কলোডের জন্য সার্ভার থ্রুপুট সর্বাধিক করার উপর দৃষ্টি নিবদ্ধ করে।আধুনিক ডেটা সেন্টার আর্কিটেকচার তিনটি অভিসারী চ্যালেঞ্জের সম্মুখীন হচ্ছে: ইস্ট-ওয়েস্ট ট্র্যাফিকের বিস্ফোরক বৃদ্ধি, বিচ্ছিন্ন স্টোরেজের দিকে স্থানান্তর (NVMe-oF, vSAN), এবং নেটওয়ার্ক প্রক্রিয়াকরণের পরিবর্তে অ্যাপ্লিকেশন লজিকের জন্য সিপিইউ সাইকেল সংরক্ষণ করার প্রয়োজনীয়তা। ঐতিহ্যবাহী TCP/IP ব্যবহার করে লিগ্যাসি 25GbE স্থাপনগুলি উচ্চ টেইল লেটেন্সি (স্টোরেজ অপারেশনের জন্য 200–500µs), অতিরিক্ত প্রতি-প্যাকেট কার্নেল প্রক্রিয়াকরণ এবং অদক্ষ ছোট-প্যাকেট থ্রুপুট দ্বারা ভোগে। মূল প্রয়োজনীয়তা হল একটি লো-লেটেন্সি, লসলেস ফ্যাব্রিক যা সিপিইউ হস্তক্ষেপ ছাড়াই সার্ভারগুলির মধ্যে সরাসরি মেমরি অ্যাক্সেস সক্ষম করে, বিদ্যমান ইথারনেট পরিকাঠামোর সাথে সামঞ্জস্য বজায় রেখে।

2. সামগ্রিক নেটওয়ার্ক ও সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত সমাধানটি লসলেস RoCEv2 কনফিগারেশন সহ একটি দ্বি-স্তরীয় লিফ-স্পাইন টপোলজি গ্রহণ করে। মূল স্থাপত্য সিদ্ধান্তগুলির মধ্যে রয়েছে:

ফিজিক্যাল লেয়ার:

প্রতিটি কম্পিউট/স্টোরেজ সার্ভার থেকে লিফ সুইচগুলিতে 25GbE SFP28 সংযোগ, লিফ থেকে স্পাইনে 100GbE বা 400GbE আপলিঙ্ক

  • কনভার্জড ফ্যাব্রিক: DSCP-ভিত্তিক অগ্রাধিকার ব্যবহার করে স্ট্যান্ডার্ড TCP ট্র্যাফিক এবং RoCEv2 লসলেস উভয় ফ্লো বহনকারী শেয়ার্ড ইথারনেট ফ্যাব্রিক
  • ফ্লো কন্ট্রোল: লসলেস অগ্রাধিকারগুলিতে প্রায়োরিটি ফ্লো কন্ট্রোল (PFC), কনজেশন নোটিফিকেশনের জন্য ECN মার্কিং এবং DCBX আলোচনা
  • হোস্ট সাইড: প্রতিটি MCX631102AN-ADAT ইথারনেট অ্যাডাপ্টার কার্ডের জন্য ডেডিকেটেড PCIe 4.0 x16 স্লট, ভার্চুয়ালাইজড পরিবেশের জন্য SR-IOV সক্ষম করা
  • NVMe-oF স্থাপনার জন্য, প্রতিটি স্টোরেজ সার্ভার দুটি MCX631102AN-ADAT ConnectX-6 Lx ডুয়াল-পোর্ট 25GbE SFP28 অ্যাডাপ্টার হোস্ট করে — একটি ফ্রন্ট-এন্ড অ্যাপ্লিকেশন ট্র্যাফিকের জন্য এবং একটি ব্যাক-এন্ড প্রতিলিপি এবং পুনর্গঠন ট্র্যাফিকের জন্য, ফল্ট আইসোলেশন এবং QoS পৃথকীকরণ নিশ্চিত করে।3. সমাধানে MCX631102AN-ADAT এর ভূমিকা ও মূল বৈশিষ্ট্যMCX631102AN-ADAT হল গুরুত্বপূর্ণ এন্ডপয়েন্ট ডিভাইস যা হোস্ট-সাইড RDMA ত্বরণ সক্ষম করে। এর মূল প্রযুক্তিগত অবদানগুলি হল:বৈশিষ্ট্য

RDMA/থ্রুপুটের জন্য কার্যকরী সুবিধাহার্ডওয়্যার ট্রান্সপোর্ট অফলোডRoCEv2, DCQCN, DCT, ট্যাগ-ম্যাচিং – নির্ভরযোগ্য সংযোগ ব্যবস্থাপনার জন্য শূন্য সিপিইউ সম্পৃক্ততা

PCIe 4.0 x16 ইন্টারফেস

হার্ডওয়্যার স্ক্যাটার-গ্যাদার এবং হেডার স্প্লিটিং – প্রতি পোর্টে 37Mpps পর্যন্ত ছোট-প্যাকেট থ্রুপুট উন্নত করে

সিকিউর বুট ও রুট অফ ট্রাস্ট নিরাপত্তা-সংবেদনশীল NFV এবং আর্থিক পরিষেবা স্থাপনার জন্য ফার্মওয়্যার অখণ্ডতা যাচাইকরণ
256 VFs পর্যন্ত SR-IOV হাইপারভাইজার ভার্চুয়ালাইজেশন ওভারহেড ছাড়াই VM/কন্টেইনারগুলিতে RoCE কিউগুলির সরাসরি পাস-থ্রু
MCX631102AN-ADAT ডেটাশিট উল্লেখ করে, অ্যাডাপ্টারটি হার্ডওয়্যার টাইমস্ট্যাম্পিংও সরবরাহ করে (1ns রেজোলিউশন সহ ফ্রি-রানিং টাইমস্ট্যাম্প কাউন্টার), যা আর্থিক ট্রেডিং বা টেলকো এজ অ্যাপ্লিকেশনগুলির জন্য সুনির্দিষ্ট PTP/SyncE সক্ষম করে। 4. স্থাপনা ও স্কেলিং সুপারিশ (সাধারণ টপোলজি)
ব্রাউনফিল্ড স্থাপনার জন্য, একটি পর্যায়ক্রমিক পদ্ধতির সুপারিশ করা হয়: পর্যায় 1 – স্টোরেজ প্লেন আপগ্রেড:
সমস্ত স্টোরেজ সার্ভারে MCX631102AN-ADAT স্থাপন করুন যা NVMe-oF টার্গেট সফ্টওয়্যার (যেমন, SPDK, TargeR) চালাচ্ছে। PFC অগ্রাধিকার 3 RoCE এর জন্য এবং 1 CNP এর জন্য কনফিগার করুন, DCBX অটো-আলোচনার ব্যবহার করে। পর্যায় 2 – কম্পিউট প্লেন সক্ষমকরণ:
ডেটাবেস বা এআই ফ্রেমওয়ার্ক (TensorFlow, PyTorch with NCCL) চালিত কম্পিউট সার্ভারগুলিতে অ্যাডাপ্টার ইনস্টল করুন। RDMA-সক্ষম ভার্বস লাইব্রেরি সক্ষম করুন এবং RoCEv2 এর জন্য GID সূচক কনফিগার করুন। পর্যায় 3 – নেটওয়ার্ক একত্রীকরণ:

UC বা RC পরিষেবা প্রকারের সাথে RoCE তে উচ্চ-সংবেদনশীল TCP ওয়ার্কলোড (রিয়েল-টাইম অ্যানালিটিক্স, মাইক্রোসার্ভিস সাইডকার) স্থানান্তর করুন।টপোলজি যাচাইকরণ চেকলিস্ট:সমস্ত লিফ সুইচগুলির পর্যাপ্ত বাফার হেডরুম সহ লসলেস RoCE (PFC + ECN) সমর্থন করতে হবে

শেষ থেকে শেষ MTU কমপক্ষে 2000 বাইট (জ্যাম্বো ফ্রেমের জন্য 9000 পছন্দনীয়)

RoCEv2 ট্র্যাফিকের জন্য ইউনিকাস্ট রাউটিং পৌঁছানো (UDP পোর্ট 4791)

  • বৈধ MCX631102AN-ADAT সামঞ্জস্যপূর্ণ তালিকা: NVIDIA Spectrum (পছন্দসই), Cisco Nexus 9300-EX/FX, Arista 7050X/7050X3 DCBX প্রোফাইল সহ5. অপারেশনস ও রক্ষণাবেক্ষণ – পর্যবেক্ষণ, সমস্যা সমাধান ও অপ্টিমাইজেশনকনজেশন সনাক্তকরণ:
  • সুইচগুলিতে প্রতি-পোর্ট PFC পজ ফ্রেম কাউন্টার এবং ethtool -S বা mlxlink ব্যবহার করে অ্যাডাপ্টার ECN-চিহ্নিত প্যাকেট পরিসংখ্যান পর্যবেক্ষণ করুন।লেটেন্সি SLO নিশ্চয়তা:
  • ucxtrace বা mlx5cmd এর মতো সরঞ্জাম ব্যবহার করে হার্ডওয়্যার টাইমস্ট্যাম্পড লেটেন্সি পর্যবেক্ষণ স্থাপন করুন; র্যাকের মধ্যে সাধারণ সুস্থ RTT 10µs এর নিচে, স্পাইন জুড়ে 30µs এর নিচে।ফার্মওয়্যার ও ড্রাইভার অ্যালাইনমেন্ট:

NVIDIA এর বৈধ ফার্মওয়্যার বান্ডিল ব্যবহার করুন (সঠিক পার্ট নম্বরের জন্য MCX631102AN-ADAT স্পেসিফিকেশন উল্লেখ করুন) এবং ড্রাইভার সংস্করণ (mlx5_core ≥ 5.9)।

  • RMA ও লাইফসাইকেল ম্যানেজমেন্ট:
  • MCX631102AN-ADAT মূল্য বনাম TCO বিশ্লেষণ করার সময়, একটি 3-5 বছরের নোড রিফ্রেশ চক্র অন্তর্ভুক্ত করুন; একাধিক বিশ্বব্যাপী পরিবেশক মাল্টি-ইয়ার ওয়ারেন্টি সমর্থন সহ বিক্রয়ের জন্য MCX631102AN-ADAT তালিকাভুক্ত করে।
  • সমস্যা সমাধানের জন্য, সবচেয়ে সাধারণ ত্রুটিগুলি হল: ভুল কনফিগার করা সুইচ বাফার থ্রেশহোল্ড (পজ ফ্রেম স্টর্মের দিকে পরিচালিত করে), অমিল GID প্রকার (IPv6 RoCEv2 এর জন্য GID প্রকার 2 পছন্দ করুন), এবং অ্যাপ্লিকেশন ভার্বসে হার্ডওয়্যার অফলোড সক্ষমকরণের অভাব (স্থানীয় লেখার অ্যাক্সেস সহ ibv_reg_mr নিশ্চিত করুন)।
  • 6. সারসংক্ষেপ ও মূল্য মূল্যায়নNVIDIA Mellanox MCX631102AN-ADAT একটি প্রোডাকশন-হার্ডেন্ড MCX631102AN-ADAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধান সরবরাহ করে যা সংস্থাগুলি পরিপক্ক 25GbE পরিকাঠামোতে প্রকৃত লো-লেটেন্সি লাইন-রেট পারফরম্যান্স আনলক করতে চাইছে। RDMA/RoCEv2 হার্ডওয়্যার অফলোড সক্ষম করার মাধ্যমে, সমাধানটি সাব-20 মাইক্রোসেকেন্ড NVMe-oF লেটেন্সি অর্জন করে, অ্যাপ্লিকেশন ওয়ার্কলোডগুলির জন্য 30% এর বেশি সিপিইউ কোর পুনরুদ্ধার করে এবং পূর্বে শুধুমাত্র 100GbE অ্যাডাপ্টারগুলিতে অর্জনযোগ্য ছোট প্যাকেট দক্ষতার সাথে 50Gbps অ্যাগ্রিগেট থ্রুপুট বজায় রাখে। গ্রিনফিল্ড হাইপারকনভার্জড বা এআই স্টোরেজ ক্লাস্টারগুলির পরিকল্পনা করা আর্কিটেক্টদের জন্য, MCX631102AN-ADAT একটি কৌশলগত সক্ষমকারী হিসাবে কাজ করে — ইথারনেটের অপারেশনাল সরলতার সাথে ইনফিনিব্যান্ডের লেটেন্সি প্রোফাইল সরবরাহ করে।