NVIDIA Mellanox MCX4121A-ACAT সার্ভার অ্যাডাপ্টার প্রযুক্তিগত সমাধানঃ নিম্ন-ল্যাটেনসি এবং সর্বোচ্চ জন্য আর্কিটেকচারিং RDMA/RoCE

March 9, 2026

NVIDIA Mellanox MCX4121A-ACAT সার্ভার অ্যাডাপ্টার প্রযুক্তিগত সমাধানঃ নিম্ন-ল্যাটেনসি এবং সর্বোচ্চ জন্য আর্কিটেকচারিং RDMA/RoCE


1প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ

আধুনিক ডেটা সেন্টারগুলি ক্রমবর্ধমান চাহিদাপূর্ণ কাজের চাপের অধীনে রয়েছে, যার মধ্যে রিয়েল টাইম বিশ্লেষণ, বিতরণকৃত মেশিন লার্নিং প্রশিক্ষণ,এবং উচ্চ কার্যকারিতা সফটওয়্যার সংজ্ঞায়িত স্টোরেজ. ঐতিহ্যগত নেটওয়ার্ক আর্কিটেকচার, TCP/IP স্ট্যাকের উপর অত্যন্ত নির্ভরশীল, উল্লেখযোগ্য বিলম্ব এবং CPU ওভারহেড প্রবর্তন করে।"কার্নেল বাইপাস" পদ্ধতিটি কেবল একটি সুবিধা নয়, কিন্তু একটি প্রয়োজনীয়তা.নেটওয়ার্ক আর্কিটেক্টস এবং স্টোরেজ ইঞ্জিনিয়াররা এমন সমাধান খুঁজছেন যা সম্পূর্ণ অবকাঠামোগত সংস্কারের প্রয়োজন ছাড়াই NVMe-oF এবং মাইক্রোসার্ভিস আর্কিটেকচারগুলির পূর্ণ সম্ভাবনাকে উন্মুক্ত করতে পারে. একটি সাধারণ বড় আকারের স্থাপনার মধ্যে চিহ্নিত প্রাথমিক প্রয়োজনীয়তাগুলির মধ্যে রয়েছে স্টোরেজ ট্র্যাফিকের জন্য 10 মাইক্রো সেকেন্ডের নিচে বিলম্ব, নেটওয়ার্ক I/O এর জন্য CPU ওভারহেডের 40% হ্রাস,এবং একটি ইউনিফাইড ফ্যাব্রিক যা স্ট্যান্ডার্ড টিসিপি/আইপি ট্রাফিক এবং অতি-নিম্ন বিলম্বিত আরডিএমএ ট্রাফিক উভয়ই বহন করতে সক্ষম.

2. নেটওয়ার্ক এবং সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত আর্কিটেকচারটি একই শারীরিক অবকাঠামোর উপর স্ট্যান্ডার্ড ল্যান ট্র্যাফিক এবং স্টোরেজ ট্র্যাফিক উভয়ই সমর্থন করার জন্য ডিজাইন করা একটি ক্ষতিহীন, সংযুক্ত ইথারনেট ফ্যাব্রিকের উপর কেন্দ্রীভূত।নকশাটি RoCE (কনভার্জেড ইথারনেটের উপর RDMA) সক্ষম সুইচগুলির সাথে একটি পাতার মেরুদণ্ডের টপোলজি ব্যবহার করেমূল নকশা নীতিগুলির মধ্যে রয়েছেঃ

  • কনভার্জড ফ্যাব্রিক:একটি একক 25GbE নেটওয়ার্ক সমস্ত ধরণের ট্র্যাফিক বহন করে, পৃথক স্টোরেজ এবং ডেটা নেটওয়ার্কগুলির প্রয়োজন দূর করে (LAN / SAN সংযোজন) ।
  • লসলেস ইথারনেট ফাউন্ডেশন:আরডিএমএ ট্রাফিকের জন্য ক্ষতিহীন শ্রেণীর পরিষেবা তৈরির জন্য অগ্রাধিকার প্রবাহ নিয়ন্ত্রণ (পিএফসি, আইইইই 802.1 কিউবিবি) এবং বর্ধিত ট্রান্সমিশন নির্বাচন (ইটিএস, আইইইই 802.1 কিউএজ) বাস্তবায়ন করা।প্যাকেট ড্রপ প্রতিরোধ করা যা অন্যথায় বিপর্যয়কর লেটেন্সি স্পাইক সৃষ্টি করবে.
  • এন্ড-টু-এন্ড RDMA:RoCEv2 স্থাপন করা, যা নেটওয়ার্ক স্তরে কাজ করে, যা RDMA কে L3 সীমানা অতিক্রম করতে এবং RoCEv1 এর বিপরীতে একটি একক সম্প্রচার ডোমেনের বাইরে স্কেল করতে দেয়।

এই আর্কিটেকচারের মধ্যে, সার্ভার এন্ডপয়েন্ট সবচেয়ে গুরুত্বপূর্ণ উপাদান।এনভিডিয়া মেলানোক্স এমসিএক্স ৪১২১এ-এসিএটিসার্ভার অ্যাডাপ্টার তার কেন্দ্রীয় ভূমিকা পালন করে, বুদ্ধিমান ইন্টারফেস হিসাবে কাজ করে যা RoCE প্রোটোকল চালায় এবং হোস্ট CPU থেকে জটিল নেটওয়ার্ক ফাংশনগুলিকে অফলোড করে।

3. সমাধানের ক্ষেত্রে এনভিআইডিআইএ মেলানোক্স এমসিএক্স 4121 এ-এসিএটির ভূমিকা

দ্যMCX4121A-ACAT ইথারনেট অ্যাডাপ্টার কার্ডসার্ভার-সাইড ডিপ্লয়মেন্টের মূল ভিত্তি।MCX4121A-ACAT ConnectX-4 Lx ডুয়াল পোর্ট 25GbE SFP28অ্যাডাপ্টারটি প্রকল্পের লক্ষ্য অর্জনের জন্য প্রয়োজনীয় হার্ডওয়্যার ত্বরণ সরবরাহ করে। স্থপতিতে এর নির্দিষ্ট অবদানগুলি নীচে বিশদভাবে বর্ণনা করা হয়েছেঃ

  • হার্ডওয়্যার RoCE ইঞ্জিন:অ্যাডাপ্টারটি পুরো RoCEv2 প্রোটোকলটি সিলিকনে বাস্তবায়ন করে। এর অর্থ হল মেমরিতে পড়া / লেখা এবং প্রেরণ / গ্রহণ ক্রিয়া সহ RDMA ক্রিয়াকলাপগুলি সম্পূর্ণরূপে এনআইসিতে প্রক্রিয়াজাত করা হয়,কার্নেল বাইপাস করা এবং কনটেক্সট সুইচগুলি নির্মূল করাএটি ১০ মাইক্রো সেকেন্ডের নিচে অ্যাপ্লিকেশন-টু-অ্যাপ্লিকেশন লেটেন্সি অর্জনের প্রাথমিক প্রক্রিয়া।
  • এনভিএম-ওএফ অফলোডঃস্টোরেজ ট্রাফিকের জন্য,MCX4121A-ACATএটি RDMA এর সাথে NVMe ওভার ফ্যাব্রিক্স (NVMe-oF) সমর্থন করে। এটি NVMe সারি জোড়া প্রক্রিয়াকরণকে অফলোড করে, যা স্টোরেজ টার্গেট বা সূচককে ন্যূনতম সিপিইউ হস্তক্ষেপের সাথে লক্ষ লক্ষ আইওপিএস পরিচালনা করতে দেয়।
  • ডায়নামিক ইন্টারপুট মডারেটরঃঅ্যাডাপ্টার বুদ্ধিমানভাবে বিরতিগুলিকে মডারেট করে, ট্রাফিক লোডের উপর ভিত্তি করে তাদের একত্রিত করে।এটি সংবেদনশীল ট্র্যাফিকের জন্য কম বিলম্ব বজায় রেখে উচ্চ-থ্রুপুট দৃশ্যের সময় হোস্ট সিপিইউ ওভারহেড হ্রাস করে নির্দিষ্ট সারিগুলির জন্য বিরতিগুলিকে মডারেশন বাইপাস করার অনুমতি দিয়ে.
  • সার্ভিস কোয়ালিটি (QoS) প্রয়োগঃএটি হার্ডওয়্যার-ভিত্তিক QoS সমর্থন করে, যা স্থপতিদের বিভিন্ন অগ্রাধিকার সারিগুলিতে বিভিন্ন ট্র্যাফিক ক্লাস (যেমন, স্টোরেজ, পরিচালনা, গণনা) বরাদ্দ করতে দেয়।এটি নিশ্চিত করে যে RDMA ট্র্যাফিক গ্যারান্টিযুক্ত ব্যান্ডউইথ এবং কম বিলম্ব পায়এমনকি নেটওয়ার্কের ঘনত্বের সময়ও।

4. মোতায়েন এবং স্কেলিং সুপারিশ

ঝুঁকি হ্রাস করার জন্য ধাপে ধাপে বাস্তবায়ন পদ্ধতির পরামর্শ দেওয়া হয়। নিম্নলিখিত টপোলজি এবং পদক্ষেপগুলি একটি সাধারণ বাস্তবায়ন রূপরেখা দেয়ঃ

  • পরীক্ষামূলক পর্যায়:স্টোরেজ সার্ভার এবং কম্পিউটিং নোডের একটি ছোট ক্লাস্টার স্থাপন করুন, প্রতিটিMCX4121A-ACATRoCE ট্রাফিকের জন্য একটি ক্ষতিহীন ফ্যাব্রিক নিশ্চিত করার জন্য PFC / ETS কনফিগারেশনটি যাচাই করুন।
  • ইন্টিগ্রেশন এবং টেস্টিংঃকনফিগার করুনMCX4121A-ACAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানউভয় স্টোরেজ টার্গেট (যেমন, Ceph, Lustre, বা মালিকানাধীন NVMe-oF অ্যারে) এবং ক্লায়েন্ট অ্যাপ্লিকেশন উপর।পারফেক্টবেসলাইন লেটেন্সি (ib_send_lat) এবং ব্যান্ডউইথ (ib_send_bw) পরিমাপ করতে।
  • ফ্যাব্রিক স্কেলিং:একবার পাইলট স্থিতিশীল হয়ে গেলে, একটি সম্পূর্ণ পাতা-পিঁড়ির টপোলজিতে স্কেল করুন। পুরো নেটওয়ার্কে ক্ষতিহীন QoS চিহ্নিতকরণ বজায় রাখতে স্পাইন সুইচগুলিও RoCE- সচেতন তা নিশ্চিত করুন।এনভিডিয়া মেলানোক্স এমসিএক্স ৪১২১এ-এসিএটিরিডান্ডান্সি এবং বর্ধিত থ্রুপুটের জন্য সক্রিয় / স্ট্যান্ডবাই বা 802.3ad লিঙ্ক সমষ্টির অনুমতি দেয়।
  • সামঞ্জস্যতা পরীক্ষাঃসর্বদা যাচাই করুনMCX4121A-ACAT সামঞ্জস্যপূর্ণহার্ডওয়্যার এবং ফার্মওয়্যার সংস্করণ।MCX4121A-ACAT স্পেসিফিকেশনএবংMCX4121A-ACAT ডেটা শীটসার্ভার মাদারবোর্ড, BIOS সেটিংস এবং সুইচ ফার্মওয়্যারের সাথে সামঞ্জস্যতা নিশ্চিত করার জন্য পর্যালোচনা করা উচিত।MCX4121A-ACAT দামবিশেষ করে যখন বড় আকারের পরিকল্পনা করা হয় তখন অনুমোদিত পরিবেশকদের মাধ্যমে এটি পাওয়া যায়।বিক্রির জন্য MCX4121A-ACATক্রয়।

5অপারেশনাল মনিটরিং, সমস্যা সমাধান এবং অপ্টিমাইজেশান

সর্বোচ্চ পারফরম্যান্স বজায় রাখার জন্য সক্রিয় পর্যবেক্ষণ এবং RoCE ফ্যাব্রিক আচরণের একটি শক্ত বোঝার প্রয়োজন। অপারেশন টিমগুলির জন্য মূল সুপারিশগুলির মধ্যে রয়েছেঃ

  • আরডিএমএ ট্রাফিক পর্যবেক্ষণঃযেমন সরঞ্জাম ব্যবহার করুনইথুল,mlxstat, এবং এনভিআইডিআইএ এরইউএফএম (ইউনিফাইড ফ্যাব্রিক ম্যানেজার)অ্যাডাপ্টারের তাপমাত্রা, লিংক ত্রুটি এবং আরডিএমএ সারি জোড়ের অবস্থা পর্যবেক্ষণ করার জন্য। সমালোচনামূলক মেট্রিকগুলির মধ্যে রয়েছেঃ RoCE প্যাকেট ড্রপ, পিএফসি বিরতি ফ্রেম গণনা এবং পিসিআইই ব্যান্ডউইথ ব্যবহার।
  • ত্রুটি বিচ্ছিন্নতাঃআরডিএমএ ট্র্যাফিকের উচ্চ বিলম্ব প্রায়শই জমে থাকা প্যাকেটের কারণে ঘটে। পিএফসি বিরতি ফ্রেমগুলি তদন্ত করুন; যদি কোনও নির্দিষ্ট সারি অত্যধিক বিরতিতে থাকে,এটি একটি বোতল ঘাঁটি নির্দেশ করে (e.g., একটি সুইচ প্রস্থান পোর্ট) ।MCX4121A-ACATএর উন্নত কাউন্টারগুলি যানজটের সঠিক উৎস চিহ্নিত করতে সাহায্য করতে পারে।
  • পারফরম্যান্স টিউনিংঃ
    • এমটিইউ আকারঃপ্রতি প্যাকেটে ওভারহেড হ্রাস এবং বড় I / O কর্মক্ষমতা উন্নত করতে উভয় অ্যাডাপ্টার এবং সুইচগুলিতে 9000 বাইটে (জাম্বো ফ্রেম) বৃদ্ধি করুন।
    • রিসিভ সাইড স্কেলিং (আরএসএস):একাধিক সিপিইউ কোর জুড়ে ট্র্যাফিক বিতরণ করতে আরএসএস কনফিগার করা নিশ্চিত করুন, যাতে অ্যাডাপ্টার উচ্চ প্যাকেট-প্রতি-সেকেন্ড (পিপিএস) হার পরিচালনা করতে পারে।
    • বাফার টিউনিংঃঅ্যাডাপ্টারের রিসিভ এবং ট্রান্সমিশন বাফারগুলি কাজের চাপের বৈশিষ্ট্যগুলির উপর ভিত্তি করে সামঞ্জস্য করুন (উদাহরণস্বরূপ, স্টোরেজের জন্য বৃহত্তর বাফার, এইচপিসির জন্য ছোট) ।

6উপসংহার এবং মূল্য মূল্যায়ন

দ্যMCX4121A-ACATNVIDIA Mellanox থেকে একটি পরিপক্ক, উচ্চ কর্মক্ষমতা ভিত্তি প্রদান করে পরবর্তী প্রজন্মের ডেটা সেন্টার নির্মাণের জন্য। একটি ভাল পরিকল্পিত RoCEv2 ফ্যাব্রিক মধ্যে এই অ্যাডাপ্টার একীভূত করে,সংস্থাগুলি রূপান্তরমূলক ফলাফল অর্জন করতে পারে: সার্ভার থ্রুপুট সর্বাধিক করা যায় কারণ সিপিইউ নেটওয়ার্কিং ওভারহেড থেকে মুক্ত হয়; বিলম্বের সময়টি একক-অঙ্কের মাইক্রোসেকেন্ডে নাটকীয়ভাবে হ্রাস পায়, রিয়েল-টাইম অ্যাপ্লিকেশনগুলি সক্ষম করে;এবং অবকাঠামো সংযোজনের মাধ্যমে মালিকানার মোট খরচ কম হয়. 25GbE রোডম্যাপ পরিকল্পনা স্থপতিদের জন্য,MCX4121A-ACATএটি কর্মক্ষমতা এবং দক্ষতার ক্ষেত্রে একটি কৌশলগত বিনিয়োগের প্রতিনিধিত্ব করে, যা শক্তিশালী এনভিআইডিআইএ মেলানোক্স বাস্তুতন্ত্র দ্বারা সমর্থিত।