কারিগরি সমাধান: Mellanox এর সাথে RDMA/RoCE লো-লেটেন্সি এবং থ্রুপুট অপ্টিমাইজেশন অর্জন

March 13, 2026

কারিগরি সমাধান: Mellanox এর সাথে RDMA/RoCE লো-লেটেন্সি এবং থ্রুপুট অপ্টিমাইজেশন অর্জন
১. প্রকল্পের পটভূমি এবং প্রয়োজনীয়তা বিশ্লেষণ

আধুনিক ডেটা সেন্টারগুলি ডিস্ট্রিবিউটেড ডেটাবেস, হাই-পারফরম্যান্স কম্পিউটিং (HPC) এবং এআই ট্রেনিং ক্লাস্টারের মতো লেটেন্সি-সংবেদনশীল অ্যাপ্লিকেশনগুলির জন্য উচ্চতর কর্মক্ষমতা প্রদানে ক্রমাগত চাপের মধ্যে রয়েছে। ঐতিহ্যবাহী TCP/IP নেটওয়ার্কিং উল্লেখযোগ্য CPU ওভারহেড আরোপ করে, যা বাধা তৈরি করে যা অ্যাপ্লিকেশন স্কেলেবিলিটি সীমিত করে এবং প্রতিক্রিয়া সময় বাড়ায়। তাদের পরিকাঠামো আধুনিকীকরণ করতে ইচ্ছুক সংস্থাগুলির জন্য, মূল প্রয়োজনীয়তা স্পষ্ট: ব্যয়বহুল স্থাপত্যিক সংস্কার ছাড়াই লেটেন্সি হ্রাস এবং সার্ভার থ্রুপুট বৃদ্ধি।

সমাধানটি কনভার্জড ইথারনেটের (RoCE) উপর RDMA (রিমোট ডাইরেক্ট মেমরি অ্যাক্সেস) গ্রহণ করার মধ্যে নিহিত। এই প্রযুক্তি অপারেটিং সিস্টেম কার্নেলকে বাইপাস করে CPU রিসোর্স মুক্ত করতে এবং লেটেন্সি কমাতে সরাসরি মেমরি-টু-মেমরি ডেটা স্থানান্তর সক্ষম করে। এই রূপান্তরের কেন্দ্রে রয়েছে নেটওয়ার্ক ইন্টারফেস কার্ড (NIC)। Mellanox (NVIDIA) থেকে MCX631432AN-ADAB বিশেষভাবে এই চাহিদাগুলি মেটাতে তৈরি করা হয়েছে, যা RoCE-সক্ষম ফ্যাব্রিকগুলির জন্য একটি শক্তিশালী ভিত্তি সরবরাহ করে।

২. সামগ্রিক নেটওয়ার্ক এবং সিস্টেম আর্কিটেকচার ডিজাইন

প্রস্তাবিত আর্কিটেকচারটি একটি লিফ-স্পাইন ফ্যাব্রিক যা একটি লসলেস ইথারনেট পরিবেশের জন্য ডিজাইন করা হয়েছে, যা সর্বোত্তম RoCEv2 কর্মক্ষমতার জন্য একটি পূর্বশর্ত। ডিজাইনটি জটিলতা এবং খরচ কমাতে একটি ইউনিফাইড, হাই-স্পিড ফ্যাব্রিকের উপর কম্পিউট এবং স্টোরেজ ট্র্যাফিককে একীভূত করে।

  • স্পাইন লেয়ার: হাই-ক্যাপাসিটি 100GbE সুইচগুলি সমস্ত লিফ সুইচগুলির মধ্যে নন-ব্লকিং সংযোগ সরবরাহ করে, যা যেকোনো-থেকে-যেকোনো লো-লেটেন্সি পাথ নিশ্চিত করে।
  • লিফ লেয়ার: টপ-অফ-র‍্যাক (ToR) সুইচগুলি 25GbE ডাউনলিঙ্ক সহ সার্ভার এবং স্টোরেজ নোডগুলির সাথে সংযোগ স্থাপন করে। এই সুইচগুলি একটি লসলেস ফ্যাব্রিক বজায় রাখার জন্য প্রায়োরিটি ফ্লো কন্ট্রোল (PFC) এবং এক্সপ্লিসিট কনজেশন নোটিফিকেশন (ECN) দিয়ে কনফিগার করা হয়েছে।
  • সার্ভার লেয়ার: প্রতিটি সার্ভার NVIDIA Mellanox MCX631432AN-ADAB, একটি ডুয়াল-পোর্ট 25GbE SFP28 অ্যাডাপ্টার দিয়ে সজ্জিত। এটি নেটওয়ার্ক বন্ডিং বা স্টোরেজ এবং কম্পিউট ট্র্যাফিকের জন্য পৃথক পাথগুলির অনুমতি দেয়।

এই ডিজাইনটি নিশ্চিত করে যে MCX631432AN-ADAB ইথারনেট অ্যাডাপ্টার কার্ড এমন একটি পরিবেশে কাজ করে যেখানে RoCE ট্র্যাফিক প্যাকেট লস ছাড়াই প্রবাহিত হতে পারে, যা উচ্চ থ্রুপুট এবং লো লেটেন্সি বজায় রাখার জন্য অত্যন্ত গুরুত্বপূর্ণ।

৩. সমাধানে MCX631432AN-ADAB এর ভূমিকা

Mellanox (NVIDIA) থেকে MCX631432AN-ADAB হল গুরুত্বপূর্ণ এন্ডপয়েন্ট। ConnectX-6 Lx পরিবারের সদস্য হিসাবে, এটি 25GbE ফর্ম ফ্যাক্টরে এন্টারপ্রাইজ-গ্রেড বৈশিষ্ট্য নিয়ে আসে। এর প্রাথমিক ভূমিকা হল কম্পিউট এবং স্টোরেজ উভয় ট্র্যাফিকের জন্য MCX631432AN-ADAB ইথারনেট অ্যাডাপ্টার কার্ড সমাধান হিসাবে কাজ করা, সার্ভার CPU থেকে নেটওয়ার্কিং কাজগুলি অফলোড করা।

অ্যাডাপ্টারের মূল প্রযুক্তিগত অবদানগুলির মধ্যে রয়েছে:

  • হার্ডওয়্যার অফলোড: কার্ডটি পরিবহন, এনক্যাপসুলেশন এবং কনজেশন কন্ট্রোল সহ হার্ডওয়্যারে RoCE প্রোটোকলের সমস্ত দিক পরিচালনা করে। এটি নিশ্চিত করে যে RDMA অপারেশনগুলি প্রায় শূন্য CPU সাইকেল ব্যবহার করে।
  • ডুয়াল-পোর্ট নমনীয়তা: ডুয়াল 25GbE পোর্টগুলি সক্রিয়/স্ট্যান্ডবাই ফেইলওভারের জন্য কনফিগার করা যেতে পারে বা ট্র্যাফিক প্রকারগুলি পৃথক করতে ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, একটি পোর্ট ফ্রন্ট-এন্ড ইথারনেট ট্র্যাফিক পরিচালনা করতে পারে যখন অন্যটি RoCE ব্যবহার করে ব্যাক-এন্ড স্টোরেজ ট্র্যাফিকের জন্য নিবেদিত থাকে, থ্রুপুট এবং নিরাপত্তা সর্বাধিক করে।
  • PCIe 3.0 x16 হোস্ট ইন্টারফেস: উভয় 25GbE পোর্টকে একযোগে চালানোর জন্য পর্যাপ্ত ব্যান্ডউইথ সহ, MCX631432AN-ADAB ConnectX-6 Lx ডুয়াল-পোর্ট 25GbE SFP28 নিশ্চিত করে যে কোনও অভ্যন্তরীণ বাধা অ্যাপ্লিকেশন কর্মক্ষমতা সীমিত করে না।
৪. স্থাপনা এবং স্কেলিংয়ের সুপারিশ

MCX631432AN-ADAB স্থাপন করার জন্য নেটওয়ার্ক ফ্যাব্রিক এবং সার্ভার কনফিগারেশনের সতর্ক পরিকল্পনা প্রয়োজন। নিম্নলিখিত পদক্ষেপগুলি একটি উচ্চ-পারফরম্যান্স ক্লাস্টারের জন্য একটি সাধারণ স্থাপনার রূপরেখা দেয়:

  • ফ্যাব্রিক প্রস্তুতি: স্থাপনার আগে, RoCE সমর্থন করার জন্য নেটওয়ার্ক সুইচগুলি কনফিগার করুন। এর মধ্যে RoCE ট্র্যাফিক ক্লাসের জন্য PFC সক্ষম করা এবং ECN-ভিত্তিক কনজেশন ম্যানেজমেন্ট বাস্তবায়ন অন্তর্ভুক্ত। এটি লসলেস পরিবেশ তৈরি করে যা অ্যাডাপ্টারের সর্বোত্তমভাবে কাজ করার জন্য প্রয়োজনীয়।
  • ড্রাইভার এবং ফার্মওয়্যার ইনস্টলেশন: সম্পূর্ণ বৈশিষ্ট্য সমর্থন নিশ্চিত করতে সর্বশেষ NVIDIA WinOF-2 ড্রাইভার (Windows এর জন্য) বা MLNX_OFED (Linux এর জন্য) ইনস্টল করুন। সর্বোত্তম RoCE কর্মক্ষমতা এবং সামঞ্জস্যের জন্য MCX631432AN-ADAB এর ফার্মওয়্যার আপ-টু-ডেট আছে কিনা তা যাচাই করা অত্যন্ত গুরুত্বপূর্ণ।
  • ক্লাস্টার স্কেলিং: আর্কিটেকচারটি প্রতিটি নিজস্ব MCX631432AN-ADAB সহ আরও সার্ভার নোড যুক্ত করে অনুভূমিকভাবে স্কেল করে। নন-ব্লকিং লিফ-স্পাইন ফ্যাব্রিক নিশ্চিত করে যে যুক্ত নোডগুলি বিদ্যমান নোডগুলির কর্মক্ষমতা হ্রাস করে না। বৃহত্তর স্থাপনার জন্য, লিফ এবং স্পাইন সুইচগুলির মধ্যে লিঙ্ক অ্যাগ্রিগেশন গ্রুপ (LAGs) ব্যবহার করা যেতে পারে।

একটি ডেটাবেস ক্লাস্টারের জন্য একটি সাধারণ টপোলজিতে ইন্টার-র‍্যাক লেটেন্সি কমাতে একই লিফ সুইচে প্রাইমারি এবং রেপ্লিকা সার্ভারগুলি সংযোগ করা জড়িত। প্রতিটি সার্ভার রিডানডেন্সির জন্য দুটি পৃথক লিফ সুইচে সংযোগ করার জন্য তার ডুয়াল-পোর্ট অ্যাডাপ্টার ব্যবহার করে।

৫. অপারেশনাল মনিটরিং, ট্রাবলশুটিং এবং অপ্টিমাইজেশান

স্থাপনের পরে, কর্মক্ষমতা বজায় রাখার জন্য সক্রিয় পর্যবেক্ষণ এবং টিউনিং প্রয়োজন। MCX631432AN-ADAB এই উদ্দেশ্যে ব্যাপক টেলিমেট্রি সরবরাহ করে।

  • মূল মেট্রিকগুলি পর্যবেক্ষণ করা: পোর্ট কাউন্টার, লিঙ্ক ত্রুটি এবং RDMA ট্র্যাফিক পরিসংখ্যান নিরীক্ষণের জন্য `mlxstat` এবং `ethtool` এর মতো সরঞ্জামগুলি ব্যবহার করুন। PFC পজ ফ্রেমগুলি ট্র্যাক করা অপরিহার্য; একটি উচ্চ সংখ্যা একটি লসি ফ্যাব্রিক নির্দেশ করে যা RoCE কর্মক্ষমতা হ্রাস করবে।
  • ফার্মওয়্যার এবং ড্রাইভার আপডেট: নিয়মিত আপডেটের জন্য পরীক্ষা করুন। নতুন ফার্মওয়্যারে প্রায়শই কর্মক্ষমতা অপ্টিমাইজেশান এবং বাগ ফিক্স অন্তর্ভুক্ত থাকে যা লেটেন্সি আরও কমাতে এবং আপস্ট্রিম সুইচগুলির সাথে সামঞ্জস্য উন্নত করতে পারে।
  • কর্মক্ষমতা টিউনিং: সবচেয়ে বেশি লেটেন্সি প্রয়োজনীয়তা সহ পরিবেশের জন্য, ইন্টারাপ্ট মডারেশন এবং বাফার আকারগুলি ফাইন-টিউনিং করলে অতিরিক্ত লাভ হতে পারে। অ্যাডাপ্টারের নমনীয়তা স্থপতিদের তাদের নির্দিষ্ট ওয়ার্কলোডের উপর ভিত্তি করে সেটিংস ডায়াল ইন করার অনুমতি দেয় (যেমন, HPC বনাম ভার্চুয়ালাইজেশন)।

সংযোগ সমস্যা সমাধানের জন্য, SFP28 মডিউলগুলি MCX631432AN-ADAB সামঞ্জস্যপূর্ণ কিনা তা যাচাই করা প্রথম পদক্ষেপ। NVIDIA-প্রত্যয়িত অপটিক্স ব্যবহার করা নির্ভরযোগ্য লিঙ্ক স্থাপন এবং কর্মক্ষমতা নিশ্চিত করে।

৬. সারসংক্ষেপ এবং মূল্য মূল্যায়ন

Mellanox (NVIDIA) থেকে MCX631432AN-ADAB একটি উচ্চ-পারফরম্যান্স, লো-লেটেন্সি নেটওয়ার্ক ফ্যাব্রিক বাস্তবায়নের জন্য একটি স্পষ্ট এবং কার্যকর পথ সরবরাহ করে। এর উন্নত RoCE অফলোড ক্ষমতাগুলি ব্যবহার করে, সংস্থাগুলি নাটকীয়ভাবে হ্রাসকৃত CPU ওভারহেড এবং উল্লেখযোগ্যভাবে বৃদ্ধিপ্রাপ্ত সার্ভার থ্রুপুট উভয় সুবিধা অর্জন করতে পারে। বিস্তারিত MCX631432AN-ADAB স্পেসিফিকেশন এবং MCX631432AN-ADAB ডেটাশিট সবচেয়ে বেশি চাহিদাযুক্ত ওয়ার্কলোডগুলি পরিচালনা করার জন্য এর ক্ষমতাকে বৈধতা দেয়।

আইটি ম্যানেজার এবং নেটওয়ার্ক স্থপতিদের জন্য যারা হার্ডওয়্যার রিফ্রেশ মূল্যায়ন করছেন, এই সমাধানের দ্বারা প্রদত্ত কর্মক্ষমতা লাভ সরাসরি ব্যবসায়িক মূল্যে অনুবাদ করে: দ্রুত লেনদেন প্রক্রিয়াকরণ, আরও দক্ষ স্টোরেজ অ্যাক্সেস এবং উন্নত মোট মালিকানা ব্যয়। ডেটার চাহিদা বাড়তে থাকায়, MCX631432AN-ADAB স্থাপন নিশ্চিত করে যে নেটওয়ার্ক পরিকাঠামো একটি বাধা নয়, বরং একটি ত্বরণকারী। বিস্তারিত মূল্য তথ্যের জন্য বা MCX631432AN-ADAB মূল্য এবং প্রাপ্যতা পরীক্ষা করতে, অনুগ্রহ করে আপনার NVIDIA প্রতিনিধির সাথে পরামর্শ করুন।