NVIDIA Mellanox MCX653106A-HDAT সার্ভার অ্যাডাপ্টার অ্যাকশনে: RDMA/RoCE লো-লেটেন্সি ট্রান্সপোর্ট ও সার্ভার

April 30, 2026

সর্বশেষ কোম্পানির খবর NVIDIA Mellanox MCX653106A-HDAT সার্ভার অ্যাডাপ্টার অ্যাকশনে: RDMA/RoCE লো-লেটেন্সি ট্রান্সপোর্ট ও সার্ভার

আধুনিক ডেটা সেন্টার পরিবেশে—ডিস্ট্রিবিউটেড স্টোরেজ এবং হাই-ফ্রিকোয়েন্সি ট্রেডিং থেকে শুরু করে বৃহৎ আকারের এআই ট্রেনিং ক্লাস্টার পর্যন্ত—প্রচলিত টিসিপি/আইপি প্রোটোকল স্ট্যাকগুলি একটি প্রধান বাধা হয়ে দাঁড়িয়েছে। কার্নেল নেটওয়ার্কিং, ডেটা কপি এবং কনটেক্সট সুইচিংয়ের ওভারহেড উল্লেখযোগ্য সিপিইউ রিসোর্স ব্যবহার করে এবং অপ্রত্যাশিত ল্যাটেন্সি তৈরি করে। এই কেস স্টাডিটি পরীক্ষা করে দেখেছে কিভাবে একটি শীর্ষস্থানীয় ক্লাউড ইনফ্রাস্ট্রাকচার প্রদানকারী NVIDIA Mellanox MCX653106A-HDAT সার্ভার এনআইসি স্থাপন করে এই চ্যালেঞ্জগুলি অতিক্রম করেছে, ল্যাটেন্সি এবং থ্রুপুট উভয় ক্ষেত্রেই নাটকীয় উন্নতি অর্জন করেছে।

পটভূমি ও চ্যালেঞ্জ: টিসিপি/আইপি বাধা

প্রদানকারীর বিদ্যমান ২৫জিবিই ইনফ্রাস্ট্রাকচার, স্ট্যান্ডার্ড টিসিপি ব্যবহার করে, এনভিএমই-ওএফ স্টোরেজ ট্র্যাফিক এবং রিয়েল-টাইম অ্যানালিটিক্স ওয়ার্কলোডগুলির সাথে তাল মিলিয়ে চলতে হিমশিম খাচ্ছিল। স্টোরেজ নোডগুলিতে সিপিইউ ব্যবহার প্রায়শই শুধুমাত্র নেটওয়ার্ক প্রক্রিয়াকরণের জন্য ৭০% ছাড়িয়ে যেত, অ্যাপ্লিকেশন লজিকের জন্য অপর্যাপ্ত হেডরুম রেখে যেত। কম্পিউট এবং স্টোরেজ নোডগুলির মধ্যে এন্ড-টু-এন্ড ল্যাটেন্সি ৫০–১৫০ মাইক্রোসেকেন্ডের মধ্যে ওঠানামা করত, যার ফলে টেইল ল্যাটেন্সি স্পাইক দেখা দিত যা পরিষেবা-স্তরের চুক্তিকে প্রভাবিত করত। ইঞ্জিনিয়ারিং টিম বুঝতে পেরেছিল যে নেটওয়ার্কিং আর্কিটেকচারে একটি মৌলিক পরিবর্তন প্রয়োজন—এমন একটি যা কার্নেলকে বাইপাস করে এবং এন্ডপয়েন্টগুলির মধ্যে সরাসরি মেমরি অ্যাক্সেস সক্ষম করে।

সমাধান: RoCE সহ MCX653106A-HDAT স্থাপন

একাধিক বিকল্প মূল্যায়নের পর, দলটি তাদের নেটওয়ার্ক রিফ্রেশের ভিত্তি হিসাবে MCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড নির্বাচন করে। কানেক্টএক্স-৬ আর্কিটেকচারের উপর নির্মিত, এই MCX653106A-HDAT কানেক্টএক্স অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ড RoCE (RDMA over Converged Ethernet) এর জন্য নেটিভ হার্ডওয়্যার সমর্থন সহ ডুয়াল-পোর্ট ১০০জিবিই সংযোগ সরবরাহ করে। স্থাপনটি একটি পর্যায়ক্রমিক পদ্ধতির অনুসরণ করে:

  • পর্যায় ১:নতুন অ্যাডাপ্টার দিয়ে স্টোরেজ নোডগুলিতে (১০টি নোড Ceph চালাচ্ছে) লিগ্যাসি এনআইসি প্রতিস্থাপন করুন।
  • পর্যায় ২:NIC এবং টপ-অফ-র্যাক সুইচ উভয়টিতে DCB (Priority Flow Control and ETS) ব্যবহার করে লসলেস ইথারনেট কনফিগার করুন।
  • পর্যায় ৩:অ্যাপ্লিকেশন ট্র্যাফিক টিসিপি সকেট থেকে RDMA-ভিত্তিক ভার্বস এবং RoCE এর উপর NVMe-oF এ স্থানান্তর করুন।
  • পর্যায় ৪:রিয়েল-টাইম অ্যানালিটিক্স পরিচালনা করা কম্পিউট নোডগুলিতে স্থাপন প্রসারিত করুন।

ইঞ্জিনিয়াররা MCX653106A-HDAT ডেটাশিট এবং MCX653106A-HDAT স্পেসিফিকেশন পর্যালোচনা করে বিদ্যমান মেলানক্স সুইচ ফ্যাব্রিক এবং স্থাপিত লিনাক্স ডিস্ট্রিবিউশন (MLNX_OFED ড্রাইভার সহ উবুন্টু ২২.০৪) এর সাথে সম্পূর্ণ সামঞ্জস্যতা নিশ্চিত করেছেন। MCX653106A-HDAT সামঞ্জস্যপূর্ণ ইকোসিস্টেমটি ব্যাপক প্রমাণিত হয়েছে, শুধুমাত্র এনআইসি প্রতিস্থাপন ছাড়া অন্য কোনো হার্ডওয়্যার পরিবর্তনের প্রয়োজন হয়নি।

ফলাফল ও সুবিধা: পরিমাপযোগ্য রূপান্তর

স্থাপনের পরের পরীক্ষাগুলি সমস্ত মূল মেট্রিক্সে উল্লেখযোগ্য উন্নতি প্রকাশ করেছে। নিম্নলিখিত সারণীটি আগে এবং পরের তুলনা সংক্ষিপ্ত করে:

মেট্রিক আগে (২৫জিবিই টিসিপি) পরে (MCX653106A-HDAT RoCE) উন্নতি
গড় ল্যাটেন্সি (P99) ১২০ µs ৮ µs ৯৩% হ্রাস
স্টোরেজ নোড সিপিইউ (নেটওয়ার্ক পাথ) ~৬৫% ~১২% ৫.৪ গুণ হ্রাস
NVMe-oF রিড থ্রুপুট (প্রতি নোড) ১৮ Gb/s ৯৬ Gb/s ৫.৩ গুণ বৃদ্ধি
মেসেজ রেট (৬৪বি প্যাকেট) ১৫ Mpps ২১৫ Mpps ১৪.৩ গুণ বৃদ্ধি

এই পরিমাণগত লাভের বাইরে, দলটি বেশ কয়েকটি গুণগত সুবিধা লক্ষ্য করেছে। MCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানঅ্যাপ্লিকেশন মেমরি এবং রিমোট স্টোরেজের মধ্যে সত্যিকারের জিরো-কপি ডেটা মুভমেন্ট সক্ষম করেছে, বাফার এক্সহশন সমস্যাগুলি দূর করেছে যা পূর্বে ট্র্যাফিক বার্স্টের সময় মাঝে মাঝে ব্যর্থতার কারণ হত। অ্যানালিটিক্স ওয়ার্কলোডের জন্য, RDMA তে স্থানান্তর করার ফলে কাজের সমাপ্তির সময় ৬২% কমে গেছে, যা সরাসরি ব্যবসায়িক ফলাফল উন্নত করেছে। মোট মালিকানা ব্যয়ের বিপরীতে MCX653106A-HDAT মূল্য মূল্যায়ন করার সময়, স্টোরেজ নোডের সংখ্যা ৩০% হ্রাস (প্রতি নোডে উচ্চতর দক্ষতার কারণে) নয় মাসের মধ্যে পরিশোধ করেছে। এনভিডিয়া অংশীদারদের মাধ্যমে MCX653106A-HDAT বিক্রয়ের জন্য DOCA ফ্রেমওয়ার্কের অ্যাক্সেসও অন্তর্ভুক্ত ছিল, যা কাস্টম নেটওয়ার্ক ফাংশনগুলির জন্য ভবিষ্যতের প্রোগ্রামেবিলিটি আনলক করেছে।

উপসংহার ও পূর্বাভাস: পরবর্তী প্রজন্মের ইনফ্রাস্ট্রাকচারের জন্য একটি ভিত্তি

NVIDIA Mellanox MCX653106A-HDAT স্থাপন প্রদানকারীর ইনফ্রাস্ট্রাকচারকে একটি টিসিপি-সীমিত পরিবেশ থেকে একটি উচ্চ-পারফরম্যান্স, লো-ল্যাটেন্সি ফ্যাব্রিক-এ রূপান্তরিত করেছে যা আধুনিক ওয়ার্কলোডগুলিকে সমর্থন করতে সক্ষম। হার্ডওয়্যার-অফলোডেড RoCE, PCIe 4.0 ইন্টারফেস এবং ব্যাপক সফ্টওয়্যার ইকোসিস্টেমের সংমিশ্রণ আজকের ডেটা সেন্টারগুলির তিনটি গুরুত্বপূর্ণ চাহিদা পূরণ করে: হ্রাসকৃত ল্যাটেন্সি, বর্ধিত থ্রুপুট এবং উন্নত সিপিইউ দক্ষতা।

একই ধরনের আপগ্রেড মূল্যায়নকারী স্থপতিদের জন্য, যাত্রাটি MCX653106A-HDAT সামঞ্জস্যপূর্ণ উপাদানগুলি—সুইচ, কেবল এবং অপারেটিং সিস্টেম সহ—যাচাই করার মাধ্যমে শুরু হয়। বিস্তারিত MCX653106A-HDAT ডেটাশিট ইন্টিগ্রেশন পরিকল্পনার জন্য পাওয়ার, থার্মাল এবং মেকানিক্যাল স্পেসিফিকেশন সরবরাহ করে। যেহেতু ২০০জিবিই ফ্যাব্রিকগুলি স্ট্যান্ডার্ড হয়ে উঠছে এবং এআই ট্রেনিং ক্লাস্টারগুলির জন্য আরও কম ল্যাটেন্সি প্রয়োজন, MCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড একটি প্রমাণিত, প্রোডাকশন-হার্ডেন্ড সমাধান হিসাবে প্রস্তুত। প্রদানকারী এখন এআই ইনফারেন্স ওয়ার্কলোডগুলির জন্য জিপিইউ ডাইরেক্ট আরডিএমএ অন্তর্ভুক্ত করার জন্য স্থাপন প্রসারিত করছে, এই অ্যাডাপ্টারটিকে আধুনিক ডেটা সেন্টার আর্কিটেকচারের ভিত্তি হিসাবে আরও বৈধতা দিচ্ছে।