NVIDIA Mellanox MCX4121A-ACAT সার্ভার অ্যাডাপ্টার অ্যাকশনে | RDMA/RoCE লো-ল্যাটেন্সি ট্রান্সপোর্ট ও সার্ভার

April 22, 2026

সর্বশেষ কোম্পানির খবর NVIDIA Mellanox MCX4121A-ACAT সার্ভার অ্যাডাপ্টার অ্যাকশনে | RDMA/RoCE লো-ল্যাটেন্সি ট্রান্সপোর্ট ও সার্ভার


একটি বৃহৎ-পরিসরের ক্লাউড পরিষেবা প্রদানকারী তাদের পরবর্তী প্রজন্মের ডিস্ট্রিবিউটেড স্টোরেজ ক্লাস্টার তৈরির সময় একটি পরিচিত চ্যালেঞ্জের সম্মুখীন হয়েছিল। ক্লাস্টারটি শত শত নোডে প্রসারিত হওয়ার সাথে সাথে, ঐতিহ্যবাহী TCP/IP স্ট্যাকের অন্তর্নিহিত CPU ওভারহেড এবং মাইক্রোসেকেন্ড-স্তরের ল্যাটেন্সি জিটার NVMe-oF এবং ডিস্ট্রিবিউটেড ডাটাবেস পারফরম্যান্সকে মারাত্মকভাবে সীমাবদ্ধ করে। কঠোর মূল্যায়নের পর, দলটি তাদের নেটওয়ার্ক ফ্যাব্রিক আপগ্রেড করার জন্য NVIDIA Mellanox MCX4121A-ACAT সার্ভার অ্যাডাপ্টার নির্বাচন করেছে, ডেটা পাথকে মৌলিকভাবে রূপান্তর করতে RDMA/RoCE প্রযুক্তি ব্যবহার করেছে।

পটভূমি ও চ্যালেঞ্জ: ইস্ট-ওয়েস্ট ট্র্যাফিকের TCP/IP বাধা

আধুনিক ডেটা সেন্টারগুলিতে, ইস্ট-ওয়েস্ট ট্র্যাফিক—সার্ভারগুলির মধ্যে যোগাযোগ—সামগ্রিক ট্র্যাফিক প্যাটার্নগুলিতে আধিপত্য বিস্তার করে। প্রদানকারীর ডিস্ট্রিবিউটেড স্টোরেজ প্ল্যাটফর্মের জন্য, প্রতিটি I/O অপারেশনের জন্য একাধিক নেটওয়ার্ক রাউন্ড-ট্রিপের প্রয়োজন ছিল। প্রচলিত TCP স্ট্যাক শুধুমাত্র প্রোটোকল প্রক্রিয়াকরণের জন্য CPU কোরের ৩০% এর বেশি ব্যবহার করত, যা অপ্রত্যাশিত ল্যাটেন্সি স্পাইক তৈরি করত যা অ্যাপ্লিকেশনের পারফরম্যান্সকে নষ্ট করত। দলটির এমন একটি সমাধানের প্রয়োজন ছিল যা কার্নেলকে বাইপাস করতে পারে, CPU হস্তক্ষেপ কমাতে পারে এবং পুরো ক্লাস্টার জুড়ে সামঞ্জস্যপূর্ণ সাব-মাইক্রোসেকেন্ড ল্যাটেন্সি সরবরাহ করতে পারে।

সমাধান ও স্থাপন: RoCE পরিবহনের জন্য MCX4121A-ACAT স্থাপন

প্রদানকারী ১২০টি স্টোরেজ নোডে MCX4121A-ACAT ইথারনেট অ্যাডাপ্টার কার্ড স্থাপন করেছে, প্রতিটি ডুয়াল-পোর্ট 25GbE সংযোগ সহ কনফিগার করা হয়েছে। ConnectX-4 Lx আর্কিটেকচারের উপর নির্মিত, MCX4121A-ACAT ConnectX-4 Lx ডুয়াল-পোর্ট 25GbE SFP28 ডিজাইনটি ডেডিকেটেড InfiniBand পরিকাঠামোর প্রয়োজন ছাড়াই নির্বিঘ্ন RoCE (RDMA over Converged Ethernet) স্থাপনার সক্ষমতা প্রদান করেছে। মূল স্থাপনার প্যারামিটারগুলির মধ্যে অন্তর্ভুক্ত ছিল:

  • সমস্ত ToR সুইচগুলিতে কনফিগার করা Priority Flow Control (PFC) এবং Enhanced Transmission Selection (ETS)।
  • কনজেশন-সচেতন RoCE পরিবহনের জন্য ECN মার্কিং সক্ষম করা হয়েছে।
  • NVMe-oF ইনিশিয়েটর এবং টার্গেট রোলগুলি সরাসরি অ্যাডাপ্টারের হার্ডওয়্যার অফলোড ইঞ্জিনগুলিতে ম্যাপ করা হয়েছে।

MCX4121A-ACAT ডেটাশিট অনুসারে, অ্যাডাপ্টারের হার্ডওয়্যার-ভিত্তিক পরিবহন অফলোড ডেটা চলাচলে CPU-এর জড়িত থাকার প্রয়োজনীয়তা দূর করে। দলটি তাদের বিদ্যমান লিনাক্স ডিস্ট্রিবিউশন এবং SFP28 অপটিক্সের সাথে সামঞ্জস্যতা যাচাই করেছে, নিশ্চিত করেছে যে MCX4121A-ACAT সামঞ্জস্যপূর্ণ ইকোসিস্টেম সমস্ত প্রয়োজনীয়তা পূরণ করেছে।

ফলাফল ও সুবিধা: থ্রুপুট এবং ল্যাটেন্সিতে পরিমাপযোগ্য লাভ

স্থাপনার পরের পরীক্ষাগুলি নাটকীয় উন্নতির প্রকাশ করেছে। নীচের টেবিলটি MCX4121A-ACAT সমাধানে স্থানান্তরিত হওয়ার আগে এবং পরে মূল পারফরম্যান্স মেট্রিকগুলির সারসংক্ষেপ প্রদান করে:

মেট্রিক লিগ্যাসি 10GbE TCP MCX4121A-ACAT (RoCE) উন্নতি
গড় ল্যাটেন্সি (4KB I/O) 35µs 2.1µs 16.6x কম
CPU ব্যবহার (প্রতি 10Gb/s) 32% 4% 8x হ্রাস
সামগ্রিক থ্রুপুট (ডুয়াল-পোর্ট) 18Gb/s 49Gb/s 2.7x বেশি

কাঁচা সংখ্যার বাইরে, MCX4121A-ACAT স্পেসিফিকেশন বাস্তব অপারেশনাল সুবিধাতে রূপান্তরিত হয়েছে। ডিস্ট্রিবিউটেড ডাটাবেস প্রতিলিপি ল্যাটেন্সি ৮০% এর বেশি কমে গেছে, যা আরও আক্রমণাত্মক সামঞ্জস্যের নিশ্চয়তা প্রদান করে। NVMe-oF রিড/রাইট IOPS দ্বিগুণ হয়েছে, এবং নেটওয়ার্ক স্ট্যাক প্রক্রিয়াকরণে পূর্বে ব্যবহৃত স্টোরেজ নোডের CPU কোরগুলি প্রকৃত ডেটা পরিষেবাগুলির জন্য পুনরায় ব্যবহার করা হয়েছে। প্রদানকারী আরও উল্লেখ করেছে যে MCX4121A-ACAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধান তাদের মোট মালিকানা ব্যয় হ্রাস করেছে—একই সামগ্রিক পারফরম্যান্স অর্জনের জন্য কম নোডের প্রয়োজন হয়েছে।

একই ধরনের আপগ্রেড মূল্যায়নকারী সংস্থাগুলির জন্য, MCX4121A-ACAT মূল্য এটিকে মালিকানাধীন ইন্টারকানেক্ট সমাধানগুলির একটি সাশ্রয়ী বিকল্প হিসাবে স্থান দেয়। একাধিক পরিবেশক এখন MCX4121A-ACAT বিক্রয়ের জন্য তালিকাভুক্ত করে, ভলিউম মূল্য সহ, যা বৃহৎ-পরিসরের RoCE স্থাপনাগুলিকে ক্রমবর্ধমানভাবে সহজলভ্য করে তোলে।

সারসংক্ষেপ ও পূর্বাভাস: লো-ল্যাটেন্সি ডেটা সেন্টারগুলির জন্য একটি ব্লুপ্রিন্ট

এই স্থাপনটি প্রমাণ করে যে NVIDIA Mellanox MCX4121A-ACAT কেবল একটি স্পেসিফিকেশন আপগ্রেডের চেয়ে বেশি—এটি উচ্চ-পারফরম্যান্স ডিস্ট্রিবিউটেড সিস্টেমগুলির জন্য একটি মৌলিক সক্ষমতা। ডুয়াল-পোর্ট 25GbE ব্যান্ডউইথকে হার্ডওয়্যার-অফলোড করা RoCE পরিবহনের সাথে একত্রিত করে, অ্যাডাপ্টারটি নেটওয়ার্ক পারফরম্যান্স এবং CPU দক্ষতার মধ্যে দীর্ঘস্থায়ী উত্তেজনা সমাধান করে। যেহেতু AI প্রশিক্ষণ ক্লাস্টার, বিচ্ছিন্ন স্টোরেজ এবং রিয়েল-টাইম অ্যানালিটিক্স ক্রমাগত কম ল্যাটেন্সি এবং উচ্চ থ্রুপুট দাবি করে, MCX4121A-ACAT একটি প্রমাণিত, প্রোডাকশন-রেডি পথ সরবরাহ করে। নির্ভরযোগ্য, উচ্চ-পারফরম্যান্স সার্ভার অ্যাডাপ্টার খুঁজছেন এমন নেটওয়ার্ক স্থপতি এবং আইটি পরিচালকদের এই ConnectX-4 Lx পাওয়ারহাউস ছাড়া আর কিছু দেখার দরকার নেই।