NVIDIA Mellanox MCX653105A-HDAT সার্ভার অ্যাডাপ্টার অ্যাকশনেঃ RDMA/RoCE লো-লেটেন্সি ট্রান্সপোর্টের সাথে থ্রুপুট বাড়ানো

March 16, 2026

সর্বশেষ কোম্পানির খবর NVIDIA Mellanox MCX653105A-HDAT সার্ভার অ্যাডাপ্টার অ্যাকশনেঃ RDMA/RoCE লো-লেটেন্সি ট্রান্সপোর্টের সাথে থ্রুপুট বাড়ানো
পটভূমি ও চ্যালেঞ্জ: স্টোরেজ এবং কম্পিউটেশনাল বাধা

একটি শীর্ষস্থানীয় ফিনটেক সংস্থা, তাদের পরবর্তী প্রজন্মের বিগ ডেটা অ্যানালিটিক্স প্ল্যাটফর্ম নির্মাণের সময়, গুরুতর নেটওয়ার্ক I/O বাধার সম্মুখীন হয়েছিল। বিদ্যমান 10GbE পরিকাঠামো রিয়েল-টাইম ঝুঁকি মূল্যায়ন এবং উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং বিশ্লেষণের জন্য প্রয়োজনীয় বিশাল ডেটা প্রবাহ পরিচালনা করতে হিমশিম খাচ্ছিল। সিপিইউ কোরগুলি নেটওয়ার্ক ট্র্যাফিক পরিচালনার জন্য তাদের চক্রের ৩০% পর্যন্ত ব্যয় করছিল, যার ফলে গুরুত্বপূর্ণ অ্যাপ্লিকেশন প্রক্রিয়াকরণের জন্য কম সংস্থান অবশিষ্ট ছিল। মূল চ্যালেঞ্জটি স্পষ্ট ছিল: তাদের বিতরণ করা ডেটাবেস এবং এআই-চালিত বিশ্লেষণকে স্কেল করার জন্য, তাদের পুরো সার্ভার বহরকে নতুন করে সাজানো ছাড়াই ল্যাটেন্সি হ্রাস এবং কার্যকর সার্ভার থ্রুপুট বাড়াতে হবে।

ঐতিহ্যবাহী TCP/IP নেটওয়ার্কিং আর কার্যকর ছিল না। কার্নেল নেটওয়ার্ক স্ট্যাকের ওভারহেড অপ্রত্যাশিত ল্যাটেন্সি স্পাইক তৈরি করেছিল, যা তাদের ইন-মেমরি ডেটাবেস এবং NVMe-ভিত্তিক স্টোরেজ ক্লাস্টারের কর্মক্ষমতাকে সরাসরি প্রভাবিত করেছিল। সংস্থাটির এমন একটি সমাধানের প্রয়োজন ছিল যা সিপিইউ থেকে নেটওয়ার্ক প্রক্রিয়াকরণ অফলোড করতে পারে এবং সার্ভার ও স্টোরেজের মধ্যে সরাসরি, উচ্চ-গতির ডেটা চলাচল সক্ষম করতে পারে। বেশ কয়েকটি বিকল্প মূল্যায়নের পর, MCX653105A-HDAT সার্ভার অ্যাডাপ্টার কার্ড তাদের গুরুত্বপূর্ণ কম্পিউট এবং স্টোরেজ নোডগুলিতে স্থাপন করার সিদ্ধান্ত নেওয়া হয়েছিল।

সমাধান ও স্থাপন: RDMA এবং RoCE ক্ষমতার উন্মোচন

স্থাপনটি MCX653105A-HDAT, NVIDIA Mellanox ConnectX-6 পরিবারের একটি ডুয়াল-পোর্ট 100Gb/s অ্যাডাপ্টারের উপর কেন্দ্র করে ছিল। ডেটা স্থানান্তরের জন্য সিপিইউকে বাইপাস করতে RDMA over Converged Ethernet (RoCE) বাস্তবায়ন করাই ছিল প্রাথমিক লক্ষ্য। NVIDIA Mellanox MCX653105A-HDAT কে RoCE-এর জন্য এর নেটিভ হার্ডওয়্যার সমর্থনের জন্য বেছে নেওয়া হয়েছিল, যা একটি স্ট্যান্ডার্ড ইথারনেট ফ্যাব্রিকের উপর কাজ করার সময় InfiniBand-এর কম-ল্যাটেন্সি সুবিধা প্রদান করে, বিদ্যমান নেটওয়ার্ক সুইচগুলির সাথে সামঞ্জস্যতা নিশ্চিত করে।

ইঞ্জিনিয়ারিং টিম স্পাইন-লিফ টপোলজিতে সার্ভারগুলি কনফিগার করেছিল, যা অনুমানযোগ্য কর্মক্ষমতা সহ যেকোনো-থেকে-যেকোনো সংযোগ সক্ষম করে। সাফল্যের মূল চাবিকাঠি ছিল ডেটাবেস সার্ভার এবং অল-NVMe স্টোরেজ অ্যারে উভয় ক্ষেত্রেই MCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড স্থাপন। হার্ডওয়্যার-ভিত্তিক RoCE অফলোডগুলি ব্যবহার করে, দলটি শূন্য প্যাকেট ড্রপ নিশ্চিত করার জন্য Priority Flow Control (PFC) সহ একটি লসলেস ফ্যাব্রিক স্থাপন করেছিল, যা কার্যকর RDMA অপারেশনের জন্য একটি গুরুত্বপূর্ণ প্রয়োজনীয়তা। MCX653105A-HDAT ConnectX অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ড এখানে অপরিহার্য প্রমাণিত হয়েছিল, কারণ এর উন্নত কনজেশন কন্ট্রোল মেকানিজমগুলি সম্পূর্ণ লোডের অধীনেও ফ্যাব্রিক স্থিতিশীলতা বজায় রেখেছিল।

পরিমাপ করা ফলাফল: থ্রুপুট বৃদ্ধি এবং ল্যাটেন্সি হ্রাস

কর্মক্ষমতা বৃদ্ধি তাৎক্ষণিক এবং উল্লেখযোগ্য ছিল। আপগ্রেডের আগে, বিদ্যমান 10GbE পরিকাঠামো উচ্চ সিপিইউ ব্যবহার সহ প্রায় 1.2 GB/s-এ সার্ভার-টু-সার্ভার থ্রুপুট সীমাবদ্ধ করেছিল। MCX653105A-HDAT অ্যাডাপ্টারগুলি একীভূত করার পরে এবং RoCEv2 সক্ষম করার পরে, ক্লাস্টার নিম্নলিখিতগুলি অর্জন করেছে:

মেট্রিক আগে (10GbE/TCP) পরে (100GbE/RoCE সহ MCX653105A-HDAT)
কার্যকরী থ্রুপুট (NVMe-oF) ~1.1 GB/s ~11.5 GB/s
গড় ল্যাটেন্সি (রাউন্ড-ট্রিপ) ~150 µs < 5 µs
সিপিইউ ব্যবহার (নেটওয়ার্ক I/O) ~30% < 5%

থ্রুপুটে এই 10 গুণ বৃদ্ধি একই সাথে অ্যাপ্লিকেশন-স্তরের প্রক্রিয়াকরণের জন্য সিপিইউ কোরগুলি মুক্ত করার সময় অর্জিত হয়েছিল। MCX653105A-HDAT হার্ডওয়্যার অফলোডগুলি লাইন-রেট 100Gb/s কর্মক্ষমতা অর্জনে গুরুত্বপূর্ণ প্রমাণিত হয়েছিল, যা বিতরণ করা ডেটাবেসকে অতিরিক্ত সার্ভারের প্রয়োজন ছাড়াই অনুভূমিকভাবে স্কেল করতে সক্ষম করেছিল। অফিসিয়াল MCX653105A-HDAT স্পেসিফিকেশনগুলিতে বর্ণিত RDMA ক্ষমতাগুলি সরাসরি মেমরি-টু-মেমরি স্থানান্তর সক্ষম করেছিল, কার্নেলকে বাইপাস করে এবং ল্যাটেন্সি হ্রাস করে যা পূর্বে কেবল বিশেষায়িত HPC ক্লাস্টারে দেখা যেত। দলটি MCX653105A-HDAT ডেটাশিট এর সাথেও পরামর্শ করেছিল PCIe প্যারামিটারগুলি ফাইন-টিউন করার জন্য, সর্বোত্তম Gen4 ব্যান্ডউইথ ​​ব্যবহার নিশ্চিত করে।

উপসংহার ও ভবিষ্যৎ展望

এই স্থাপনটি প্রমাণ করে যে MCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধান কেবল একটি ক্রমবর্ধমান আপগ্রেড নয়, বরং ডেটা-চালিত উদ্যোগগুলির জন্য একটি রূপান্তরমূলক উপাদান। কার্যকর RDMA/RoCE পরিবহনের মাধ্যমে সিপিইউ বাধা সমাধান করে, MCX653105A-HDAT সংস্থাটিকে তাদের বিদ্যমান স্টোরেজ এবং কম্পিউটেশনাল বিনিয়োগের সর্বোচ্চ মূল্য অর্জন করতে সক্ষম করেছে। এই সাফল্য তাদের মেশিন লার্নিং প্রশিক্ষণ ক্লাস্টারগুলিতে স্থাপনা সম্প্রসারণের পথ প্রশস্ত করেছে, যেখানে বর্তমান বাজারে MCX653105A-HDAT বিক্রয়ের জন্য এর কম-ল্যাটেন্সি বৈশিষ্ট্যগুলি মডেল প্রশিক্ষণের সময়কে আরও ত্বরান্বিত করবে। উচ্চ-কর্মক্ষমতা সম্পন্ন পরিকাঠামো মূল্যায়নকারী স্থপতি এবং প্রকৌশলীদের জন্য, MCX653105A-HDAT সামঞ্জস্যপূর্ণ বিদ্যমান অপারেটিং সিস্টেম এবং ম্যানেজমেন্ট সরঞ্জামগুলির সাথে এর প্রকৃতি এটিকে আধুনিক, উচ্চ-থ্রুপুট ডেটা সেন্টার তৈরির জন্য একটি নির্বিঘ্ন পছন্দ করে তোলে।