NVIDIA Mellanox MCX653106A-HDAT প্রযুক্তিগত সমাধান: RDMA/RoCE লো-লেটেন্সি ট্রান্সমিশন সক্ষম করা এবং সার্ভারের সর্বোচ্চ ব্যবহার
March 17, 2026
আধুনিক ডেটা সেন্টার আর্কিটেকচারগুলি রিয়েল-টাইম ডেটা প্রসেসিংয়ের প্রয়োজন, কৃত্রিম বুদ্ধিমত্তা (এআই) ওয়ার্কলোড এবং উচ্চ-পারফরম্যান্স কম্পিউটিং (এইচপিসি) দ্বারা ক্রমবর্ধমানভাবে সংজ্ঞায়িত করা হয়।ঐতিহ্যবাহী নেটওয়ার্ক স্ট্যাক, বিশেষ করে টিসিপি/আইপি, উল্লেখযোগ্য সিপিইউ ওভারহেড এবং লেটেন্সি প্রবর্তন করে যা এই কর্মক্ষমতা-সংবেদনশীল অ্যাপ্লিকেশনগুলিকে পঙ্গু করতে পারে।নেটওয়ার্ক আর্কিটেক্ট এবং ট্রান্সপারেন্ট ইঞ্জিনিয়ারদের এমন অবকাঠামো তৈরির কাজ রয়েছে যা ল্যাটেনসি এবং থ্রুপুটের জন্য কঠোর পরিষেবা স্তরের চুক্তি (এসএলএ) পূরণ করার সময় দক্ষতার সাথে স্কেল করতে পারে.
এই প্রযুক্তিগত পরিকল্পনায় চিহ্নিত মূল প্রয়োজনীয়তা হ'ল ক্ষতিহীন,কনভার্জেড ইথারনেটের মাধ্যমে রিমোট ডাইরেক্ট মেমোরি অ্যাক্সেস (আরডিএমএ) সমর্থন করতে সক্ষম উচ্চ ব্যান্ডউইথ কাপড়এটি অর্জনের জন্য, অন্তর্নিহিত নেটওয়ার্ক ইন্টারফেস কার্ড (এনআইসি) কেবল লাইন-রেট 100/200GbE গতি সমর্থন করতে হবে না, তবে হোস্ট সিপিইউ সংস্থানগুলি মুক্ত করার জন্য পরিশীলিত হার্ডওয়্যার অফলোডগুলিও সরবরাহ করতে হবে।এখানেইMCX653106A-HDATসমাধানের মৌলিক উপাদান হয়ে ওঠে।
প্রস্তাবিত আর্কিটেকচারটি একটি বেসরকারী ক্লাউড পরিবেশের জন্য ডিজাইন করা একটি স্পাইন-লেফ টপোলজি যা ভার্চুয়ালাইজড ওয়ার্কলোড এবং খালি ধাতব এইচপিসি ক্লাস্টার উভয়ই হোস্ট করে।নেটওয়ার্কটি RoCE ট্র্যাফিক সমর্থন করার জন্য বিভাজিত, একটি ক্ষতিহীন ইথারনেট ফ্যাব্রিক প্রয়োজন। মূল নকশা উপাদানগুলির মধ্যে রয়েছেঃ
- পাতা সুইচঃএনভিআইডিআইএ স্পেকট্রাম এসএন৩০০০ সিরিজের সুইচগুলি একটি ক্ষতিহীন রোসিই ফ্যাব্রিক তৈরি করতে পিএফসি (প্রাধান্য প্রবাহ নিয়ন্ত্রণ) এবং ইটিএস (উন্নত ট্রান্সমিশন নির্বাচন) দিয়ে কনফিগার করা হয়েছে।
- মেরুদণ্ডের স্যুইচঃউচ্চ ক্ষমতার সুইচ যা সমস্ত পাতার সুইচগুলির মধ্যে অ-ব্লকিং আন্তঃসংযোগ সরবরাহ করে।
- গণনা ও স্টোরেজ নোডঃপ্রতিটি সার্ভারএনভিআইডিআইএ মেলানক্স এমসিএক্স 653106 এ-এইচডিএটি100 গিগাবাইট/সেকেন্ড গতিতে পাতার সুইচগুলোতে সংযোগ করতে।
এই নকশাটি নিশ্চিত করে যে ডেটা সেন্টারের মধ্যে যে কোনও যোগাযোগের মধ্যে সর্বনিম্ন বিলম্বের অভিজ্ঞতা রয়েছে এবং ভিড়ের কারণে শূন্য প্যাকেট ক্ষতি, যা আরডিএমএ ট্র্যাফিকের স্থিতিশীলতার জন্য সমালোচনামূলক।
যেমন একটিMCX653106A-HDAT ConnectX অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ড, এই ডিভাইসটি সার্ভারের মেমরি বাস এবং নেটওয়ার্ক ফ্যাব্রিকের মধ্যে সমালোচনামূলক ইন্টারফেস হিসাবে কাজ করে। এর ভূমিকা সহজ প্যাকেট ফরোয়ার্ডিংয়ের বাইরেও বিস্তৃত।কার্ডটি কানেক্টএক্স-৬ কন্ট্রোলারের উন্নত ক্ষমতাকে একীভূত করেছে, যা এই চাহিদাপূর্ণ পরিবেশের জন্য বিশেষভাবে নির্মিত।MCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড, এটি নিম্নলিখিতগুলি করতে সক্ষম করেঃ
- কার্নেল বাইপাস এবং আরডিএমএ:অ্যাপ্লিকেশনগুলি অপারেটিং সিস্টেমের কার্নেলকে বাইপাস করে সরাসরি এনআইসির সাথে যোগাযোগ করতে পারে। এটি ভয়াবহভাবে বিলম্ব এবং সিপিইউর জড়িততা হ্রাস করে, সত্যিকারেরRDMA/RoCE কম বিলম্বিত সংক্রমণ.
- হার্ডওয়্যার অফলোডঃএই কার্ডটি স্টোরেজ এবং নেটওয়ার্কিং প্রোটোকল যেমন NVMe-oF এবং VXLAN-কে অফলোড করে, যা CPU ওভারহেডকে আরও হ্রাস করে এবং গতি বাড়ায়।সার্ভারের সঞ্চালন ক্ষমতা.
- PCIe Gen3/Gen4 সমর্থনঃPCIe 3.0/4.0 x16 হোস্ট ইন্টারফেসের সাথে,MCX653106A-HDATসার্ভারের অভ্যন্তরীণ বাসে 100/200Gb/s নেটওয়ার্ক ব্যান্ডউইথের ফাঁক না হওয়া নিশ্চিত করে।
আর্কিটেক্টদের জন্য প্রযুক্তিগত বিবরণ পর্যালোচনা,MCX653106A-HDAT স্পেসিফিকেশনপ্রতি সেকেন্ডে ২০০ মিলিয়নেরও বেশি প্যাকেটের জন্য সমর্থন প্রকাশ করে, এটি সর্বাধিক নিবিড় ডেটা স্ট্রিম পরিচালনা করার ক্ষমতা প্রদর্শন করে।MCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানআমাদের লক্ষ্য কাজের লোডের জন্য।
একটি RoCEv2 ফ্যাব্রিক স্থাপনের জন্য সাবধানে পরিকল্পনা প্রয়োজন। নিম্নলিখিত ধাপে প্রস্তাবিত স্থাপনার কৌশলটি বর্ণনা করা হয়েছেMCX653106A-HDAT:
- ফার্মওয়্যার এবং ড্রাইভারের সামঞ্জস্যঃনিশ্চিত করুন যে সমস্ত কার্ড একই ফার্মওয়্যার সংস্করণ দিয়ে ফ্ল্যাশ করা হয় এবং NVIDIA MLNX_OFED ড্রাইভারটি সমস্ত নোডে ধারাবাহিকভাবে ইনস্টল করা আছে। এটি বৈশিষ্ট্য সমতা এবং স্থিতিশীলতা গ্যারান্টি দেয়।
- সুইচ কনফিগারেশনঃRoCE ট্র্যাফিকের জন্য নির্ধারিত নির্দিষ্ট 802.1p অগ্রাধিকার সারিগুলির জন্য সুইচগুলিতে PFC বাস্তবায়ন করুন (সাধারণত অগ্রাধিকার 3) ETS এই সারিগুলির জন্য গ্যারান্টিযুক্ত ব্যান্ডউইথ বরাদ্দ করতে কনফিগার করা উচিত,বাফার ক্লান্তি রোধ করা.
- নোড কনফিগারেশনঃপ্রতিটি সার্ভারে,MCX653106A-HDAT সামঞ্জস্যপূর্ণড্রাইভারগুলি লোড করা হয় এবং এনআইসির কোস সেটিংস সুইচ কনফিগারেশনের সাথে সারিবদ্ধ করা হয়। 'cma_roce_mode' এর মতো সরঞ্জামগুলি রাউটেবিলিটি জন্য RoCE মোডটি v2 এ সেট করতে ব্যবহৃত হয়।
সম্প্রসারণের জন্য, আর্কিটেকচারটি অত্যন্ত স্কেলযোগ্য। নতুন কম্পিউটিং বা স্টোরেজ ক্যাপাসিটি যোগ করা নতুন সার্ভারগুলির সাথে নতুন সার্ভার স্থাপন করার মতো সহজএনভিআইডিআইএ মেলানক্স এমসিএক্স 653106 এ-এইচডিএটিএবং তাদের বিদ্যমান পাতার সুইচগুলিতে সংযুক্ত করে। ফ্যাব্রিকের নন-ব্লকিং প্রকৃতি নিশ্চিত করে যে ক্লাস্টার বাড়ার সাথে সাথে পারফরম্যান্স পূর্বাভাসযোগ্য থাকে।
উচ্চ পারফরম্যান্সের RoCE ফ্যাব্রিক বজায় রাখার জন্য শক্তিশালী পর্যবেক্ষণ প্রয়োজন।MCX653106A-HDATস্ট্যান্ডার্ড সরঞ্জাম এবং এনভিআইডিআইএর মালিকানাধীন সফটওয়্যারের মাধ্যমে বিস্তৃত টেলিমেট্রি ডেটা সরবরাহ করে।
- পর্যবেক্ষণঃলিঙ্ক অখণ্ডতা এবং কর্মক্ষমতা কাউন্টারগুলির জন্য'mlxlink' এবং'mlxstat' ব্যবহার করুন। প্যাকেট ড্রপ, লিঙ্ক ব্যবহার,এবং RDMA ট্রাফিক হার.
- সমস্যা সমাধানঃযখন পারফরম্যান্স হ্রাস পায়, প্রথম চেকটি সাধারণত পিএফসি ঝড় বা বাফার ক্লান্তির কারণে প্যাকেট ড্রপগুলির জন্য হয়। এনআইসির হার্ডওয়্যার কাউন্টারগুলি এই সমস্যাগুলির তাত্ক্ষণিক অন্তর্দৃষ্টি সরবরাহ করে।MCX653106A-HDAT ডেটা শীটনির্দিষ্ট ইভেন্টের সাথে কাউন্টারগুলিকে সম্পর্কিত করতে সাহায্য করে।
- অপ্টিমাইজেশনঃঅ্যাডভান্সড টিউনিং-এ ইন্টারপুট মডারেশন প্যারামিটার এবং পিসিআইই পাঠ অনুরোধের আকার সামঞ্জস্য করা জড়িত।এসআর-আইওভি সক্ষম করা এবং ভার্চুয়াল ফাংশনগুলি (ভিএফ) সরাসরি ভার্চুয়াল মেশিনে বরাদ্দ করা ল্যাটেনসি আরও হ্রাস করে.
যখন হার্ডওয়্যার সোর্সিং, বোঝারMCX653106A-HDAT দামবাজেট নির্ধারণের জন্য পারফরম্যান্স লাভের তুলনায় প্রয়োজনীয়।বিক্রির জন্য MCX653106A-HDATঅনুমোদিত বিক্রেতাদের কাছ থেকে তালিকা নিশ্চিত করে যে পণ্যগুলি সত্য এবং সমর্থন।
দ্যMCX653106A-HDATএনভিআইডিআইএ থেকে মেলানোক্স একটি উপাদান চেয়ে বেশি; এটি আধুনিক ডেটা সেন্টার রূপান্তর জন্য একটি কৌশলগত enabler।এটি সরাসরি কম বিলম্ব এবং উচ্চতর থ্রুপুট জন্য শিল্পের প্রয়োজনের সমাধান করেএই প্রযুক্তিগত সমাধানটি দেখায় যে সঠিক স্থাপত্য এবং বাস্তবায়ন অনুশীলনগুলির সাথে, সংস্থাগুলি অর্জন করতে পারেঃ
- 95% পর্যন্ত বিলম্ব হ্রাসঐতিহ্যগত টিসিপি/আইপি এর তুলনায় ইন্টার-প্রসেস যোগাযোগের জন্য।
- উল্লেখযোগ্য সিপিইউ সঞ্চয়(প্রায়শই 20-30%) যা অ্যাপ্লিকেশন পারফরম্যান্সে পুনরায় বিনিয়োগ করা যেতে পারে।
- ভবিষ্যতের জন্য একটি সুরক্ষিত অবকাঠামোএটি 200GbE এবং NVMe-oF এর মত পরবর্তী প্রজন্মের স্টোরেজ প্রোটোকল সমর্থন করতে সক্ষম।
নেটওয়ার্ক আর্কিটেক্ট, ডিভোপস ইঞ্জিনিয়ার এবং অপারেশন লিডারদের জন্য, একটি উচ্চ দক্ষতার ডেটা সেন্টারের পথ শুরু হয় সঠিক বিল্ডিং ব্লক দিয়ে।

