NVIDIA Mellanox MCX653106A-HDAT প্রযুক্তিগত সমাধান: RDMA/RoCE-ভিত্তিক লো-লেটেন্সি পরিবহন এবং সার্ভার
June 16, 2026
এই প্রযুক্তিগত সাদা কাগজটি নেটওয়ার্ক আর্কিটেক্ট, প্রাক-বিক্রয় প্রকৌশলী এবং অপারেশন ম্যানেজারদের জন্য ডিজাইন করা হয়েছে। এটা ফোকাস করেNVIDIA Mellanox MCX653106A-HDATসার্ভার অ্যাডাপ্টার এবং মাইক্রোসেকেন্ড-স্কেল RDMA/RoCE পরিবহন এবং অতি-উচ্চ থ্রুপুট পারফরম্যান্সে সক্ষম একটি ডেটা সেন্টার নেটওয়ার্ক অবকাঠামো কীভাবে তৈরি করা যায় তার রূপরেখা দেয়।
আধুনিক ডেটা সেন্টারগুলি তিনটি মূল চ্যালেঞ্জের মুখোমুখি: বিতরণ করা স্টোরেজের অপ্রত্যাশিত বিলম্ব, এআই প্রশিক্ষণ ক্লাস্টারগুলিতে ব্যান্ডউইথ অনাহার এবং ঐতিহ্যগত নেটওয়ার্ক প্রোটোকল স্ট্যাকগুলির দ্বারা অত্যধিক CPU খরচ। প্রচলিত TCP/IP সমাধানগুলি আর NVMe-oF, উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং এবং রিয়েল-টাইম বিশ্লেষণের মাইক্রোসেকেন্ড-স্কেল লেটেন্সি চাহিদা পূরণ করতে পারে না। শিল্প জরুরীভাবে একটি প্রয়োজনMCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানযেটি 200Gbps স্তরে সার্ভার থ্রুপুট স্কেলিং করার সময় স্ট্যান্ডার্ড ইথারনেট অবকাঠামোর উপর হার্ডওয়্যার-অফলোড করা RDMA পরিবহন সরবরাহ করে।
এই সমাধানটি একটি দ্বি-স্তর পাতা-স্পাইন CLOS আর্কিটেকচার গ্রহণ করে। সমস্ত গণনা এবং স্টোরেজ নোড এর মাধ্যমে সংযুক্তNVIDIA Mellanox MCX653106A-HDAT25G/100G ToR সুইচ। মূল নকশা নীতি অন্তর্ভুক্ত:
- এন্ড-টু-এন্ড লসলেস নেটওয়ার্ক PFC (অগ্রাধিকার প্রবাহ নিয়ন্ত্রণ) এবং ECN (স্পষ্ট কনজেশন বিজ্ঞপ্তি) দ্বারা সক্ষম
- স্টোরেজ এবং HPC কাজের চাপের জন্য ডেডিকেটেড RDMA পরিবহন লেন
- কন্ট্রোল প্লেন (স্ট্যান্ডার্ড TCP/IP) এবং ডেটা প্লেন (RoCEv2) আলাদা করা
- হার্ডওয়্যার-ভিত্তিক ভার্চুয়ালাইজেশন অফলোড (SR-IOV, VXLAN/NVGRE/Geneve)
উপর ভিত্তি করেMCX653106A-HDAT ডেটাশিট, অ্যাডাপ্টার সাব-600ns পোর্ট-টু-পোর্ট লেটেন্সি প্রদান করে এবং প্রতি সেকেন্ডে 215 মিলিয়ন প্যাকেট পর্যন্ত সমর্থন করে, এটি পূর্ব-পশ্চিম স্টোরেজ ট্র্যাফিক এবং উত্তর-দক্ষিণ অ্যাপ্লিকেশন প্রবাহ উভয়ের জন্য আদর্শ করে তোলে।
দMCX653106A-HDAT ConnectX অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ডফাউন্ডেশনাল ডাটা প্লেন ইঞ্জিন হিসেবে কাজ করে। এর প্রাথমিক ভূমিকাগুলির মধ্যে রয়েছে:
- RDMA/RoCE ত্বরণ:RoCEv2-এর সম্পূর্ণ হার্ডওয়্যার অফলোড, যার মধ্যে কনজেশন ম্যানেজমেন্ট, অর্ডারের বাইরের প্যাকেট হ্যান্ডলিং, এবং অ্যাপ্লিকেশন বাফারগুলিতে অবিলম্বে ডেটা স্থাপন করা।
- স্টোরেজ প্রোটোকল অফলোড:NVMe-oF (উভয় TCP এবং RoCE ভেরিয়েন্ট), iSER এবং SRP-এর জন্য নেটিভ সাপোর্ট, সফ্টওয়্যার-ভিত্তিক টার্গেট প্রসেসিং দূর করে।
- ভার্চুয়ালাইজেশন এবং মাল্টি-টেনেন্সি:প্রতি পোর্টে 1,000 ভার্চুয়াল ফাংশন (VFs) পর্যন্ত, ওভারলে টানেল অফলোড লাইন-রেট এনক্যাপসুলেশন/ডিক্যাপসুলেশন নিশ্চিত করে।
- নিরাপত্তা এবং টেলিমেট্রি:ইনলাইন IPsec/TLS এনক্রিপশন 200Gbps, প্লাস হার্ডওয়্যার-ভিত্তিক প্রবাহ ট্র্যাকিং (যেমন, সংযোগ ট্র্যাকিং, হিস্টোগ্রাম)।
অনুযায়ীMCX653106A-HDAT স্পেসিফিকেশন, অ্যাডাপ্টার PCIe 4.0/5.0 x16 ইন্টারফেস সমর্থন করে, এমনকি সম্পূর্ণ 200GbE লাইন রেটেও কোনও হোস্ট-সাইড বাধা না থাকা নিশ্চিত করে৷
একটি বৈধ রেফারেন্স টপোলজির মধ্যে রয়েছে:
- গণনা স্তর:48টি ডুয়াল-সকেট সার্ভার, প্রতিটি একটি দিয়ে সজ্জিতMCX653106A-HDAT(ডুয়াল-পোর্ট 100GbE কনফিগারেশন)। পোর্ট একটি সক্রিয়-সক্রিয় LAG হিসাবে বন্ধন করা হয়.
- স্টোরেজ লেয়ার:12টি অল-ফ্ল্যাশ NVMe-oF টার্গেট সার্ভার, প্রতিটি দুটি সহMCX653106A-HDAT ইথারনেট অ্যাডাপ্টার কার্ডইউনিট - একটি ফ্রন্ট-এন্ড কম্পিউট অ্যাক্সেসের জন্য, একটি ব্যাক-এন্ড প্রতিলিপির জন্য।
- নেটওয়ার্ক স্তর:চারটি 100GbE স্পাইন সুইচ এবং আটটি লিফ সুইচ, DCBX, PFC (RoCE-এর জন্য ক্লাস 3) এবং ECN থ্রেশহোল্ডের সাথে কনফিগার করা।
200 নোডের বেশি স্কেলিং করার জন্য, আর্কিটেকচারটি হার্ডওয়্যার অফলোড সহ EVPN-VXLAN ব্যবহার করে মাল্টি-পড ডিজাইন সমর্থন করে (সম্পূর্ণMCX653106A-HDAT সামঞ্জস্যপূর্ণপ্রধান বিক্রেতাদের সুইচ সহ)। ক্ষমতা মূল্যায়ন করার সময়,MCX653106A-HDAT মূল্যপ্রতি ব্যবহারযোগ্য 100GbE পোর্ট তুলনামূলক ফাইবার চ্যানেল বা InfiniBand সমাধানের তুলনায় প্রায় 40% কম।
RDMA/RoCE স্থাপনার কার্যকরী অপারেশনের জন্য বিশেষ টুলিং প্রয়োজন। নিম্নলিখিত অনুশীলনগুলি সুপারিশ করা হয়:
| দৃষ্টিভঙ্গি | প্রস্তাবিত অ্যাকশন এবং টুল |
|---|---|
| টেলিমেট্রি এবং দৃশ্যমানতা | এর মাধ্যমে হার্ডওয়্যার কাউন্টার সক্রিয় করুনmlx5cmdএবং প্রমিথিউস রপ্তানিকারক; PFC বিরতি, ECN চিহ্নিত প্যাকেট এবং RoCE পুনঃপ্রচারগুলি নিরীক্ষণ করুন। |
| যানজট সনাক্তকরণ | ব্যবহার করুনethtool -Sপ্রতি-সারির পরিসংখ্যানের জন্য; NVIDIA এর ডকার-ভিত্তিক কনজেশন টেলিমেট্রি কিট স্থাপন করুন। |
| ফার্মওয়্যার এবং ড্রাইভার Mgmt | বজায় রাখাMCX653106A-HDAT সামঞ্জস্যপূর্ণDOCA 2.5+ ড্রাইভার স্ট্যাকের পাশাপাশি ফার্মওয়্যার সংস্করণ (≥ 26.35.x)। |
| অপ্টিমাইজেশান নির্দেশিকা | জাম্বো ফ্রেমের জন্য MTU=9000 সেট করুন; roce_rx_qos_policy সামঞ্জস্য করুন; মিশ্র কাজের চাপের জন্য গতিশীল বাধা সংযম সক্ষম করুন। |
সমস্যা সমাধানের জন্য, ব্যবহার করে RoCEv2-নির্দিষ্ট মেটাডেটা ক্যাপচার করুনrdmatoolএবংibv_devinfo. সাধারণ সমস্যাগুলির মধ্যে রয়েছে ভুল কনফিগার করা পিএফসি অগ্রাধিকারগুলি (সমস্ত নেটওয়ার্ক ডিভাইসে ধারাবাহিকতা নিশ্চিত করুন) এবং অমিল PCIe লিঙ্কের গতি (এর সাথে যাচাই করুনlspci -vvv)
দNVIDIA Mellanox MCX653106A-HDATস্ট্যান্ডার্ড ইথারনেট কাপড়কে উচ্চ-কর্মক্ষমতা, ক্ষতিহীন নেটওয়ার্কে রূপান্তর করার জন্য একটি প্রমাণিত, উৎপাদন-প্রস্তুত প্ল্যাটফর্ম অফার করে। মূল মান মূল্যায়ন অন্তর্ভুক্ত:
- বিলম্ব:ডিটারমিনিস্টিক সাব-10µs NVMe-oF রিড লেটেন্সি (P99), রিয়েল-টাইম অ্যানালিটিক্স এবং HPC কনভারজেন্স সক্ষম করে।
- থ্রুপুট:শূন্য প্যাকেট লস সহ নিয়ার-লাইন-রেট 200GbE, এর বিপরীতে বৈধMCX653106A-HDAT স্পেসিফিকেশন.
- CPU দক্ষতা:নেটওয়ার্ক এবং স্টোরেজ স্ট্যাক দ্বারা পূর্বে ব্যবহৃত CPU কোরের 30% পর্যন্ত মুক্ত করে।
- TCO:মালিকানা আন্তঃসংযোগের তুলনায়,MCX653106A-HDAT বিক্রয়ের জন্যমান, ইথারনেট স্যুইচিংয়ের সাথে মিলিত মূল্য, তিন বছরের পরিচালন খরচ আনুমানিক 35-50% কমিয়ে দেয়।
স্থপতি এবং অপারেশন লিডাররা আত্মবিশ্বাসের সাথে AI কাপড়, বিচ্ছিন্ন স্টোরেজ এবং অতি-নিম্ন-বিলম্বিত আর্থিক সিস্টেমের জন্য এই সমাধানটি স্থাপন করতে পারেন। বিস্তারিত বাস্তবায়ন পদক্ষেপের জন্য, কর্মকর্তা পড়ুনMCX653106A-HDAT ডেটাশিটএবং NVIDIA এর DOCA ডকুমেন্টেশন লাইব্রেরি।

