Mellanox (NVIDIA Mellanox) MCX653105A-HDAT সার্ভার অ্যাডাপ্টার টেকনিক্যাল সলিউশন
April 29, 2026
আধুনিক ডেটা সেন্টারগুলি কম্পিউটারে কেন্দ্রিক থেকে ডেটা-কেন্দ্রিক আর্কিটেকচারে মৌলিক পরিবর্তনের মধ্য দিয়ে যাচ্ছে। বিতরণকৃত স্টোরেজ, এআই প্রশিক্ষণ ক্লাস্টার,এবং উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং পরিবেশ নেটওয়ার্ক বিলম্ব এবং সার্ভার থ্রুপুট উপর কঠোর চাহিদা আরোপ. ঐতিহ্যগত টিসিপি / আইপি স্ট্যাকগুলি উচ্চ ব্যান্ডউইথের অধীনে উল্লেখযোগ্য সিপিইউ বিচ্ছিন্নতা এবং প্রসঙ্গ সুইচ তৈরি করে, কেবলমাত্র নেটওয়ার্ক ওভারহেডের জন্য 30% এরও বেশি কম্পিউটিং শক্তি ব্যবহার করে।NVMe-oF এর মতো উদীয়মান স্টোরেজ প্রোটোকলগুলির পারফরম্যান্স সম্ভাব্যতা আনলক করার জন্য মাইক্রোসেকেন্ড স্কেলে শেষ থেকে শেষ লেটেন্সি প্রয়োজনএই চ্যালেঞ্জগুলি মোকাবেলা করার জন্য, উদ্যোগগুলির একটি সার্ভার এনআইসি প্রয়োজন যা নেটওয়ার্ক প্রসেসিংকে ছাড়িয়ে যায় এবং সরাসরি মেমরি অ্যাক্সেস সক্ষম করেমেলানক্স (এনভিআইডিআইএ মেলানক্স) এমসিএক্স 653105 এ-এইচডিএটিডেলিভারি করে।
প্রচলিত স্থাপনার দৃশ্যকল্পগুলির মধ্যে মূল প্রয়োজনীয়তাগুলির মধ্যে রয়েছেঃ অ্যাপ্লিকেশন-স্তরের লেটেন্সি sub-2μs, প্রতি পোর্টে লাইন-রেট 100GbE থ্রুপুট,RoCE (RDMA over Converged Ethernet) এর জন্য হার্ডওয়্যার ডাউনলোড, বিদ্যমান পিসিআইই ৪.০ সার্ভারগুলির সাথে নির্বিঘ্নে সংহতকরণ এবং সক্রিয় জনাকীর্ণতা ব্যবস্থাপনার জন্য বিস্তৃত টেলিমেট্রি।MCX653105A-HDATএর প্রত্যেকটিকেই তার কানেক্টএক্স-৬ আর্কিটেকচার দিয়ে সম্বোধন করে।
প্রস্তাবিত সমাধানটি RoCE সমর্থন সহ একটি দ্বি-স্তরীয় স্পাইন-লেফ ফ্যাব্রিক গ্রহণ করে, ইথারনেট অর্থনীতি বজায় রেখে TCP / IP বোতল ঘাটতি দূর করে।টপ-অফ-র্যাক সুইচ (NVIDIA SN4000 সিরিজ বা সমতুল্য PFC-সক্ষম সুইচ) ইন্টারকানেক্ট কম্পিউটার এবং স্টোরেজ নোড. প্রতিটি গণনা নোড সমন্বয় করেMCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড, ডুয়াল-পোর্ট 100GbE সংযোগ প্রদান করে। স্টোরেজ নোডগুলি RDMA এর মাধ্যমে সরাসরি NVMe-oF লক্ষ্যগুলি পরিবেশন করতে একই অ্যাডাপ্টার স্থাপন করে।
স্থাপত্যগতভাবে,এনভিআইডিআইএ মেলানক্স এমসিএক্স 653105 এ-এইচডিএটিভার্চুয়াল মেশিন, কন্টেইনার এবং খালি ধাতব ওয়ার্কলোড থেকে সমস্ত নেটওয়ার্ক I/O পরিচালনা করে।কন্ট্রোল প্লেনটি হোস্ট সিপিইউতে থাকে কিন্তু ডেটা মুভমেন্টের কাজ থেকে মুক্তি পায়। এই বিচ্ছেদটি RDMA- সক্ষম নকশার মূল বিষয়।. বড় আকারের স্থাপনার জন্য (100+ নোড), একটি ডেডিকেটেড RoCE ঘন ঘন নিয়ন্ত্রণ ডোমেইন DCQCN (ডেটা সেন্টার কোয়ান্টাইজড ঘন ঘন বিজ্ঞপ্তি) ব্যবহার করে কনফিগার করা হয়,কম্পিউটার এবং স্টোরেজ ট্রাফিকের জন্য পৃথক বাফার পুল সহ.
দ্যMCX653105A-HDAT ConnectX অ্যাডাপ্টার PCIe নেটওয়ার্ক কার্ডএই আর্কিটেকচারে চারটি গুরুত্বপূর্ণ কাজ করেঃ
- হার্ডওয়্যার-আফলোডড RoCE:বিশেষ সুইচ বা ফ্যাব্রিকের প্রয়োজন ছাড়াই আরডিএমএ বাস্তবায়ন করে। ডেটা সরাসরি অ্যাপ্লিকেশন বাফার এবং রিমোট মেমরির মধ্যে চলে যায়, সম্পূর্ণরূপে কার্নেলকে বাইপাস করে।
- PCIe 4.0 x16 ইন্টারফেসঃ200Gb / s পর্যন্ত দ্বি-পন্থী ব্যান্ডউইথ সরবরাহ করে, হোস্ট বাসের বোতল ঘাঁটিগুলি দূর করে এবং দ্বৈত 100GbE পোর্টগুলি সম্পূর্ণরূপে ব্যবহার করে।
- দ্রুত স্যুইচিং ও প্যাকেট প্রসেসিং (এএসএপি২):ভিএক্সএলএন / এনভিজিআরই অফলোড, ভার্টআইও ত্বরণ এবং প্রোগ্রামযোগ্য টেলিমেট্রি জন্য নমনীয় পাইপলাইন কাস্টমাইজেশন সমর্থন করে।
- স্টোরেজ ত্বরণ:NVMe-oF (TCP এবং RoCE), T10-DIF স্বাক্ষর উত্পাদন / বৈধতা এবং মুছে ফেলার কোডিং ত্বরণ জন্য হার্ডওয়্যার অফলোড।
এর মতেMCX653105A-HDAT ডেটা শীট, অ্যাডাপ্টারটি নিরাপদ বুট, হার্ডওয়্যার রুট অফ ট্রাস্ট এবং ইনলাইন আইপিএসইসি / টিএলএস এনক্রিপশনকে 100 গিগাবাইট পর্যন্ত সমর্থন করে।MCX653105A-HDAT স্পেসিফিকেশন, প্রকৌশলীরা ডুয়াল-স্লট প্রস্থ, প্যাসিভ কুলিং এবং বিস্তৃত অপারেটিং তাপমাত্রা পরিসীমা (0 °C থেকে 55 °C), এটি ঘন সার্ভার পরিবেশের জন্য উপযুক্ত করে তোলে।
সাধারণ টপোলজি (১০২৪-নোড ক্লাস্টারের উদাহরণ):
- পাতা স্তরঃ 16x পাতা সুইচ, প্রতিটি 48x 100GbE ডাউনলিঙ্ক পোর্ট + 8x 400GbE আপলিঙ্ক
- মেরুদণ্ড স্তরঃ 4x মেরুদণ্ড সুইচ, অ ব্লকিং 400GbE কাপড়
- কম্পিউটারের নোডঃ ডুয়ালMCX653105A-HDATপ্রতি নোড (বিকল্প সক্রিয়-সক্রিয় বা সক্রিয়-সতর্কতা)
- স্টোরেজ নোডঃ 1xMCX653105A-HDATপ্রতি নোড, RDMA এর মাধ্যমে NVMe নামস্থান পরিবেশন করে
মোতায়েনের ধাপঃযাচাই করুনMCX653105A-HDAT সামঞ্জস্যপূর্ণঅফিসিয়াল সামঞ্জস্যতা ম্যাট্রিক্স ব্যবহার করে সার্ভারগুলি। MLNX_OFED বা DOCA ফ্রেমওয়ার্ক ইনস্টল করুন (সর্বনিম্ন সংস্করণ 5.8) । সুইচ পোর্টগুলিতে RoCE সক্ষম করুন (PFC, ECN, DCQCN পরামিতিগুলি ওয়ার্কলোডের সাথে সামঞ্জস্যপূর্ণ) ।ডুয়াল-পোর্ট রিডান্ডান্সির জন্য বন্ডিং বা মাল্টিপ্যাথ কনফিগার করুন. অবশেষে, perftest স্যুট (ib_write_bw, ib_read_lat) ব্যবহার করে যাচাই করুন।
স্কেলিং বিবেচনাঃ2000+ নোডের জন্য, ফ্যাব্রিক স্তরে অ্যাডাপ্টিভ রাউটিং এবং জ্যাম কন্ট্রোল বাস্তবায়ন করুন।MCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানক্যাপাসিটি পরিকল্পনা করার সময়, রেফারেন্স ক্যাপাসিটিMCX653105A-HDAT দামটিসিও এর তুলনায়, সার্ভারের সংহতকরণ এবং সিপিইউ কোর গণনার প্রয়োজনীয়তা হ্রাসের কারণে সাধারণত 6-12 মাস পর্যন্ত পরিশোধের সময় থাকে।বিক্রির জন্য MCX653105A-HDATভলিউম মূল্য নির্ধারণ এবং ফার্মওয়্যার কাস্টমাইজেশন বিকল্পের জন্য আঞ্চলিক পরিবেশকদের সাথে যোগাযোগ করা উচিত।
| মোতায়েন স্কেল | প্রস্তাবিত টপোলজি | প্রত্যাশিত লেটেন্সি (পি৯৯) | সিপিইউ অফলোড রেট |
|---|---|---|---|
| সর্বোচ্চ ২৫৬টি নোড | একপাতা বা দুইপাতা + দুইপাশ | ≤1.8 μs | ৮৫-৯০% |
| ২৫৭-১০২৪ নড | ৪-১৬টি পাতা + ৪টি মেরুদণ্ড | ≤2.2 μs | ৮৮-৯২% |
| ১০২৪+ নোড | অভিযোজিত রুটিং সহ মাল্টি-লেয়ার | ≤2.8 μs | ৯০-৯৫% |
মনিটরিং ও টেলিমেট্রিঃদ্যএনভিআইডিআইএ মেলানক্স এমসিএক্স 653105 এ-এইচডিএটিপিসিএম (পারফরম্যান্স কাউন্টার মনিটর) এবং ডোকা টেলিমেট্রি এর মাধ্যমে রিয়েল-টাইম কাউন্টারগুলি রপ্তানি করে। ট্র্যাক করার জন্য মূল মেট্রিক্সঃ রোসিই ঘনত্ব চিহ্নিতকরণ অনুপাত, বাফার ড্রপ গণনা, পিসিআইই লিঙ্ক ত্রুটি এবং পোর্ট বিরতি ফ্রেম।NVIDIA ম্যানেজমেন্ট লাইব্রেরির (এনভিএমএল) মাধ্যমে প্রমেথিয়াস+গ্রাফানার সাথে সংহতকরণ সমর্থিত.
অপ্টিমাইজেশান নির্দেশিকাঃওয়ার্কলোডের উপর ভিত্তি করে ডিসিকিউসিএন পরামিতিগুলি সেট করুন (cnp_802p_prio=3, rpg_time_reset=300, ইত্যাদি) স্টোরেজের জন্য আরও আক্রমণাত্মক, গণনার জন্য সংরক্ষণশীল। বেছে বেছে হার্ডওয়্যার অফলোড সক্ষম করুনঃমিশ্র কাজের চাপের জন্য TSO/LRO, লেটেন্সি-সংবেদনশীল প্রবাহের জন্য RoCE, এবং NFV এর জন্য ASAP2। অন্তর্ভুক্ত mlxconfig সরঞ্জামটি ব্যবহার করে PCIe সর্বোচ্চ payload আকার (256B বেশিরভাগ সার্ভারের জন্য সর্বোত্তম) টিউন করুন।
সাধারণ সমস্যা সমাধানঃপোর্ট ফ্ল্যাপিং সাধারণত SFP/ক্যাবল অসঙ্গতি নির্দেশ করে যাচাই করুনMCX653105A-HDAT সামঞ্জস্যপূর্ণকম আরডিএমএ থ্রুপুট প্রায়ই সুইচগুলিতে অপর্যাপ্ত ইসিএন কনফিগারেশনের দিকে ইঙ্গিত দেয়।অভ্যন্তরীণ অ্যাডাপ্টার রেজিস্টার পরিদর্শন করতে ফ্যাব্রিক বৈধতা এবং dump_emad জন্য ibdiagnet ব্যবহার করুন. দীর্ঘস্থায়ী সমস্যাগুলির জন্য,MCX653105A-HDAT ডেটা শীটরেজিস্টার স্তরের ডায়াগনস্টিক এবং ত্রুটি কোড টেবিল প্রদান করে।
দ্যMCX653105A-HDATকম বিলম্ব, উচ্চ-থ্রুপুট ডেটা সেন্টার নেটওয়ার্কগুলির জন্য একটি পরিপক্ক, উৎপাদন-প্রস্তুত বিল্ডিং ব্লক।এটি স্ট্যান্ডার্ড ইথারনেট অবকাঠামোর উপর RDMA/RoCE deployments সক্ষম করে. মূল মানের ফলাফলগুলির মধ্যে রয়েছেঃ নেটওয়ার্কিং কার্যগুলির জন্য 50-70% সিপিইউ হ্রাস, নির্ধারক সাব -২ মাইক্রো সেকেন্ডের বিলম্ব, বিরামবিহীন এনভিএম-ওএফ সংহতকরণ এবং হাজার হাজার নোডের রৈখিক স্কেলযোগ্যতা।MCX653105A-HDAT ইথারনেট অ্যাডাপ্টার কার্ড সমাধানএটি বর্তমান ব্যবস্থাপনা সরঞ্জামগুলির সাথে সামঞ্জস্য বজায় রেখে 200GbE ফ্যাব্রিকগুলির জন্য ভবিষ্যতে প্রমাণিত পথ প্রদান করে।MCX653105A-HDAT স্পেসিফিকেশনএই অ্যাডাপ্টারটি একটি ধারণার প্রমাণ বা র্যাক স্কেল রোলআউট পরিকল্পনা করার জন্য পারফরম্যান্স এবং মোট মালিকানা ব্যয়ের উভয় ক্ষেত্রেই পরিমাপযোগ্য উন্নতি সরবরাহ করে।

