In a peer-to-peer data center, PCI-Express Fabrics will be ubiquitous

সুপারকম্পিউটারগুলি দামী হচ্ছে এবং আরও ব্যয়বহুল হচ্ছে। যদিও তারা গত এক দশকে চিত্তাকর্ষক কর্মক্ষমতা অর্জন করেছে, আধুনিক এইচপিসি ওয়ার্কলোডগুলির জন্য অবিশ্বাস্য পরিমাণে কর্মক্ষমতা প্রয়োজন, এবং এটি বিশেষ করে যে কোনও কাজের চাপের জন্য সত্য যা প্রথাগত এইচপিসি সিমুলেশন এবং মডেলিংকে কিছু ধরণের মেশিনের সাথে একত্রিত করে। শেখার প্রশিক্ষণ এবং অনুমানের সাথে একত্রিত হওয়ার কথা। , এর জন্য প্রায় অবশ্যই GPU ত্বরণ প্রয়োজন, এবং GPU গুলি সস্তায় আসে না।

সেই দিনগুলি চলে গেছে যখন সুপারকম্পিউটার নোডগুলি একাধিক CPU কোর, পরম ন্যূনতম পরিমাণ DRAM প্রধান মেমরি এবং এক বা দুটি নেটওয়ার্ক ইন্টারফেস কার্ডের সমন্বয়ে গঠিত একজাতীয় ক্যালকুলেটর ছিল। পরিস্থিতি আরও জটিল হয়ে উঠেছে কারণ বিভিন্ন কাজের চাপের জন্য সিপিইউ এবং এক্সিলারেটর কম্পিউটিংয়ের বিভিন্ন অনুপাত এবং নেটওয়ার্ক ব্যান্ডউইথের বিভিন্ন মিশ্রণ এবং এমনকি ফ্ল্যাশ স্টোরেজে আরও দ্রুত অ্যাক্সেসের প্রয়োজন হয়।

এই কারণেই আমরা অত্যন্ত সৌভাগ্যবান যে PCI-এক্সপ্রেস ফ্যাব্রিক অনেক দ্রুত 4.0 প্রজন্মের উপর ভিত্তি করে এবং শীঘ্রই আরও দ্রুত 5.0 প্রজন্মের উপর ভিত্তি করে তৈরি করা হয়েছে, যা ইন্টেল দ্বারা তৈরি এবং বর্তমানে সারা বিশ্বে ব্যবহৃত CXL অসিমেট্রিক কোহেরেন্স প্রোটোকলকেও সমর্থন করবে। কম্পিউট ইঞ্জিন, স্টোরেজ এবং নেটওয়ার্ক অ্যাডাপ্টারের কিউরেটেড সংগ্রহ তৈরি করতে সংস্থাগুলির দ্রুত এবং বিস্তৃত PCI-এক্সপ্রেস নেটওয়ার্কের প্রয়োজন হলে আইটি শিল্প প্রস্তুত হবে।

যেমনটি অনেক প্রযুক্তির ক্ষেত্রে, HPC কেন্দ্র এবং GPU-এক্সিলারেটেড HPC এবং AI ওয়ার্কলোড চালিত অন্যান্য উদ্যোগগুলি তাদের পরিকাঠামোকে আরও নমনীয় এবং আরও দক্ষ করার উপায় হিসাবে PCI-এক্সপ্রেস সুইচ ফ্যাব্রিক ব্যবহার করার জন্য একটি ইচ্ছাকৃত পছন্দ। পন্থা অবলম্বন করা হচ্ছে। কাজ করতে.

যদিও এটি কিছুটা হতাশাজনক হতে পারে, আমরা এখানে সর্বদা পরবর্তী প্ল্যাটফর্মের ভবিষ্যতের জন্য একটু অধৈর্য থাকি – আশ্চর্যজনকভাবে, ইথারনেট বা ইনফিনিব্যান্ড সুইচ এবং অবকাঠামোর মাধ্যমে সংযুক্ত বিতরণ সিস্টেম তৈরির কয়েক দশকের অভিজ্ঞতা রয়েছে। PCI-এক্সপ্রেস ফ্যাব্রিক ইনস্টল করার খুব কম অভিজ্ঞতা আছে।

সব ভাল জিনিস সময় লাগে.

SC21 সুপারকম্পিউটিং কনফারেন্সে, আমরা লিকুইডের সহ-প্রতিষ্ঠাতা এবং সিইও সুমিত পুরির সাথে চ্যাট করেছি, PCI-এক্সপ্রেস ফ্যাব্রিক এবং কম্পোজেবিলিটি সফ্টওয়্যার বিক্রি করে এমন বেশ কয়েকটি স্টার্টআপের মধ্যে একটি এবং যুক্তিযুক্তভাবে এটির জন্য সবচেয়ে বেশি ধারণা সহ একমাত্র কোম্পানি। আরো ট্র্যাকশন আছে. অবকাঠামোকে আলাদা করা এবং এমন একটি ধারণাকে একত্রিত করা যা কর এবং মৃত্যুর মতো অনিবার্য তার চেয়ে অনেক বেশি মজাদার।

আমরা পুরীর সাথে জিপিইউ এবং এফপিজিএ এক্সিলারেটরের খুব বেশি খরচ এবং কীভাবে লিকুইড ম্যাট্রিক্স সফ্টওয়্যার স্ট্যাক এবং এখন দুটি পিসিআই-এক্সপ্রেস সুইচিং ঘেরের মতো একটি সংমিশ্রণযোগ্য পরিকাঠামো সম্পর্কে কথা বলেছি — যেটি SC21-এর সময় চালু হয়েছিল, আমরা কিছুক্ষণের মধ্যেই পেয়ে যাব।

করবে – সম্ভবত এর অর্থ হতে পারে যে অনেক নম্র একাডেমিক, সরকারী এবং কর্পোরেট সুপারকম্পিউটিং কেন্দ্রগুলি তাদের কম্পিউট নোডগুলির মধ্যে সংযোগ হিসাবে সম্পূর্ণরূপে InfiniBand বা Ethernet বাদ দিতে পারে৷ তারা শুধুমাত্র একটি PCI-এক্সপ্রেস ফ্যাব্রিক ব্যবহার করতে পারে, যা হোস্টের সাথে সংযুক্ত সমস্ত ডিভাইস জুড়ে দ্রুততর, পিয়ার-টু-পিয়ার হবে এবং একটি ঐতিহ্যগত নেটওয়ার্ক ব্যবহার করার চেয়ে কম খরচ হবে।

“ন্যাশনাল সায়েন্স ফাউন্ডেশন এবং টেক্সাস অ্যাডভান্সড কম্পিউটিং সেন্টারের মতো সংস্থা, যারা ACES নামক একটি কম্পোজেবল সুপার কম্পিউটার তৈরি করছে, তারা একটি সংমিশ্রণযোগ্য GPU পরিবেশ পেয়ে উত্তেজিত,” বলেছেন পুরি৷ পরবর্তী ধাপে.

“এবং আমরা মনে করি যে আমরা তাদের একটি নেটওয়ার্ক হিসাবে PCI-এক্সপ্রেস কাঠামো ব্যবহার করতে পারি, যা পরবর্তী যৌক্তিক পদক্ষেপ। আমরা অবশ্যই সেই আলোচনাগুলি করতে যাচ্ছি, এবং এর সম্ভাবনা রয়েছে। এটি কেবল স্থাপত্য সম্পর্কে আলোচনা রয়েছে।”

এখানে গণিত মজা একটি বিট. পুরীর মতে, যেকোন ক্লাস্টার সিস্টেমে কম্পোজেবিলিটি যোগ করলে ক্লাস্টারের খরচে 5 থেকে 10 শতাংশ পর্যন্ত যোগ হয়, কিন্তু আমরা এমন অনেক প্রতিষ্ঠানে এর সম্মুখীন হয়েছি যাদের “সুপার কম্পিউটার” পিসিআই হিসাবে মাত্র তিন বা চারটি আয়রন রয়েছে।

র্যাক আছে। এক্সপ্রেস 4.0 সুইচড ফ্যাব্রিক কাজটি করতে পারে, এবং PCI-এক্সপ্রেস 5.0 এর সাথে সুইচিং ব্যান্ডউইথ দ্বিগুণ হয়ে যায় এবং এর অর্থ রেডিক্স দ্বিগুণ হতে পারে, ছয়টি র্যাক এবং সরঞ্জামের আটটি র্যাকের মধ্যে যে কোনও জায়গায় সরাসরি সংযোগ প্রদান করে। এটি একটি ভারী সিস্টেম, বিশেষ করে জিপিইউ দ্বারা ত্বরান্বিত, এবং এটি বিশ্বের জন্য খুব কম সময়ে একটি খুব বড় পড আকারের প্রতিনিধিত্ব করে, এমনকি প্রচুর কাজের চাপ সহ ক্ষমতা-শ্রেণীর সুপার কম্পিউটারের জন্যও। চলমান.

কিছু পরিমাণে, আমরা মনে করি যে সক্ষমতা-শ্রেণির সুপারকম্পিউটারগুলি – যেগুলি সব সময় এবং সমান্তরালভাবে অনেকগুলি অপেক্ষাকৃত ছোট কাজ করে – সক্ষমতা-শ্রেণির মেশিনগুলির চেয়ে আরও বেশি কম্পোজিবিলিটি প্রয়োজন – সুপার কম্পিউটারগুলি যেগুলি তাদের বেশিরভাগ মৌলিক কাজ করে। ফ্রেমওয়ার্ক মহান কাজ করে. , একটি সিরিজে কম বা বেশি।

ওয়ার্কলোডের বৈচিত্র্য কম্পোজেবল অ্যাক্সিলারেটরের জন্য একটি কান্নাকাটি – যেহেতু বিভিন্ন কাজের চাপের বিভিন্ন সিপিইউ-টু-জিপিইউ অনুপাত থাকে এবং এমনকি সিপিইউ এবং জিপিইউ এবং এফপিজিএ অ্যাক্সিলারেটরের মিশ্রণ হোস্ট করতে পারে – এবং এই সিপিইউ এবং এক্সিলারেটরগুলির প্রচুর খরচের প্রয়োজন হয়। আজকের ডেটা সেন্টারে স্বাভাবিকের চেয়ে বেশি প্রচার করতে ব্যবহৃত হয়।

Leave a Comment