پیام فرستادن
تماس با ما
LEO

شماره تلفن : 13486085502

یک هفته عظیم برای بازو - در مرکز داده بیش از حد

June 29, 2020

این یک هفته عظیم برای Arm بوده است ، و نه تنها به این دلیل که اپل از آغاز سوئیچ از پردازنده های Intel x86 به تراشه های مبتنی بر بازوی خود در رایانه های مک خود خبر داد.سازمان رتبه بندی محاسبات با کارآیی بالا Top500 همچنین این هفته اعلام کرد که برای اولین بار در تاریخ ، سریعترین ابر رایانه در جهان استنیرو توسط تراشه های بازو.

در مرکز داده اعلام شده در این هفته ، دو پیشرفت بزرگ دیگر برای Arm را اضافه کنید.همانطور که احتمالاً تاکنون می دانید ، رقابت برای تولید سرورهای خنک تر و کارآمدتر ، از قانون بنیانگذار اینتل ، گوردون مور فاصله گرفته است و به سمترویای سوفی ویلسون.Ampere Computing مبتنی بر سانتا کلارا ، استارت تراشه بازوی بازوی است که توسط رئیس جمهور سابق اینتل رنه جیمز تشکیل شده و درست در ماه مارسراه اندازی شدCPU 80 هسته ای Altra Arm خود ، اعلام کرد که نمونه گیری از پردازنده 128 هسته ای Altra Max در سه ماهه چهارم آغاز می شود.Ampere با تمرکز زیاد بر روی ارائه دهندگان ابر hyperscale ، Ampere این قسمت را برای رقابت با Xeon Platinum 8160 Intel (9،899 دلار لیست پیشنهادی) و Epyc 7742 AMD (6،950 دلار) در بازار طراحی کرده است.

همچنین این هفته ، کمبریج ، شرکت مستقر در انگلستان شناخته شدهتا سال گذشته به عنوان Kaleao و بازسازی ساختار دسامبر گذشته به عنوان Bamboo Systems ، گفت که این سرور 1U بازوی خود ، سری B1000N را در سه ماهه سوم منتشر خواهد کرد.سرور برای محیط های کم مصرف مانند مراکز داده لبه طراحی شده است.

ناگهان رهبر عملکرد

"ظهور" معماری پردازنده بازو در مراکز داده توسط تعداد ما در حال حاضر بسیار خوب است سال پنجم.در مورد معماری و ساخت مراکز داده مدرن ، چیزهای زیادی به طور مستقیم یا غیرمستقیم ناشی از معماری پردازنده x86 است که در ابتدا برای رایانه های شخصی ایجاد شده است.اما تکامل بازو در این فضا آهسته اما پایدار بوده است.

عملکرد Altra Max جدید 128 هسته ای Ampere با هدف قلمرو ابر رایانه انجام شده است.در آنجا ، Xeon Platinum 8160 اینتل دارای 9 سیستم در آخرین Top500 است.

جف ویتیچ ، مدیر ارشد ارشد شرکت آمپر برای محصولات گفت: "در سطح بالا ، ما عملکرد بسیار بیشتری را نسبت به اینتل بر اساس پردازنده ارائه می دهیم."تعداد خام هنوز خبری نیست ، اما ویتیچ مدعی افزایش 2.2 برابر عملکرد در برابر پردازنده های مشابه x86 است ، و تراشه Intpere Intel برای انتخاب قسمت جدید خود در برابر 8160 است.

Altra Max با 80 هسته ای Altra سازگار با سوکت است که بالاترین تعداد هسته بازوی را بدست می آورد.ویتیچ اظهار داشت که پردازنده 128 هسته ای قابلیت مقیاس پذیری خطی را حفظ می کند ، به این معنی که با افزایش تعداد هسته ، عملکرد هر هسته به تدریج از بین نمی رود.

Ampere Computingampere altra arm chip.jpg

اگر ادعای وی صادق باشد ، از ماه مه سال 2019 میلادی پیشرفت خوبی خواهد بود. در مطالعه منتشر شده در آن ماه [PDF] ، یک تیم از دانشگاه بریستول عملکرد آنچه را که در آن زمان اولین ابر رایانه مبتنی بر بازو بود ، یک سیستم Crout XC50 Scout موسوم به Isambard و با پردازنده های Marvell ThunderX2 Arm مقایسه کردند ، در برابر ماشین های Cray با مشخصات مشابه ، از جمله ساخته شده در 28 هسته Xeon پردازنده های پلاتین 8176.

تیم بریستول دریافت که تراشه مارول دچار افت کارایی مقیاس شده است ، به خصوص پس از شمارش گره 16. در 64 گره سرور ، بازده مقیاس پذیری برای پردازنده مبتنی بر بازوی زیر 80 درصد کاهش یافته ، در حالی که تراشه های اینتل همه بالای 100 باقی مانده اند. درصد

در مقابل ، تست های آمپر بر اساس شمارش هسته و نخ است ، نه تعداد گره.با این وجود ، اگر آنچه Wittich گفت صحیح است ، به این معنی است که مهندسان پردازنده Arm بر یک مشکل جدی غلبه کرده اند که می توانست محصولات خود را در فضای HPC غیرقابل رقابت قرار دهد.

ویتیچ به DCK گفت: "تمرکز ما ابر بوده است ، بنابراین ما همه چیز را برای محیط ابر خود بهینه می کنیم."اما بسیاری از کارهایی که ما در آنجا انجام می دهیم برای یک ابر رایانه بسیار مقیاس پذیر قابل اجرا هستند.بنابراین ما مطمئناً علاقه به آنجا خواهیم دید.هیچ چیز مانع این کار نیست. "

Ampere قصد دارد تا اواسط سال 2021 Altra Max را به تولید حجم عمومی برساند.

پاندا مخفی

بسیاری از شرکت های موجود در حال حاضر پردازنده های Arm را در سرورهای خود قرار می دهند.HPE ، Supermicro ، Lenovo همه یک امتیاز را کسب کرده اند. "تونی کرایتورن ، مدیر عامل شرکت Bamboo Systems ، اظهار داشت.اما تمام کارهایی که انجام داده اید یک تراشه بازوی به معماری x86 است.این می تواند برخی از مزایای بازو را به شما منتقل کند - این باعث کاهش قدرت و سرمایش می شود - اما هیچ مزایای پردازش ، I / O و توان عملیاتی را در اختیار شما قرار نمی دهد ، در حالی که بازوی مزیت بزرگی دارد. "

حرف او این بود که بامبو نه تنها سرور با پردازنده Intel یا AMD را جایگزین Arm ارائه می داد ، بلکه معماری کاملاً جدیدی را ساخته است که در اطراف این سبک از پردازنده ساخته شده است.وی با نشان دادن برخی از تلاشهایی که با نام آن ساخته شد ، وی آن را موازی معماری گره طراحی شده یا PANDA می نامد.

وی گفت: "محصول ما امروز می تواند تا حداقل 50٪ از هزینه های خرید خود را در مشتری ذخیره کند (و حتی می تواند بالاتر برود) ، 75٪ از انرژی مصرفی آنها و حدود 80٪ از فضای دندانه دار خود را به دلیل چگالی که می توانیم داشته باشیم به یک شکل شکل بسیار کوچک وارد شوید. "Craythorne به DCK گفت.

اگرچه معماری بامبو برای آن چیزی که او مقیاس پذیری "مینی ابر رایانه" نامیده می شود طراحی شده است ، حداقل در این مرحله اولیه مقیاس بندی از پایین شروع می شود.هر گره سرور بامبو ممکن است شامل یک یا دو تیغ باشد که هر تیغه شامل چهار واحد پردازش کامل است.جعبه 1U شامل هشت سرور لینوکس است که هرکدام حافظه و حافظه اختصاصی دارند.بامبو قصد دارد محصول بعدی 4U را در اواخر سال جاری میلادی تولید کند.

کرایتورن گفت: "بخشی از دلیل راه اندازی آن به عنوان 1U [این است که ما درک کنیم این فناوری جدید است"."همه یک سیستم میراث Intel دارند.هیچ کس فقط قصد ندارد این سیستم را از بین ببرد و برود 150-200000 دلار برای یک سیستم 4U خرج کند.آنها ممکن است بخواهند فقط آن را امتحان کنند.آنها می خواهند چیزی را برای خرید آسان داشته باشند ، که فروش آن آسان باشد ، و قیمت ارزان آن را امتحان کنید ، بنابراین می توانند ببینند که آیا این برای آنها کار می کند. "

Craythorne با "کم هزینه" به معنای 9995 دلار بود.در حالی که یک سرور معمولی با قدرت پایین 1U x86 می تواند برای آن بفروشدزیر 1500 دلار، هر "گره" فقط ممکن است دارای یک CPU چهار هسته ای باشد.مدیرعامل بامبو به ما گفت تیم وی از این تیم استفاده کرده استماشین حساب کل هزینه AWS AWSبرای برآورد هزینه سه ساله بهره برداری از یک قفسه از هشت سرور 2U Dell PowerEdge R740XD با ظرفیت 16kW.برآورد TCO سه ساله AWS تقریباً 560،000 دلار بود.

اگرچه بامبو هنوز یک آزمایش آزمایشی سه ساله را حفظ نکرده است ، این شرکت ادعا می کند که یک رک با عملکرد مشابه سرورهای B1008N حدود 200000 دلار در مدت مشابه متحمل می شود.

تعداد کمی مطالعه TCO برای سرورهای Arm وجود دارد که با آنها می توان پیش بینی های بامبو را مقایسه کرد.تجزیه و تحلیل سال 2014 کارول سرور 64 بیتی ARMv8 ، ProLiant M400 ، هیولت پاکارد (اکنون HPE) توسط تحلیلگر پاتریک مورههد [PDF] ممکن است حداقل مقدمه ای داشته باشد.اگرچه M400 به جای یک 1U "کارتریج" بود ، وقتی در سناریوی وب سرور استفاده می شد ، Moorhead پیش بینی کرد که TCO سه ساله M400 35 درصد پایین تر از TCO یک سرور مشابه 1U x86 باشد.تحقیقات Moorhead شامل اطلاعات آزمایشگاه های ملی Sandia بود.

کریتورن ادعا کرد که B1008N می تواند تا 50 درصد در هزینه خرید مشتریان ، حداقل 75 درصد در مصرف انرژی و 80 درصد از فضای رک را به دلیل تراکم بالاتر سرور ، در مصرف کنندگان صرفه جویی کند.اگرچه وی گفت كه شركت وی آزمایشات داخلی را انجام داده و نمودارهایی را برای نشان دادن این آزمایشات كه معیارهای شناخته شده در معرض دید عموم است ، قرار داده است ، بامبو هنوز شماره های سختی را منتشر نمی كند ، اما كریتورن گفت كه این كار را در آینده نزدیک انجام می دهد.

وی همچنین اعتراف کرد که بخشی از TCO بامبو را می توان برای جبران برخی برنامه های کاربردی که در ابتدا برای x86 طراحی شده بودند تا برای بازو طراحی شود ، هزینه کرد.

هر پردازنده بازوی اجرای معماری پردازش است که حاوی مالکیت معنوی دارای مجوز از Arm Holdings متعلق به گروه Softbank Group است و معمولاً توسط یک شخص ثالث تولید می شود.در نتیجه ، می توان گفت تقریباً هر پردازنده Arm دارای معماری خاص خود است ، حداقل در مورد قسمت غیر مجاز.بامبو نسخه خاص خود را پاندا می نامد.به طور طبیعی ، در گذشته های دور خود کامپیوتر نبوده است ، اما بندرهای انبساط اغلب مورد نیاز را حذف می کند و دو جفت پورت اترنت QSFP را پشت سر می گذارد (یکی برای هر تیغه).

سیستم های بامبوbamboo panda server inside.jpg

کرایتورن گفت: "این بخش مهمی است که بسیاری از مردم برای درک محصولات ما تلاش می کنند."در پاندا ، CPU به مدیریت و اجرای برنامه محدود است و دسترسی به DRAM و حافظه غیر فرار (NVMe) نیز امکان پذیر است.اما وظایف شبکه و ذخیره سازی به طور انحصاری توسط یک پردازنده انجام می شود و سوئیچ شبکه داخلی جایگزین یک سوئیچ بالاتر از قفسه می شود.

سیوبان الیس ، مدیر مدیریت بامبو ، خاطرنشان کرد: "ما سوئیچ L3 بدون انسداد را در هر تیغه با قطعه ای از شبکه درون تیغه داریم."بنابراین تا حدی نیازی به ارسال ترافیک شبکه به خارج از تیغه نیستیم. "در صورت تمایل ، هر دو پورت QSFP روی تیغه ممکن است به یک سوئیچ وصل شود ، یا ممکن است یکی از پورت ها به یک سوئیچ وصل شود و دیگری به تیغه درب بعدی."این تعداد سوئیچ های بیرونی مورد نیاز در قفسه را کاهش می دهد."