💬گفتگو با لاتک

تجهیزات پردازش داده

تجهیزات پردازش داده

با رشد تصاعدی داده‌ها در صنایع مختلف، نیاز به زیرساخت‌های پردازشی قدرتمند در مراکز داده به یکی از ارکان اصلی تحول دیجیتال تبدیل شده است. امروزه، روند رو به رشد نیازهای محاسباتی در حوزه‌های زیر حائز اهمیت است:

  • هوش مصنوعی (AI / ML / DL)  
  • تحلیل کلان‌داده (Big Data Analytics)  
  • شبیه‌سازی علمی و صنعتی (HPC)  
  • مجازی‌سازی و فضای ابری خصوصی

لذا نیاز به زیرساخت‌هایی با چگالی بالا (High-Density Compute) و توان پردازشی گسترده اجتناب‌ناپذیر است.

هدف ما در شرکت لاتک، ارائه ساختار دقیق برای طراحی تجهیزات پردازش داده مبتنی بر معماری ماژولار، GPU Acceleration و Fabric پر سرعت است.

اهداف یک پروژه طراحی تجهیزات پردازش داده به شرح ذیل می باشد:

  • ارتقاء توان پردازشی مراکز داده برای پشتیبانی از AI، ML و Big Data
  • کاهش زمان پاسخ‌دهی و افزایش بهره‌وری پردازش داده
  • بهینه‌سازی مصرف انرژی و فضا در دیتاسنتر

تحلیل هزینه و مقیاس‌پذیری پروژه:

  • طراحی به صورت Scale-Out Modular
  • امکان افزودن نود پردازشی و گره ذخیره‌سازی در زمان رشد نیاز
  • بهینه‌سازی نسبت Watt per TFLOPS
  • کاهش TCO با استفاده از انرژی بهینه (GPU + EPYC)

مراحل پیاده‌سازی پروژه:

  • تحلیل نیازهای بار پردازشی
  • طراحی Logical و Physical Topology
  • کانفیگ و انتخاب سخت‌افزار براساس نیاز SLA
  • پیاده‌سازی راه حل
  • راه‌اندازی ابزارهای مانیتورینگ
  • تست، تحویل، مستندسازی

سرور های General Compute برای پایگاه داده و پردازش عمومی

این مجموعه از سرور ها، برای بارهای کاری عمومی مانند فایل سرور، پایگاه داده، وب‌سرور، و مجازی‌سازی ساده، توازن بین پردازنده، حافظه و ذخیره‌سازی طراحی شده و دارای مشخصات زیر می باشند:

مشخصه مقدار
فرم فکتور 1U - Rackmount یا 2U
CPU Dual AMD EPYC 9xxx / Intel Gen6
RAM 1TB تا 6TB DDR5
NVMe Bays 4 تا 24 عدد
کاربرد مجازی‌سازی، پایگاه داده، Kubernetes, Edge Compute

مدل‌های پیشنهادی:

  • HPE DLxxx Gen11 – Gen12
  • Supermicro AS-xxxxxx-TNR
  • Dell PowerEdge Rxxx

سرور های GPU-Based برای هوش مصنوعی (AI) و HPC

مشخصه مقدار
فرم فکتور 4U (Multi-GPU Server)
پردازنده 2x Intel Xeon Gen6 / AMD EPYC, Genoa,
GPU 4 تا 8 عدد NVIDIA Hxxx SXM5
حافظه TB DDR5 ECC4
NVLink / Fabric NVSwitch 4.0 (900GB/s GPU-to-GPU)
کاربرد AI/ML Training, LLMs, Simulation, DGX Replacement

مدل‌های پیشنهادی:

  • Supermicro SYS-xxxxx-TNRT
  • NVIDIA DGX
  • HPE Cray XD GPU Node

سرور های محاسباتی با چگالی بالا (High-Density Compute Servers)

طراحی شده برای پردازش‌های سنگین مانند تحلیل داده، شبیه‌سازی عددی، یا پردازش مالی با تمرکز بر تعداد بالای هسته‌ها و کارایی بالا در فضای کم که دارای مشخصات زیر می باشند:

مشخصه مقدار / توضیح رفرنس
نوع معماری Dual Socket (Xeon / EPYC) Intel Xeon Scalable Datasheet, AMD EPYC Overview
فرم‌فکتور Single 1U / 2U / 4U / 6U یا Multi-node Dell, Supermicro, HPE Technical Docs
حداکثر نود در رک U42 Micro تا 84 نود1U / تا 40 نود HPE Moonshot, Supermicro Twin Architecture
تعداد سوکت CPU 1 یا 2 per node هر مدل سرور
پردازنده‌ها Intel Xeon Gen6 / AMD EPYC 9xxx, Intel / AMD
حداکثر هسته (per node) تا 192 هسته AMD EPYC 9xxx Datasheet
حافظه RAM پشتیبانی‌شده تا 6TB DDR5 ECC Dell Rxx / HPE DL380 Genxx
نوع حافظه DDR5 ECC Registered Kingston, Micron DDR5 RDIMM Whitepaper
حافظه کش L3 تا MB384 AMD EPYC 9xxx
ذخیره‌سازی داخلی NVMe U.2 Supermicro NVMe Systems, Dell XE Platform, HPE
پشتیبانی GPU Optional Supermicro, Dell Platform, HPE
کارت شبکه 2x 10/25/100G (OCP NIC 3.0) Dell PowerEdge OCP 3.0, Supermicro AOC Options, HPE
خنک‌سازی Airflow / Liquid Cooling (HPC) Lenovo Neptune Liquid Cooling, HPE
منبع تغذیه Redundant 1.2-2.4kW HPE Redundant PSU Spec
مدیریت OOB BMC + Redfish / IPMI / iDRAC IPMI Consortium, Dell iDRAC Docs
سیستم عامل پشتیبانی RHEL, Ubuntu, VMware, Windows OS Vendor Compatibility Lists
کاربردها HPC, AI-lite, Virtualization, CI/CD NIST AI Infrastructure Guide, NVIDIA DGX Lite

مدل‌های پیشنهادی:

  • Supermicro SYS-xxxxx-TNRT
  • NVIDIA DGX
  • HPE Cray XD GPU Node
برند مدل توضیح فنی رفرنس
Supermicro BigTwin 2029BZ-HNR 2 نود در یک شاسی 4U Supermicro BigTwin Datasheet
Dell PowerEdge C6525 4x 1U EPYC Node in 2U Dell C6525 Spec Sheet
Lenovo ThinkSystem SD665 V3 1U EPYC Node با خنک‌سازی مایع Lenovo SD665 V3 Docs
HPE Apollo 2000 Gen10 Plus Multi-node dense compute HPE Apollo 2000 Gen10+
Inspur NF5468M6 GPU Dense Server for AI+Compute Inspur NF5468M6

مؤلفه‌های کلیدی راهکار

برای طراحی یا ارزیابی یک راهکار تجهیزات پردازش داده (Compute Infrastructure) مبتنی بر سرور ها، مؤلفه‌های کلیدی به چند دسته اصلی تقسیم می‌شوند. این مؤلفه‌ها در کنار هم، توان محاسباتی، کارایی، پایداری و مقیاس‌پذیری سیستم را تضمین می‌کنند.

دسته‌بندی مولفه کلیدی توضیحات
پردازشگر (CPU) نوع و تعداد هسته‌ها Intel Xeon یا AMD EPYC بسته به نیاز محاسباتی و پشتیبانی از مجازی‌سازی و AI
فرکانس پایه و Boost تأثیر مستقیم بر عملکرد کلی سرور
پشتیبانی از شتاب‌دهنده‌ها مانند Intel DL Boost یا AVX512 و AMD Infinity Fabric برای بارهای AI
حافظه (RAM) ظرفیت کل و نوع پیکربندی مناسب با DDR4 یا DDR5 حداکثر 32GB×16
سرعت حافظه تاثیرگذار بر عملکرد داده و پایگاه داده
پشتیبانی از ECC برای تصحیح خطاهای حافظه در کاربردهای حیاتی
ذخیره‌سازی (Storage) نوع دیسک برای ظرفیت بالا HDD و برای سرعت بالا SSD/NVMe
RAID Configuration برای افزونگی و عملکرد (RAID 10/5)
سرعت خواندن/نوشتن متناسب با بار کاری مانند OLTP یا Backup
شتاب‌دهنده (GPU/DPU) نوع کارت NVIDIA Tesla T4 و A100/Hx00 برای AI یا BlueField DPU برای offload و AI Inference
رابط اتصال PCIe Gen4/5 برای پهنای باند بالا
شبکه (Network) پورت‌های LAN/FC 10/25/100 GbE Ethernet یا 32G Fibre Channel
پشتیبانی از RDMA یا RoCE برای کاهش latency در HPC یا AI
منبع تغذیه (Power) تعداد و توان دو منبع تغذیه Redundant با توان کافی مثل ۲×1600W
راندمان برای بهینه‌سازی مصرف انرژی Platinum یا Titanium PLUS
سیستم خنک‌کننده نوع خنک‌سازی خنک‌سازی هوایی (Active Fans) یا مایع (Liquid Cooling) برای چگالی بالا
نرم‌افزار مدیریتی برای بررسی وضعیت سلامت انرژی، دما، هشدار و alert
مدیریت و نظارت مانیتورینگ هوشمند iLO (HPE)، iDRAC (Dell)، BMC، HPE OneView یا Redfish API
نرم‌افزار مدیریتی برای بررسی وضعیت سلامت انرژی، دما، هشدار و alert
شاسی و فرم فکتور نوع شاسی Rackmount (1U/2U/4U/6U) یا Blade برای چگالی بالا
توسعه‌پذیری پشتیبانی از PCIe Slots، Bays برای دیسک‌های بیشتر و ارتقاء آینده

مزایای راهبردی طراحی تجهیزات پردازش داده

افزایش کارایی عملیاتی

با استفاده از سرور های با پردازنده‌های چند‌هسته‌ای، حافظه سریع و ذخیره‌سازی NVMe، پردازش حجم بالای داده‌ها با سرعت بالا ممکن می‌شود.

نتیجه: کاهش زمان اجرای فرایندها، پاسخ‌دهی سریع‌تر سیستم‌ها، و بهبود تجربه کاربری داخلی و مشتریان.

مقیاس‌پذیری و انعطاف‌پذیری بالا و چابکی در پاسخ به نیازهای تجاری

با استفاده از سرور های مقیاس‌پذیر، سازمان می‌تواند به سرعت منابع پردازشی خود را افزایش یا کاهش دهد تا متناسب با نیازهای پروژه‌ها یا تغییرات بازار عمل کند.

نتیجه: پاسخ‌گویی مؤثر به رشد سازمان، پروژه‌های موقت یا بارهای متغیر بدون نیاز به بازطراحی زیرساخت.

افزایش پایداری، دسترس‌پذیری و تداوم خدمات

استفاده از اجزای افزونه‌پذیر (redundant) مانند منبع تغذیه، فن، RAID و کارت شبکه مناسب باعث جلوگیری از خرابی سیستم می‌شود.

نتیجه: تداوم سرویس‌دهی، کاهش Downtime و حفظ داده‌های حیاتی سازمان.

امنیت پیشرفته و یکپارچه و آمادگی برای تحول دیجیتال

سرورهای مدرن دارای ویژگی‌هایی مثل Root of Trust، رمزگذاری حافظه و کنترل دسترسی سخت‌افزاری هستند. این راهکارها زیرساخت لازم برای اجرای بارهای کاری نوین مانند هوش مصنوعی، تحلیل داده، اتوماسیون و رایانش ابری را فراهم و مسیر تحول دیجیتال سازمان را هموار می‌سازند.

نتیجه: کاهش تهدیدات سایبری، جلوگیری از نشت اطلاعات و انطباق بهتر با الزامات امنیتی و مقرراتی و تطابق با راهکارهای هوش مصنوعی

چالش های این راهکار عبارتند از:

عدم چگالی پردازشی کافی در فضای محدود رک

چالش: فضای رک و یونیت در مراکز داده محدود است، اما نیاز به توان پردازشی بالا روز‌به‌روز بیشتر می‌شود.

راهکار: استفاده از سرورهای High-Density با پشتیبانی از CPU و GPU های پرقدرت، امکان پردازش حداکثری در کمترین فضا را فراهم می‌کند.

مدیریت پیچیده منابع سخت‌افزاری در مقیاس بزرگ

چالش: مدیریت دستی ده‌ها یا صدها سرور در یک دیتاسنتر زمان‌بر، خطاپذیر و پرهزینه است.

راهکار: پلتفرم‌هایی مانند HPE OneView، Dell OpenManage یا Redfish API امکان اتوماسیون کامل Provisioning، مانیتورینگ، Firmware Upgrade و تحلیل Predictive را فراهم می‌کنند.

چالش در تأمین برق و خنک‌سازی برای بارهای سنگین پردازشی

چالش: بارهای کاری سنگین مانند AI و تحلیل داده، گرمای زیاد و مصرف برق بالا دارند که ظرفیت دیتاسنتر را به چالش می‌کشد.

راهکار: استفاده از سرورهایی با طراحی بهینه (80 PLUS Titanium)، پردازنده‌های با بازده بالا و پشتیبانی از خنک‌سازی مایع  Liquid یا Airflow مدیریت‌شده، این چالش را حل می‌کند.

عدم انطباق با نیازهای متغیر سازمان و رشد تدریجی

چالش: سازمان‌ها نیاز به زیرساختی دارند که هم‌زمان پاسخگوی نیاز فعلی و قابل توسعه برای آینده باشد.

راهکار: Compute Infrastructure ماژولار و مقیاس‌پذیر، امکان ارتقاء مرحله‌ای منابع CPU, RAM, GPU و Storage را بدون توقف سرویس فراهم می‌سازد.

محصولات راهکارهای تجهیزات پردازش داده

معیار HPE Dell EMC Supermicro H3C
مدل‌های برجسته ProLiant DL380 Gen11-12 Apollo 6500 Gen11 Synergy PowerEdge R760XE 9680 MX7000 SYS-620U-TNBR SYS-820GH-TNHR BigTwin UniServer R5300 G6G5800 G6G5900 AI
پردازنده‌ها Intel Xeon Gen4/5/6 AMD EPYC 9xxx Intel Xeon Gen4/5/6 AMD EPYC 9xxx Intel Xeon Gen4 AMD EPYC Intel Xeon Gen4 Huawei Kunpeng ARM
خنک‌سازی پیشرفته Air + Optional Liquid (Apollo) Smart Airflow + Liquid Ready Airflow و Liquid ترکیبی Liquid Cooling با طراحی اختصاصی
چگالی پردازشی بالا 1U و multi-node ،2U و GPU dense بسیار بالا 6U در 8 GPU MX7000 چند نود در بسیار بالا 2U/4U با چند نود و GPU تا 10 عدد بالا 4U/5U بالا GPU با تراکم
ماژولار بودن بسیار بالا Apollo modular Synergy بالا MX7000 sled-based design بالا Node-based open design متوسط در نسل G6 رو به رشد
پشتیبانی از GPU/AI عالی 8 × Hx00 همراه با پشتیبانیNVLink عالی XE9680: 8 × Hx00, SXM عالی 8 و 10 GPU در 4U AMD/NVIDIA بالا تا 10 GPU + Ascend AI chip
مدیریت و مانیتورینگ iLO 6 + HPE OneView + InfoSight iDRAC9 + OpenManage + CloudIQ IPMI + SuperDoctor + Redfish HDM + Intelligent Prediction Engine
امنیت سخت‌افزار Silicon Root of Trust + TPM 2.0 Hardware Root of Trust + TPM + Secure Boot TPM + BMC Secure Platform Trusted Platform Architecture (TPA)
توسعه‌پذیری آینده‌نگر بسیار بالا Composable + GreenLake بسیار بالا Apex + Bare Metal Cloud بسیار بالا Open Rack + GPU scaling بالا توسعه با CPU/GPU چینی
مناسب بازارهای سازمانی، بانک‌ها، دولت، HPC مراکز داده جهانی AI, Cloud Enterprise دیتاسنترهای مقرون‌به‌صرفه HPC, AI, Edge بازار آسیا، چین، سفارشی‌شده AI

خدماتی که لاتک برای مشتریان خود انجام میدهد

مشاوره تخصصی و آموزش

ارائه مشاوره در انتخاب دوره‌های آموزشی برای پرسنل سازمان به منظور بهره‌برداری بهینه از تجهیزات مراکز داده و برگزاری آن

تأمین تجهیزات

تأمین تجهیزات مراکز داده از برندهای معتبر جهانی برای حفاظت بهتر از زیرساخت‌های سازمانی

پیکربندی، نصب و راه‌اندازی

پیکربندی، نصب و راه اندازی تجهیزات مراکز داده با رعایت آخرین استانداردهای فنی.

پشتیبانی و نگهداری

ارائه پشتیبانی فنی مستمر و بروزرسانی دوره‌ای قابلیت های جدید و آخرین نسخ نرم افزاری و حذف باگ ها برای حفظ امنیت بلندمدت و رفع ایراد