Trong bối cảnh AI đang trở thành hạ tầng quan trọng của nhiều doanh nghiệp, các hệ thống AI workstation nhỏ gọn nhưng mạnh mẽ ngày càng được quan tâm. Xuất hiện tại NVIDIA GTC 2025, NVIDIA DGX Spark nhanh chóng thu hút sự chú ý nhờ khả năng mang sức mạnh AI của NVIDIA vào một thiết bị mini. Qua trải nghiệm ban đầu của đội ngũ Hoàng Hà PC, đây có thể là một trong những mini AI workstation đáng chú ý nhất dành cho developer và doanh nghiệp trong thời gian tới.
Tổng quan về phần cứng NVIDIA DGX Spark
Một trong những điểm gây ấn tượng mạnh khi nhìn thấy NVIDIA Spark ngoài đời thực chính là kích thước cực kỳ nhỏ gọn của PC AI này. Đây là một Mini PC AI mà chỉ khi tận mắt nhìn hoặc cầm trên tay, bạn mới thật sự cảm nhận được sự khác biệt. NVIDIA Spark có kích thước chỉ 150mm x 150mm x 50,5mm, nhỏ hơn rất nhiều so với những gì nhiều người hình dung về một hệ thống AI workstation, nhưng thiết kế tổng thể lại mang đến cảm giác rất hiện đại và cao cấp.
Theo Hoàng Hà PC nhận xét thấy: “Đây có lẽ là chiếc mini PC ngầu nhất từng thấy.” Điều này càng đáng chú ý khi tại thời điểm đó chúng tôi đang làm việc với nhiều hệ thống phần cứng khác nhau, bao gồm ba chiếc PC sử dụng nền tảng AMD Strix Halo, hai hệ thống GB10 (trong đó có NVIDIA Spark), cùng một hệ thống Intel kết hợp dock PCIe và một số thiết bị khác. Ngay cả khi đặt cạnh những cấu hình mạnh mẽ đó, NVIDIA Spark vẫn tạo được ấn tượng riêng nhờ kích thước nhỏ gọn nhưng đầy cá tính.

NVIDIA DGX SPARK Mặt trước
Phần mặt trước của máy có lớp vật liệu trông giống như bọt (foam), nhưng thực tế đây là một lớp bề mặt cứng được thiết kế để cho phép không khí lưu thông, hỗ trợ quá trình tản nhiệt cho hệ thống.

NVIDIA DGX SPARK Mặt trước
Ở mặt đáy, NVIDIA trang bị một khe thoát gió lớn cùng với miếng đệm cao su kích thước lớn. Nhờ vậy, khi đặt trên bàn làm việc, hệ thống có thể đứng rất vững và ổn định.

NVIDIA DGX SPARK Mặt dưới
Hai bên hông và phần phía trên của thiết bị được thiết kế khá tối giản với bề mặt phẳng.

NVIDIA DGX SPARK mặt 1 dọc
Các cạnh bên có màu vàng ánh kim và được hoàn thiện bằng kim loại, tuy nhiên ngoài những chi tiết đó thì không có quá nhiều điểm nổi bật để nói thêm.

NVIDIA DGX SPARK mặt ngang
Phía sau của máy mới thực sự là nơi tập trung hầu hết các thành phần quan trọng, từ nút nguồn cho đến các cổng kết nối I/O.

NVIDIA DGX Spark – Mặt sau
Ở phía sau bên trái, chúng ta có nút nguồn, tiếp theo là một cổng USB Type-C dùng cho nguồn vào USB Power Delivery (USB PD). Bên cạnh đó là ba cổng USB Type-C chuẩn USB 3 20Gbps hỗ trợ DisplayPort Alt Mode. Tiếp theo là một cổng HDMI. Tuy nhiên, có một số lưu ý liên quan đến khả năng hiển thị mà chúng tôi sẽ đề cập chi tiết hơn ở phần sau.

NVIDIA DGX Spark – Các cổng kết nối
Về kết nối mạng, hệ thống được trang bị một cổng 10GbE sử dụng chip Realtek. May mắn là driver của cổng này đã được tích hợp sẵn trong DGX OS, nên chúng tôi không cần phải cài đặt thêm.
Điểm nổi bật thực sự nằm ở card mạng NVIDIA ConnectX-7.

NVIDIA DGX Spark – Card mạng NVIDIA ConnectX-7
Chúng tôi sẽ nói chi tiết hơn ngay sau đây, nhưng về cơ bản đây là các cổng QSFP56 tốc độ 200GbE, nghĩa là chúng hoạt động với bốn kênh truyền dữ liệu 56G / 50Gbps PAM4. Chúng tôi từng giải thích kỹ hơn về chuẩn này trong bài viết QSFP vs QSFP-DD – Những khác biệt quan trọng, bởi khi tốc độ mạng tăng cao, vấn đề kết nối vật lý cũng trở nên phức tạp hơn.
Những cổng mạng này chính là yếu tố quan trọng tạo nên giá trị của hệ thống DGX Spark cũng như nền tảng GB10 nói chung. Nhờ tốc độ cực cao và hỗ trợ RDMA networking, người dùng có thể sử dụng cáp DAC đồng để kết nối hai hệ thống với nhau, từ đó mở rộng thêm tài nguyên tính toán và bộ nhớ.
Tiếp theo, chúng ta sẽ tìm hiểu cách hệ thống này hoạt động cùng GB10, cũng như một số tính năng đáng chú ý của các cổng mạng 200GbE này.
Trái tim sức mạnh của Spark: NVIDIA GB10
Do thời gian trải nghiệm khá hạn chế, chúng tôi cũng không muốn tháo rời hệ thống của mình và thực tế là trước đó đã có sẵn những hình ảnh chi tiết về bo mạch chủ, nên trong phần này chúng tôi sẽ sử dụng lại một số hình ảnh từng được đăng tải trước đây trên Nvidia. Dưới đây là bo mạch chủ của hệ thống với đầy đủ các thành phần quan trọng.

Bo mạch chủ của hệ thống NVIDIA DGX Spark
Ở trung tâm của hệ thống là NVIDIA GB10 (Grace Blackwell), kết hợp CPU Arm 20 nhân với GPU kiến trúc Blackwell, được kết nối với nhau thông qua C2C NVLink. Bên cạnh đó, hệ thống còn được trang bị 128GB bộ nhớ LPDDR5X, nằm xung quanh cụm xử lý này.

Cận cảnh chip NVIDIA GB10 trên bo mạch của NVIDIA DGX Spark
Chúng tôi sẽ đề cập chi tiết hơn về bộ nhớ hợp nhất (unified memory) ở phần sau, nhưng đây là một tính năng rất quan trọng, bởi nó cho phép toàn bộ hệ thống sử dụng chung một vùng bộ nhớ lớn, giúp tối ưu hiệu suất khi xử lý các tác vụ AI và tính toán phức tạp.

NVIDIA DGX Spark: Được trang bị siêu chip GB10
NVIDIA GB10 là kết quả hợp tác giữa NVIDIA và MediaTek, trong đó phần CPU Arm được phát triển dựa trên IP của MediaTek. Sau đó, thành phần này được kết hợp với GPU kiến trúc NVIDIA Blackwell thông qua liên kết C2C NVLink. Về mặt khái niệm, thiết kế này khá giống với các dòng Grace Blackwell cao cấp, nhưng ở quy mô nhỏ hơn, và trong tương lai hoàn toàn có thể được sử dụng trên máy tính để bàn hoặc thậm chí là laptop.

GB10: Sự hợp tác thành công giữa NVIDIA và Mediatek
Theo thông tin từ NVIDIA, SoC GB10 có TDP khoảng 140W (đây là mức tiêu thụ của riêng SoC, không phải toàn bộ hệ thống). CPU Arm và GPU Blackwell được kết nối trực tiếp với nhau thông qua liên kết C2C NVLink, cho phép hai thành phần chia sẻ dữ liệu với băng thông rất cao. Nếu muốn tìm hiểu chi tiết hơn về kiến trúc này.

Thông số kỹ thuật NVIDIA GB10
Về thông số kỹ thuật, GB10 được sản xuất trên tiến trình 3nm của TSMC, sử dụng công nghệ đóng gói 2.5D cùng nhiều công nghệ tiên tiến khác nhằm tối ưu hiệu năng và mật độ tích hợp cho các tác vụ AI và tính toán hiệu năng cao.

Thông số kỹ thuật NVIDIA GB10
Ở phía GPU, chúng ta có thể thấy GPU kiến trúc Blackwell được trang bị 24MB bộ nhớ đệm L2 cho đồ họa, cùng băng thông tổng hợp lên tới 600GB/s, dù băng thông của bộ nhớ LPDDR5X thực tế chỉ bằng chưa tới một nửa con số đó.

GPU NVIDIA GB10
Dưới đây là cái nhìn nhanh về kết quả lệnh lscpu của CPU Arm 20 nhân trên hệ thống.

NVIDIA DGX Spark Lscpu
Tiếp theo là kết quả lệnh nvidia-smi của GPU NVIDIA Blackwell.

NVIDIA DGX Spark Nvidia Smi
Nếu quan sát kỹ bo mạch chủ, một chi tiết dễ nhận ra là ConnectX-7 không phải là một thành phần nhỏ. Trên thực tế, nó gần tương đương với card mạng NVIDIA ConnectX-7 OCP NIC 3.0 mà chúng tôi từng đánh giá trước đây – một adapter mạng 2 cổng 200GbE. Ngay cả trên thị trường đồ cũ như eBay, các card mạng ConnectX-7 vẫn thường có giá từ khoảng 900 USD trở lên.

NVIDIA DGX SPARK Góc nghiêng phía sau 4
Khi nói về chi phí của các hệ thống GB10, cần lưu ý rằng card mạng ConnectX-7 chiếm một phần đáng kể trong tổng giá trị của hệ thống.

NVIDIA GB10 ConnectX 7 Chế độ
Nếu bạn đang thắc mắc liệu NIC này có thực sự hỗ trợ RDMA và RoCE hay không, thì câu trả lời là có.

Hai card đồ họa NVIDIA DGX Spark với công nghệ RoCE
Một điểm thú vị khác là hệ thống cũng có thể hoạt động với switch MikroTik CRS812 DDQ / CRS812-8DS-2DQ-2DDQ. Tôi đã nói với NVIDIA rằng mình có một switch có thể cung cấp tới sáu cổng 200GbE, đồng thời vẫn còn tám cổng 50GbE chưa sử dụng. Các cổng QSFP56-DD có thể được chia thành hai kết nối 200GbE, và trên thiết bị này còn có thêm hai cổng QSFP56.

MikroTik CRS812 8DS 2DQ 2DDQ Mặt trận Latvia 2x QSFP56 DD 400GbE Và 2x QSFP56 200GbE
Một chi tiết nhỏ cần lưu ý là khi kết nối trực tiếp bằng cáp DAC, hệ thống dường như tự động đàm phán tốc độ 200GbE. Tuy nhiên, khi kết nối thông qua switch MikroTik mới này, chúng tôi phải thiết lập thủ công tốc độ cổng ở mức 200Gbps.

MikroTik CRS812 DDQ kết nối NVIDIA GB10 qua cổng QSFP56-DD ở tốc độ 200GbE, cấu hình thủ công không dùng auto-negotiation.
Với việc được trang bị kết nối mạng RDMA tốc độ cao, rất có thể nhiều người dùng sẽ bắt đầu kết nối nhiều hệ thống này lại với nhau để tạo thành cụm (cluster).

Mạng NVIDIA GB10 Lshw
Tuy nhiên khi xem xét kỹ ConnectX-7, chúng tôi nhận thấy NIC này chỉ sử dụng kết nối PCIe 32GT/s x4.

Kết nối NVIDIA GB10 ConnectX 7 PCIe Gen5 X4
Điều này khá đáng chú ý, bởi PCIe Gen5 x4 về cơ bản tương đương với băng thông của một NIC khoảng 100Gbps. Khi chúng tôi chạy thử nghiệm iperf3 để truyền dữ liệu qua cả hai cổng mạng, tổng băng thông thu được chỉ khoảng 96Gbps, tương tự như khi sử dụng một cổng duy nhất.

Card đồ họa NVIDIA GB10 ConnectX 7 Dual Port đạt tốc độ 100Gbps chỉ với 2 cổng, hiệu năng 2x Iperf3.
Do ConnectX-7 được hệ thống nhận diện thành bốn thiết bị riêng, chúng tôi đã chạy thử iperf3 bằng cách gán từng NIC, thực hiện bốn bài test end-to-end, cả khi sử dụng cáp DAC lẫn khi đi qua switch MikroTik CRS812 DDQ.

Card đồ họa NVIDIA GB10 ConnectX 7 Dual Port đạt tốc độ 100Gbps chỉ với 4 cổng và 4x Iperf3 Binding.
Ngoài ra cũng cần nhắc nhanh rằng hệ thống còn được trang bị mạng Realtek 10GBase-T cùng kết nối không dây MediaTek Wi-Fi 7. Kết nối Wi-Fi 7 này cũng có thể được sử dụng để thiết lập ban đầu cho hệ thống.
Tiếp theo, chúng ta sẽ cùng tìm hiểu về cấu trúc topology của hệ thống.
Cấu trúc Topology của NVIDIA DGX Spark
Về mặt topology (cấu trúc kết nối hệ thống), dưới đây là những gì bạn có thể thấy khi triển khai một hệ thống như thế này:

Cấu trúc liên kết NVIDIA DGX Spark
Trong sơ đồ này, chúng ta có thể thấy 20 nhân Arm Cortex của hệ thống. Trong đó bao gồm 10 nhân hiệu năng cao Arm Cortex-X925 và 10 nhân tiết kiệm điện Arm Cortex-A725. Tuy nhiên, đây có lẽ không phải là điểm đáng chú ý nhất.
Điểm nổi bật thực sự nằm ở tổng dung lượng bộ nhớ lên tới 128GB, được thể hiện ở phần phía trên của sơ đồ. Khác với các hệ thống AMD Strix Halo, nơi bộ nhớ thường được chia tách giữa CPU và GPU (ví dụ như 32GB cho CPU và 96GB cho GPU), DGX Spark sử dụng kiến trúc bộ nhớ hợp nhất (unified memory). Điều này có nghĩa là toàn bộ hệ thống có thể sử dụng một vùng bộ nhớ chung dung lượng lớn, thay vì phải chia tách riêng cho từng thành phần.
Ngoài ra, sơ đồ topology cũng cho thấy các thành phần quan trọng khác của hệ thống như card mạng Realtek 10GbE, card mạng NVIDIA ConnectX-7 200GbE, SSD NVMe dung lượng 4TB, cùng với GPU Blackwell 48 compute units. Những thành phần này kết hợp lại tạo nên nền tảng phần cứng mạnh mẽ cho DGX Spark.
Tổng quan phần mềm của NVIDIA DGX Spark
Về mặt phần mềm, hệ thống này sử dụng NVIDIA DGX OS, một hệ điều hành được phát triển dựa trên Ubuntu, nhưng đã được tích hợp sẵn driver và các công cụ của NVIDIA. Điều này cũng đồng nghĩa với việc người dùng có thể sử dụng NVIDIA DGX Dashboard để quản lý và theo dõi hệ thống.
Chúng tôi đã giới thiệu nhanh một phần quá trình thiết lập trong video, tuy nhiên do gặp một số vấn đề liên quan đến hiển thị, nên việc ghi lại đầy đủ trong bài đánh giá này trở nên khó khăn hơn.
Hệ thống hỗ trợ hai phương thức thiết lập. Người dùng có thể thiết lập trực tiếp trên máy (local setup) khi ngồi tại thiết bị, hoặc sử dụng chế độ thiết lập qua mạng. Trong chế độ này, card Wi-Fi 7 của thiết bị sẽ chuyển sang chế độ điểm truy cập (AP mode), cho phép bạn kết nối không dây trực tiếp tới DGX Spark để tiến hành cấu hình ban đầu.

NVIDIA DGX Dashboard 120GB
Đi kèm với hệ thống, NVIDIA cũng cung cấp chương trình NVIDIA Sync. Ban đầu, chúng tôi nghĩ rằng tính năng này có vẻ không quá cần thiết, nhưng sau khi sử dụng thực tế thì nhận định ban đầu đó hoàn toàn sai.
NVIDIA Sync cho phép bạn thiết lập phần mềm để truy cập và sử dụng hệ thống từ xa. Công cụ này tự động xử lý các SSH tunnel và các kết nối cần thiết, giúp những dịch vụ như giao diện web hoạt động trơn tru khi truy cập từ xa.
Theo cách NVIDIA giải thích với chúng tôi, bạn hoàn toàn có thể mở hộp thiết bị, đặt lên bàn và chạy ở chế độ headless (không cần màn hình). Thậm chí còn có thể đi xa hơn thế. Ví dụ, hiện tại tôi đang cách nhà khoảng 1000km, nhưng vẫn đang viết bài này kết nối trực tiếp tới DGX Spark, nhờ việc chúng tôi đã cài Tailscale VPN trên hệ thống.
Sự kết hợp giữa Tailscale và NVIDIA Sync thực sự là một giải pháp rất hiệu quả để quản lý và sử dụng DGX Spark từ xa.

Đồng bộ NVIDIA
Để bạn dễ hình dung, sự kết hợp này cho phép thiết lập nhanh một môi trường Cursor được tăng tốc bởi DGX Spark.

NVIDIA DGX Spark với con trỏ sử dụng NVIDIA Sync
Ngoài ra, hệ thống cũng có sẵn các tùy chọn tích hợp NVIDIA AI Workbench cùng với VS Code, giúp việc thiết lập môi trường phát triển AI trở nên thuận tiện hơn ngay từ khi bắt đầu sử dụng.

NVIDIA Sync NVIDIA AI Workbench
Trong hình bên dưới là Open WebUI đang chạy các mô hình Ollama. Bạn có thể thấy địa chỉ host hiển thị là “localhost” với cổng 12000. Đây chính là “phép thuật” của NVIDIA Sync, bởi thực tế hệ thống DGX Spark đang đặt tại studio, trong khi tôi đang truy cập từ xa. Dù hiển thị là localhost, nhưng thực tế tôi thậm chí không ở cùng bang với chiếc DGX Spark.

NVIDIA Sync Ollama Open WebUI
NVIDIA cũng đang phát hành nhiều hướng dẫn và tutorial đi kèm với DGX Spark để giúp người dùng nhanh chóng bắt đầu. Các nội dung này bao gồm chạy LLM, tạo ảnh bằng AI, fine-tuning mô hình, RAG, cùng nhiều demo khác. Đây là một cách tiếp cận rất hay, và có lẽ AMD cũng như Intel nên học hỏi mô hình này.
Hiệu năng của NVIDIA DGX Spark
Trước khi đi vào các bài kiểm tra chi tiết, hãy nhìn tổng quan một chút về sức mạnh của GPU trong hệ thống này. GPU của DGX Spark có khả năng tính toán FP4 khoảng ~1 PFLOP, tương đương với NVIDIA GeForce RTX 5070. Tuy nhiên, đây không phải là một thiết bị ở đẳng cấp RTX 5090, chủ yếu do kích thước của hệ thống rất nhỏ gọn và băng thông bộ nhớ cũng không ở cùng mức.
Điểm khác biệt lớn của DGX Spark nằm ở kiến trúc bộ nhớ hợp nhất 128GB. Nhờ đó, hệ thống có thể tải nhiều mô hình AI cùng lúc, đồng thời làm việc với các mô hình có kích thước lớn hơn, thay vì bị giới hạn bởi dung lượng bộ nhớ GPU riêng biệt như trên các hệ thống truyền thống.
Tiếp theo, chúng ta sẽ cùng xem hiệu năng của hệ thống.

NVIDIA GB10 Nvidia Smi Ollama Gpt Oss 20b Và Gpt Oss 120b
Chỉ với Ollama mặc định, chưa tinh chỉnh, khi chạy mô hình OpenAI gpt-oss 20B, hệ thống thường đạt hơn 49 token/giây.

NVIDIA DGX Spark Open WebUI Ollama Gpt Oss 20B Performance
Tất nhiên, khả năng của DGX Spark không dừng lại ở đó. Với hệ thống này, chúng tôi cũng có thể chạy các mô hình lớn hơn như gpt-oss 120B, và trong thử nghiệm này tốc độ đạt khoảng 14,48 token/giây.

NVIDIA DGX Spark Open WebUI Ollama Gpt Oss 120B Performance
Một mô hình khác là Qwen3 32B – vốn được đánh giá khá tốt – cũng chạy khoảng 9–10 token/giây ngay khi sử dụng mặc định, chưa cần tối ưu thêm.

NVIDIA DGX Spark Open WebUI Ollama Qwen3 32B Performance
Chúng tôi sẽ bổ sung thêm nhiều bài test chi tiết hơn trong thời gian tới. Tuy nhiên, do muốn hoàn thành bài đánh giá này sớm để chia sẻ trải nghiệm ban đầu, nên hãy tiếp tục theo dõi để cập nhật thêm các kết quả thử nghiệm mới.
Hiệu năng CPU NVIDIA GB10 trong Geekbench
Một điểm đáng chú ý nhanh là CPU 20 nhân trong hệ thống này có thể sẽ bị nhiều người bỏ qua. Tuy nhiên trên thực tế, hiệu năng của nó khá ấn tượng.
Dưới đây là một ví dụ về kết quả benchmark Geekbench 5 CPU, so sánh NVIDIA GB10 với nền tảng AMD Strix Halo. Lưu ý rằng hiện tại GB10 chỉ hỗ trợ hệ điều hành Linux, nhưng các kết quả này vẫn mang tính tham khảo hữu ích cho người dùng.

Hiệu năng CPU của NVIDIA DGX Spark GB10 trên Geekbench 5
Dưới đây là kết quả so sánh Geekbench 5 giữa hệ thống này và Minisforum S1-Max sử dụng AMD Strix Halo, vốn đang chạy ở mức công suất cao hơn so với phiên bản trong chiếc GMKTec.

So sánh hiệu năng NVIDIA DGX Spark GB10 với Minisforum S1 Max và AMD Strix Halo Geekbench 5
Với những gì thể hiện, CPU trên DGX Spark hiện có thể xem là một trong những mini PC chạy Arm-Ubuntu mạnh mẽ nhất, đặc biệt khi kết hợp với hệ thống kết nối mạng tốc độ cao mà thiết bị được trang bị.
Tiếp theo, chúng ta sẽ nói về một số vấn đề ban đầu (teething challenges) khi sử dụng hệ thống.
Những thách thức ban đầu của NVIDIA GB10
Có một vài thách thức rõ ràng khi làm việc với GB10. Khá bất ngờ là khả năng xuất hình ảnh lại là một trong những điểm gặp vấn đề – điều mà nhiều người thường nghĩ rằng các sản phẩm của NVIDIA sẽ xử lý rất tốt. Tuy nhiên, trải nghiệm với DGX Spark trong trường hợp này có thể nói là khá khó khăn.
Cụ thể, các màn hình LG OLED độ phân giải 1440p mà chúng tôi đang sử dụng khi kết nối qua cổng HDMI sẽ hiển thị hình ảnh bị lỗi và rối loạn nếu hệ điều hành được thiết lập xuất ra ở độ phân giải 1440p. Tương tự, các màn hình ultrawide cũng không thể sử dụng được trong quá trình thử nghiệm.

NVIDIA DGX Spark – truy cập Remote Desktop bằng tính năng chia sẻ màn hình tích hợp của Ubuntu
Cuối cùng, chúng tôi phải sử dụng một màn hình 4K cũ với độ phân giải 3840 × 2160, thiết lập ở tần số quét 60Hz, và khi đó mọi thứ hoạt động bình thường. Đây không phải là giải pháp đẹp hay tối ưu, nhưng ít nhất nó vẫn hoạt động ổn định.

NVIDIA DGX Spark Nvidia Smi
Một vấn đề đáng chú ý khác là chúng tôi đang sử dụng mẫu thử nghiệm ở giai đoạn khá sớm. Vì vậy, đôi khi sau khi cập nhật hệ thống, chúng tôi thấy những thay đổi khá lạ – ví dụ như mức tiêu thụ điện của GPU ở trạng thái nhàn rỗi trong nvidia-smi có thể giảm từ 13W xuống chỉ còn 4W.
Dù vậy, cảm nhận chung của chúng tôi là đây là một hệ thống đang ở giai đoạn đầu, và rất có thể trải nghiệm sẽ được cải thiện dần theo thời gian thông qua các bản cập nhật. Tuy nhiên, cũng phải thừa nhận rằng điều này phần nào đòi hỏi người dùng phải đặt niềm tin vào các bản cập nhật trong tương lai.
Tiếp theo, chúng ta sẽ cùng xem mức tiêu thụ điện năng của hệ thống.
Mức tiêu thụ điện của NVIDIA DGX Spark
Bộ nguồn đi kèm với thiết bị là adapter USB-PD công suất 240W.

Bộ chuyển đổi nguồn NVIDIA DGX SPARK
Trong trạng thái nhàn rỗi (idle), khi chúng tôi đo mức tiêu thụ điện vào tuần trước, hệ thống tiêu thụ khoảng 40–45W. Khi chỉ tải CPU, mức tiêu thụ có thể tăng lên 120–130W. Khi kết hợp thêm GPU và các thành phần khác, tổng công suất có thể đạt gần 200W, nhưng trong quá trình thử nghiệm chúng tôi không thấy hệ thống chạm mức 240W. Một điểm cần lưu ý là các module quang QSFP56 cũng có thể tiêu thụ khá nhiều điện năng.
Ngoài ra, trong nhiều tác vụ AI inference với các mô hình LLM, hệ thống thường chỉ tiêu thụ khoảng 60–90W, trong khi vẫn hoạt động rất êm ái. Dù có quạt tản nhiệt đang chạy, nhưng nếu bạn đứng cách khoảng 1–1,5 mét, gần như rất khó nghe thấy tiếng quạt. Trong các bài test thông thường (không phải stress test), độ ồn của hệ thống không vượt quá 40 dBA.
Hoàng Hà PC – Đơn vị cung cấp Mini PC AI uy tín tại Việt Nam
Trong bối cảnh nhu cầu triển khai AI cục bộ (Local AI) và các hệ thống AI workstation nhỏ gọn ngày càng tăng, Hoàng Hà PC đang trở thành một trong những đơn vị uy tín tại Việt Nam chuyên cung cấp các giải pháp Mini PC AI, AI Workstation và hệ thống tính toán phục vụ AI. Với kinh nghiệm nhiều năm trong lĩnh vực phần cứng máy tính hiệu năng cao, Hoàng Hà PC mang đến các cấu hình được tối ưu cho AI development, machine learning, deep learning, LLM inference và xử lý dữ liệu chuyên sâu.

Siêu máy tính Gigabyte AI TOP ATOM – Mini PC AI dành cho lập trình, sáng tạo và nghiên cứu
Một trong những dòng Mini PC AI tiêu biểu hiện đang được Hoàng Hà PC phân phối là Gigabyte AI TOP ATOM. Đây là hệ thống mini workstation được thiết kế chuyên biệt cho các tác vụ AI, sở hữu hiệu năng mạnh mẽ trong một kích thước nhỏ gọn, phù hợp cho cả developer, doanh nghiệp công nghệ, startup AI hoặc các phòng lab nghiên cứu. Với lợi thế dễ triển khai, tiết kiệm không gian và khả năng xử lý AI hiệu quả, các dòng Mini PC AI như Gigabyte AI TOP ATOM đang trở thành lựa chọn đáng cân nhắc cho nhiều tổ chức muốn xây dựng hạ tầng AI nội bộ.
Kết luận
Sau vài ngày trải nghiệm thực tế, có thể nói NVIDIA DGX Spark vẫn chưa phải là một nền tảng hoàn thiện tuyệt đối, đặc biệt khi sản phẩm vẫn đang ở giai đoạn đầu sau khi ra mắt. Tuy nhiên, những gì thiết bị này mang lại cho thấy tiềm năng rất lớn trong lĩnh vực AI workstation cỡ nhỏ.
Điểm đáng chú ý nhất của DGX Spark nằm ở 128GB bộ nhớ hợp nhất, cho phép chạy các mô hình AI lớn trực tiếp trên hệ thống mà không cần phải phụ thuộc vào hạ tầng cloud. Bên cạnh đó, việc sử dụng GPU kiến trúc NVIDIA Blackwell cùng kết nối mạng RDMA 200GbE thông qua ConnectX-7 giúp hệ thống có thể dễ dàng mở rộng thành cụm máy tính AI (cluster) khi cần thêm tài nguyên xử lý. Đây là hướng tiếp cận hoàn toàn khác so với các hệ thống GPU PCIe truyền thống. Ngoài ra, về mặt CPU, DGX Spark cũng đang là một trong những mini PC sử dụng kiến trúc Arm mạnh mẽ nhất trên thị trường hiện nay, dù mức giá của hệ thống chắc chắn không hề thấp.
Ngay cả khi trong phòng lab đã có nhiều hệ thống GB10, cảm giác chung của đội ngũ thử nghiệm vẫn là muốn sở hữu thêm một chiếc nữa nếu có cơ hội. Không chỉ bởi thiết kế nhỏ gọn và ấn tượng, DGX Spark còn mở ra một hướng tiếp cận mới cho AI cục bộ (local AI). Nếu băng thông bộ nhớ cao hơn nữa thì hệ thống sẽ còn hấp dẫn hơn, nhưng ngay ở thời điểm hiện tại, DGX Spark đã mang lại một khả năng mà trước đây rất khó đạt được với các GPU PCIe thông thường.
Với những gì đang thể hiện, NVIDIA DGX Spark nhiều khả năng sẽ trở thành một sản phẩm có nhu cầu rất cao trong cộng đồng AI developer. Vì vậy trong thời gian tới, việc đặt mua hoặc sở hữu một hệ thống DGX Spark có thể sẽ không hề dễ dàng.