Intel Lunar Lake đánh dấu một trong những bước thay đổi lớn nhất của Intel trong nhiều năm trở lại đây ở mảng vi xử lý dành cho laptop và thiết bị di động. Không đơn thuần là bản nâng cấp tiếp theo sau Meteor Lake, Lunar Lake thể hiện rõ định hướng “PC AI” với hàng loạt thay đổi mang tính chiến lược: từ kiến trúc CPU mới, GPU Xe2, NPU thế hệ 4 cho đến cách Intel tái thiết kế toàn bộ SoC nhằm tối ưu hiệu năng trên mỗi watt và trải nghiệm AI ngay trên thiết bị. Đây cũng là những yếu tố đang được Hoàng Hà PC theo dõi sát sao để đánh giá tính thực tiễn khi triển khai trên các mẫu laptop và PC AI trong thời gian tới.
Tại sự kiện Hot Chips, Intel đã công bố và phân tích sâu những thay đổi kiến trúc của Lunar Lake, qua đó làm rõ bước tiến vượt bậc so với Meteor Lake về hiệu năng, hiệu suất năng lượng và khả năng xử lý AI. Dưới góc nhìn phân tích từ Hoàng Hà PC, các thay đổi như bộ nhớ tích hợp trên chip, kiến trúc Lion Cove P-core và Skymont E-core hoàn toàn mới, cùng những tối ưu sâu về quản lý điện năng và độ trễ hệ thống cho thấy Lunar Lake đang được Intel định vị như nền tảng cốt lõi cho thế hệ laptop AI mỏng nhẹ nhưng vẫn đảm bảo hiệu năng cao và thời lượng pin dài.
Để hiểu rõ hơn định hướng này, hãy bắt đầu từ những thay đổi nền tảng trong thiết kế SoC và chiến lược tích hợp của Intel trên Lunar Lake.
Thiết kế SoC và chiến lược tích hợp của Intel
Intel Lunar Lake đã được ra mắt, với mục tiêu mang lại hiệu năng cao hơn cũng như hiệu năng trên mỗi watt vượt trội so với Meteor Lake.

Intel đang sử dụng các tiến trình sản xuất khác nhau cho các phân vùng khác nhau, điều này đang trở nên phổ biến hơn. Một điểm nổi bật lớn trong thế hệ này là việc tích hợp bộ nhớ trên chip. Điều này tương tự như thiết kế của các công ty như Apple, NVIDIA và một số bộ xử lý HPC cao cấp, nơi bộ nhớ được tích hợp thay vì ở dạng LPCAMM, SODIMM hoặc DIMM.

Intel hiện chỉ hỗ trợ tối đa 32GB bộ nhớ. Một trong những thách thức lớn là Intel phải mua bộ nhớ từ nhà cung cấp bên ngoài, điều này làm giảm biên lợi nhuận của con chip. Nếu có phiên bản 64GB, biên lợi nhuận sẽ còn thấp hơn nữa do chi phí DRAM cao nhưng lợi nhuận mang lại không tương xứng.
Trong khi đó, Apple lại là một câu chuyện khác. Hãng này tính giá rất cao cho việc nâng cấp bộ nhớ, nhờ lợi thế tích hợp dọc (vertical integration) trong toàn bộ hệ sinh thái phần cứng, nên vẫn duy trì được biên lợi nhuận cực tốt. Đây là một ví dụ khá thú vị cho thấy cạnh tranh và yếu tố tài chính trong ngành có thể ảnh hưởng trực tiếp đến thiết kế và hiệu năng sản phẩm.
Kiến trúc CPU mới: Lion Cove P-core & Skymont E-core

Tiếp theo, Intel đang tiến sâu hơn vào cấu trúc SoC, bao gồm thiết kế chiplet và compute tile. Tại đây, chúng ta có thể thấy 4 nhân P-core với 3MB bộ nhớ đệm, cùng với IPU, GPU, hệ thống bộ nhớ và nhiều thành phần khác được tích hợp chung trên một khuôn chip duy nhất.

Lunar Lake được trang bị memory side cache, tức một bộ nhớ đệm vật lý dung lượng 8MB, với mục tiêu giảm lưu lượng truy cập trực tiếp tới DRAM, từ đó cải thiện hiệu năng và hiệu suất năng lượng.

Cụm E-core giờ đây sở hữu 4MB bộ nhớ đệm L2, cùng hệ thống cấp nguồn riêng và các thành phần quản lý độc lập. Cần nhấn mạnh rằng E-core hiện nay không còn là các nhân Atom “chậm chạp” như trước – hiệu năng của chúng đã được cải thiện đáng kể. Ở Lunar Lake, Intel đã nâng số lượng E-core lên 4 nhân, thay vì chỉ 2 nhân như trên Meteor Lake. Memory side cache cũng được tận dụng tại đây để tiếp tục đẩy cao hiệu năng.

Một điểm then chốt khác của Lunar Lake nằm ở thiết kế cấp nguồn và quản lý điện năng. SoC này được trang bị 4 PMIC (chip quản lý nguồn), được cho là giống nhau về thiết kế nhưng được nhân bản và điều khiển độc lập, giúp tối ưu khả năng phân phối và kiểm soát điện năng cho từng khối xử lý.

Các PMIC này giúp tối ưu khả năng cấp nguồn và hiệu suất năng lượng cho toàn bộ SoC. Cụm E-core được thiết kế để gánh phần lớn khối lượng công việc hiện nay, bởi hiệu năng của các nhân này đã được cải thiện rõ rệt. Intel cũng cho biết các trạng thái ngủ (sleep state) nay có thể chuyển vào và thoát ra nhanh hơn rất nhiều, góp phần nâng cao trải nghiệm sử dụng và tiết kiệm điện.

Bên cạnh đó, Intel vẫn duy trì các công nghệ quen thuộc như Thread Director cùng cơ chế phân loại tác vụ, nhằm đảm bảo mỗi workload được phân bổ đúng vào loại nhân xử lý phù hợp nhất.
Đáng chú ý nhất là Lion Cove P-Core – một thay đổi mang tính bước ngoặt. Đây được xem là một trong những, thậm chí là thay đổi lớn nhất của Intel trong suốt một thời gian dài về mặt kiến trúc nhân hiệu năng cao.

Intel cho biết cơ sở dữ liệu thiết kế mới đã được hiện đại hóa, nhằm hỗ trợ tốt hơn cho việc chuyển đổi giữa các tiến trình sản xuất khác nhau, cũng như thích ứng linh hoạt với nhiều thiết kế và mức tiêu thụ điện (power envelope) khác nhau.
Dưới đây là những điểm nổi bật ở cấp độ tổng quan của kiến trúc Lion Cove. Theo Intel, hãng đã thực hiện hàng loạt tối ưu về hiệu năng và hiệu suất năng lượng. Tuy nhiên, thay đổi lớn nhất có lẽ nằm ở việc SMT (Hyper-Threading) đã bị loại bỏ trên thế hệ P-core mới này.

Intel cho biết nhân xử lý mới mang lại mức tăng khoảng 14% hiệu năng IPC, một yếu tố rất quan trọng trong bối cảnh xung nhịp có thể thay đổi tùy theo cấu hình và mức điện năng. Đồng thời, Intel cũng khẳng định thế hệ này đạt được mức cải thiện hiệu năng trên mỗi watt ở mức hai chữ số so với thế hệ trước.

Intel đang tập trung tối ưu rất mạnh ở dải công suất thấp. Theo hãng, việc loại bỏ Hyper-Threading đã giúp kiến trúc mới hoạt động hiệu quả hơn rõ rệt khi chạy ở mức điện năng thấp.
Bên cạnh đó là sự xuất hiện của Skymont E-core, được thiết kế để đảm nhiệm nhiều workload hơn, tiếp tục mở rộng vai trò của các nhân tiết kiệm điện trong tổng thể hiệu năng của Lunar Lake.

Dưới đây là những điểm nổi bật của Skymont:

Với mức xử lý công suất thấp (low-power island), mức chênh lệch giữa Lunar Lake và Meteor Lake là rất lớn. Intel cho biết sự cải thiện này không chỉ đến từ vi kiến trúc, mà còn nhờ vào bộ nhớ đệm (cache), độ trễ toàn hệ thống (system latency) và nhiều yếu tố khác. Nói cách khác, đây không đơn thuần chỉ là mức tăng hiệu năng từ vi kiến trúc.

Tiếp theo là biểu đồ hiệu năng trên mỗi watt (performance per watt) hoặc hiệu năng theo mức tiêu thụ điện của cụm E-core mới trong low-power island. Một điểm đáng chú ý là đường công suất của Lunar Lake kéo dài hơn so với Meteor Lake, cho thấy khả năng mở rộng hiệu năng tốt hơn trong cùng dải điện năng.

Cuối cùng là so sánh độ trễ (latency) giữa các thành phần xử lý của Lunar Lake và Meteor Lake, giúp làm rõ những cải tiến về khả năng phản hồi và tối ưu hệ thống trên thế hệ kiến trúc mới.

Dưới đây là so sánh độ trễ giữa các nhân (core-to-core latency). Mức độ trễ này thậm chí còn tốt hơn những gì chúng ta từng thấy trên một số thế hệ CPU máy chủ gần đây, cho thấy Intel đã tối ưu rất mạnh về mặt kiến trúc và liên kết nội bộ.

Tiếp theo là hai đường cong hiệu năng tương ứng với E-core và P-core trên Lunar Lake, thể hiện cách Intel phân bổ và tối ưu hiệu năng theo từng loại nhân xử lý.

Đây là một ví dụ thực tế với ứng dụng Microsoft Teams. Trên Meteor Lake, Teams cần phải chạy trên P-core để đảm bảo trải nghiệm mượt mà.

Trong khi đó, với Lunar Lake, Intel cho rằng toàn bộ workload của Teams có thể được xử lý chỉ bằng E-core, nhờ hiệu năng E-core đã được nâng lên đáng kể.

GPU Xe2 – Kiến trúc đồ họa thế hệ mới cho PC AI
Intel cũng xác nhận kiến trúc GPU mới Xe2 sẽ được triển khai cả trên iGPU trong SoC cho người dùng cuối (client SoC) lẫn các thiết kế GPU rời (dGPU).

Trung tâm của các nhân Xe2 là vector engine, với thay đổi lớn khi chuyển từ hai cụm SIMD8 sang một cấu trúc SIMD16 duy nhất, giúp nâng cao hiệu quả xử lý song song.

Theo Intel, GPU Xe2 mới có thể mang lại hiệu năng chơi game cao hơn tới 1,5 lần ở cùng mức điện năng so với thế hệ trước.

Cuối cùng là các đường cong hiệu suất – hiệu năng của Intel. Điểm thay đổi quan trọng nằm ở khả năng mở rộng từ dải công suất thấp lên cao. Trước đây, Meteor Lake-U và Meteor Lake-H phải sử dụng các engine GPU khác nhau, còn với Xe2, một kiến trúc duy nhất có thể bao phủ toàn bộ phổ hiệu năng, từ tiết kiệm điện đến hiệu suất cao.

AI on-device: NPU 4, Media Engine và Stable Diffusion
Intel đã trình diễn bản demo Stable Diffusion so sánh trực tiếp Lunar Lake với Meteor Lake, cho thấy những cải thiện rõ rệt về khả năng xử lý AI ngay trên thiết bị.

Ở mảng xử lý media, chuẩn H.266 (VVC) đã được bổ sung.

Intel cho biết mức tiêu thụ điện khi giải mã VVC trên media engine mới thấp hơn đáng kể, giúp tối ưu hiệu năng và thời lượng pin.

NPU tiếp tục là tâm điểm ở thế hệ này. Trên Lunar Lake, NPU được mở rộng cả về quy mô lẫn xung nhịp hoạt động, nhằm đáp ứng tốt hơn các tác vụ AI ngày càng phổ biến.

Những điểm chính của Intel NPU 4 bao gồm việc nâng số lượng neural compute engine từ 2 lên 6. Theo Intel, riêng NPU đã đạt hiệu năng lên tới 48 TOPS.

Intel cũng công bố hiệu năng thực tế của NPU mới, đồng thời lưu ý rằng NPU 4 được thiết kế để có thể tiêu thụ nhiều điện năng hơn ở mức tải tối đa, nhằm đổi lấy hiệu suất cao hơn.

Nền tảng kết nối và hoàn thiện hệ sinh thái Lunar Lake
Về kết nối, nền tảng mới hỗ trợ Wi-Fi 7 cùng nhiều nâng cấp khác.

Cuối cùng là slide tổng kết cho toàn bộ nền tảng Lunar Lake, cho thấy đây thực sự là một bước thay đổi rất lớn trong chiến lược và thiết kế của Intel cho thế hệ PC AI tiếp theo.

Tổng kết - Góc nhìn Hoàng Hà PC
Thật sự rất đáng mong đợi khi thấy Intel đã đi xa đến mức nào với Lunar Lake so với Meteor Lake. Đây rõ ràng là một bước chuyển mình cực lớn về mặt kiến trúc, chứ không chỉ là một bản nâng cấp thông thường. Trong thời gian tới, khi các mẫu laptop và PC AI trang bị Lunar Lake chính thức xuất hiện, Hoàng Hà PC sẽ liên tục cập nhật, đánh giá và mang đến những cấu hình phù hợp nhất cho người dùng quan tâm đến hiệu năng, AI và trải nghiệm di động thế hệ mới.