HỆ THỐNG SHOWROOM
SHOWROOM - CẦU GIẤY
SHOWROOM - ĐỐNG ĐA
SHOWROOM - VINH, NGHỆ AN
Hotline Hà Nội
HỖ TRỢ TẠI HÀ NỘI
HOÀNG HÀ PC CẦU GIẤY |
|
0969.123.666 | Mr.Long |
0988.163.666 | Mr.Hưng |
0922.635.999 | Mr.Thụ |
HOÀNG HÀ PC ĐỐNG ĐA |
|
0396.122.999 | Mr.Nghĩa |
0396.138.999 | Mr.Huy |
0396.178.999 | Mr.Duy |
0397.122.122 | Mr.Tùng Anh |
HỖ TRỢ KỸ THUẬT |
|
0976.382.666 | Mr.Dũng |
HỖ TRỢ BẢO HÀNH |
|
19006100 | Bảo hành |
Hotline Miền Trung
HỖ TRỢ TẠI MIỀN TRUNG
KH CÁ NHÂN - DOANH NGHIỆP |
|
0359.072.072 | Mr.Tuấn |
0356.072.072 | Mr.Huy |
HỖ TRỢ KỸ THUẬT |
|
0358.072.072 | Mr.Toản |
HỖ TRỢ BẢO HÀNH |
|
19006100 | Bảo hành |
Hotline Hồ Chí Minh
HỖ TRỢ TẠI HỒ CHÍ MINH
KH CÁ NHÂN - DOANH NGHIỆP |
|
0968.123.666 | Mr.Bình |
0379.260.260 | Mr.Khanh |
HỖ TRỢ KỸ THUẬT |
|
0345.260.260 | Mr.Nhân |
HỖ TRỢ BẢO HÀNH |
|
19006100 | Bảo hành |
Hotline Mua hàng
Chỉ số TFLOPs có lẽ nhiều người dùng so sánh đó là thước đo cho sức mạnh của card đồ họa, thế nhưng liệu chúng có thật sự cần thiết với game thủ không? đó vẫn là câu hỏi mà rất nhiều anh em game thủ chưa biết nó ra sao, vậy bài viết sau đây được dựa theo Engadget đã chỉ ra rằng chỉ số này chưa chắc đã nói lên được sức mạnh chơi game của 1 card đồ họa. hãy cùng Hoàng Hà PC tìm hiểu về vấn đề này xem liệu có đúng không nhé ?
Trong thế giới công nghệ, đặc biệt là các dòng card đồ họa, NVIDIA luôn là cái tên dẫn đầu với những sản phẩm có hiệu năng vượt trội. Dòng NVIDIA RTX 3000 được phát hành đã nhanh chóng thu hút sự chú ý của người dùng nhờ vào sức mạnh và khả năng tối ưu hóa cao. Trong quá khứ, TFLOPs (Tera Floating Point Operations per Second) - chỉ số đo số phép tính dấu phẩy động thực hiện trong một giây - thường được coi là thước đo chính cho sức mạnh của card đồ họa. Tuy nhiên, với các thế hệ GPU mới, đặc biệt là NVIDIA RTX 3000, câu hỏi đặt ra là: Liệu TFLOPs có còn phản ánh chính xác hiệu năng thực tế của các GPU hiện đại?
TFLOPs là viết tắt của Tera Floating Point Operations per Second, một chỉ số biểu thị số phép tính dấu phẩy động GPU có thể xử lý mỗi giây. Nói cách khác, TFLOPs đo lường khả năng tính toán của GPU, thường được sử dụng để đánh giá sức mạnh của card đồ họa. Trong các thế hệ GPU trước đây, TFLOPs là một thước đo khá chính xác, giúp người dùng so sánh hiệu năng giữa các GPU khác nhau và lựa chọn được sản phẩm phù hợp với nhu cầu của mình.
Ví dụ, một GPU có 10 TFLOPs thường được cho là mạnh hơn một GPU có 5 TFLOPs, vì nó có thể thực hiện số lượng phép tính lớn hơn trong cùng một khoảng thời gian. Tuy nhiên, khi các GPU ngày càng trở nên phức tạp và có nhiều yếu tố ảnh hưởng đến hiệu năng hơn, chỉ số TFLOPs bắt đầu mất đi giá trị như một thước đo duy nhất.
Chữ FLOPs có nghĩa là floating-point operations per second, hiểu đơn giản là số lượng phép tính liên quan đến số thập phân mà một con chip có thể tính được trong 1 giây. Tera là nghìn tỉ. Ghép lại nó có nghĩa là “trong một giây, GPU thực hiện được bao nhiêu nghìn tỉ phép tính”.
Trên nền tảng Steam, GPU được dùng phổ biến nhất hiện nay là GTX 1060, nó có sức mạnh là 4,4 TFLOPs, con mạnh hơn là NVIDIA RTX 2080 Ti thì có thể tính được 13,5 TFLOPs, hay như GPU của chiếc Xbox Series X sắp ra mắt có sức mạnh 12 TFLOPs.
Con số này được tính ra bằng cách lấy số nhân đổ bóng (shader) nhân với xung nhịp tối đa của GPU rồi nhân tiếp với số lượng lệnh mà GPU có thể thực hiện trong 1 clock. Đây là một cách tính khá ổn và minh bạch, nhưng khi nói về hiệu năng chơi game thì chưa đủ ý nghĩa.
==> Xem thêm: VGA | Giá Card Màn Hình | Card Đồ Họa giá KM lên tới 3 Triệu
Ví dụ, với GPU AMD RX 580 ra mắt năm 2017, nó có sức mạnh là 6,17 TFLOPs, trong khi hiệu năng thì tương đương với GPU RX 5500 - một dòng GPU giá rẻ mà hãng mới ra mắt năm nay với 5,2 TFLOPs. Như vậy, dù có số TFLOPs thấp hơn nhưng hiệu năng của RX 5500 vẫn đủ tốt nhờ vào sự thay đổi liên quan tới kiến trúc của chip, các tập lệnh, cho đến việc lập trình viên tận dụng tính năng của GPU hiệu quả hơn. Và cứ mỗi đời GPU mới ra mắt thì lại có thêm những cải tiến như thế này.
Ý mình muốn nói ở đây đó là ngay cả với cùng một công ty làm GPU thì những thay đổi về chip, về game sẽ khiến việc so sánh trực tiếp chỉ số TFLOPs giữa các dòng card với nhau trở nên không còn ý nghĩa, đặc biệt là về hiệu năng chơi game. Nó cũng giống như việc chỉ dựa vào mỗi xung nhịp để đánh giá một con CPU vậy. Và việc so sánh số này giữa AMD với NVIDIA cũng sẽ làm sai lệch ý nghĩa.
Hãy nói về dòng card RTX 3000 mới, chúng có cấu hình rất mạnh mẽ. Con rẻ nhất là RTX 3070 với giá $500 cũng đã có đến 5.888 nhân CUDA (là tên riêng của NVIDIA cho các nhân shader), sức mạnh của nó là 20 TFLOPs. Rồi chúng ta có RTX 3090 giá $1500 với 10.496 nhân và sức mạnh 36 TFLOPs. Về lý thuyết, NVIDIA đã tăng số nhân lên 140% và số TFLOPs tăng 160% so với card RTX 2080 Ti, con card mạnh nhất hiện bạn có thể mua được (tính đến tháng 9/2020)
==> Xem thêm: CPU Máy Tính - bộ vi xử lý PC uy tín, giá rẻ số 1 Việt Nam
Không, không phải vậy đâu. Bình tĩnh.
Trước khi đi tiếp, bạn cần biết rằng card đồ họa của NVIDIA được cấu thành từ nhiều streaming multiprocessors (SM). Card RTX 2080 Ti có 68 SM, mỗi SM chứa 64 nhân “FP32” chuyên dành cho việc tính toán số thập phân và 64 nhân “INT32” chuyên dành cho việc tính toán số nguyên (ngoài ra còn một số linh kiện khác nữa nhưng chúng ta không nói tới). Thế hệ kiến trúc của cụm SM trong RTX 2080 được NVIDIA đặt tên là “Turing”.
Một cải tiến lớn của Turing đó là nó có khả năng tính toán số thập phân và số nguyên cùng lúc. Đây là thay đổi rất quan trọng so với thế hệ trước đó là Pascal (ở GPU đời Pascal, các nhân phải đổi giữa việc tính toán số thực và số thập phân chứ không chạy được đồng thời).
Dòng RTX 3000 mới dùng kiến trúc Ampere, tức là kế nhiệm cho Turing. Ampere giữ lại 64 nhân FP32 như trước, nhưng 64 nhân còn lại được dùng cho cả “FP32 + INT32”. Nói cách khác, một nửa số nhân của GPU Ampare được dùng chỉ để tính toán thập phân mà thôi, còn một nửa còn lại thì sẽ thực hiện các phép tính thập phân hoặc phép tính số nguyên tùy lúc.
Với thay đổi này, NVIDIA giờ đây đếm 1 SM có tới 128 nhân FP32, không còn là 64 nhân như trước. Trong con card RTX 3070, 5.888 nhân CUDA phải được mô tả chính xác là: 2944 nhân CUDA, và 2955 nhân có thể là CUDA tùy trường hợp.
Khi mà game ngày càng phát triển hơn, các nhà phát triển game càng lúc càng dùng nhiều phép tính số nguyên hơn. Năm 2018, NVIDIA từng nói rằng các phép tính số nguyên chiếm khoảng 1/4 số lượng các phép tính mà game thực hiện bằng GPU. Đến nay con số đó có thể đã tăng lên cao hơn rồi.
Vấn đề của kiến trúc Turing cũ đó là một số nhân có thể bị rảnh rỗi. Ví dụ, nếu game dùng 25% phép tính là số nguyên, thì khoảng 25% số nhân của GPU không được tận dụng để tính vì không phải nhiệm vụ của chúng. Thế nên Ampere khắc phục vấn đề này bằng cách tạo ra các nhân có thể chuyển đổi linh hoạt tùy theo nhu cầu của game đang cần gì, nên theo lý thuyết thì Ampere chạy hiệu quả hơn.
==> Xem thêm: SSD, Bán Ổ Cứng SSD Chính Hãng Giá Rẻ, Load Dữ Liệu Siêu Nhanh
Ở sự kiện ra mắt RTX 3000, CEO Jensen Huang nói rằng con card RTX 3070 mạnh hơn so với RTX 2080 Ti. Giả sử lấy 25% phép toán là tính bằng số nguyên thì 1.472 nhân sẽ dùng cho INT32, và 4.416 nhân sẽ dùng cho FP32. Cộng với một số thứ khác nữa thì RTX 3070 có thể mạnh hơn 10% so với 2080 Ti (giả sử phần thay đổi về vRAM từ 11GB của 2080 Ti xuống 8GB của 3070 không phải là vấn đề). Trong một trường hợp không có thật khi công việc cần tính toán chỉ bằng số nguyên thì 3070 sẽ mạnh gần như là 2080 luôn. Đây là một cải tiến rất đáng kể đấy.
Rõ ràng nếu chúng ta nói về chỉ số này ở thời điểm đầu 2000 thì có thể sẽ đúng nhưng sự thay đổi của công nghệ cũng như biến chuyển liên tục của các dòng sản phẩm khiến cho TFLOPs không còn có thể biểu đạt chỉ sức mạnh card đồ họa nữa, nên bạn cũng cần xem thêm cả những yếu tố khác khi chọn mua card đồ họa nhé.
Trong các dòng GPU hiện đại, NVIDIA không chỉ đơn thuần tăng số TFLOPs để nâng cao hiệu năng. Thay vào đó, họ tập trung vào các cải tiến kiến trúc để tối ưu hóa khả năng xử lý của GPU, từ đó cải thiện hiệu suất thực tế. Với kiến trúc Ampere, NVIDIA đã bổ sung khả năng chia sẻ và chuyển đổi các phép tính giữa các nhân FP32 và INT32, cho phép GPU thực hiện nhiều phép tính đồng thời mà không cần phải nâng TFLOPs.
Ví dụ, trong một số trường hợp, chỉ một nửa số nhân CUDA trong kiến trúc Ampere được sử dụng cho các phép tính FP32, trong khi phần còn lại thực hiện các tác vụ khác. Nhờ vậy, hiệu suất tổng thể của GPU được cải thiện mà không cần tăng số TFLOPs. Điều này cho thấy TFLOPs không còn là yếu tố duy nhất quyết định hiệu năng của GPU mà còn phụ thuộc vào cách thiết kế và tối ưu hóa kiến trúc bên trong.
Ngoài TFLOPs, còn nhiều yếu tố khác đóng vai trò quan trọng trong việc quyết định sức mạnh thực tế của một GPU. Một số yếu tố này bao gồm:
Số lượng và hiệu quả của nhân CUDA: Các nhân CUDA là "trái tim" của GPU, đảm nhận việc xử lý các phép tính dấu phẩy động. Số lượng nhân CUDA nhiều hơn không đồng nghĩa với hiệu năng tốt hơn, nhưng cách tối ưu hóa các nhân này sẽ ảnh hưởng lớn đến hiệu suất.
Xử lý song song và băng thông bộ nhớ: Khả năng xử lý song song và tốc độ truy xuất dữ liệu nhanh chóng là yếu tố quan trọng, nhất là trong các tựa game và phần mềm đồ họa. Băng thông bộ nhớ cao hơn giúp tăng tốc độ xử lý và truyền tải dữ liệu giữa GPU và các bộ phận khác trong hệ thống.
Các công nghệ hỗ trợ khác: NVIDIA đã phát triển nhiều công nghệ đi kèm với GPU, như DLSS (Deep Learning Super Sampling) giúp nâng cao chất lượng hình ảnh mà không ảnh hưởng nhiều đến hiệu năng, và ray tracing giúp mô phỏng ánh sáng chân thực hơn trong game.
Quản lý điện năng và tản nhiệt: Kiến trúc và thiết kế tản nhiệt của card đồ họa cũng ảnh hưởng đến hiệu suất thực tế. GPU càng mạnh mẽ thì nhiệt độ và mức tiêu thụ điện năng càng lớn, và quản lý tốt yếu tố này giúp duy trì hiệu năng lâu dài.
TFLOPs từng là thước đo chính để so sánh hiệu năng của các GPU, nhưng với sự phát triển của công nghệ, đặc biệt là với dòng NVIDIA RTX 3000, chỉ số này không còn phản ánh đúng sức mạnh thực tế của card đồ họa. Các yếu tố như kiến trúc, công nghệ tối ưu hóa và các tính năng bổ trợ đã trở thành những yếu tố quan trọng hơn khi đánh giá sức mạnh của một GPU.
Đối với người dùng, việc chỉ dựa vào TFLOPs để lựa chọn card đồ họa có thể dẫn đến những quyết định không chính xác. Thay vào đó, nên xem xét tổng thể từ kiến trúc, số lượng nhân CUDA, băng thông bộ nhớ, cho đến các công nghệ hỗ trợ như DLSS và ray tracing. Điều này sẽ giúp người dùng chọn được sản phẩm phù hợp với nhu cầu thực tế, đặc biệt là trong bối cảnh GPU ngày càng được tối ưu hóa không chỉ dựa trên chỉ số TFLOPs.
Tôi là Mai Văn Học - Reviewer chuyên về công nghệ tại Hoanghapc.vn. Tôi có hơn 7 năm kinh nghiệm làm việc trong lĩnh vực máy tính, laptop. Với kiến thức sâu rộng và kinh nghiệm phong phú về công nghệ, tôi luôn mang đến cho người dùng những đánh giá chi tiết, toàn diện về tính năng, hiệu suất và giá trị của các sản phẩm máy tính và công nghệ.
Bài viết mới nhất
Bài viết được xem nhiều
Sản phẩm khuyến mãi