Hotline Hà Nội

HỖ TRỢ TẠI HÀ NỘI

HOÀNG HÀ PC CẦU GIẤY

0969.123.666 Mr.Long
0988.163.666 Mr.Hưng
0922.635.999 Mr.Thụ

HOÀNG HÀ PC ĐỐNG ĐA

0396.122.999 Mr.Nghĩa
0396.138.999 Mr.Huy
0396.178.999 Mr.Duy
0397.122.122 Mr.Tùng Anh

HỖ TRỢ KỸ THUẬT

0976.382.666 Mr.Dũng

HỖ TRỢ BẢO HÀNH

19006100 Bảo hành

Hotline Miền Trung

HỖ TRỢ TẠI MIỀN TRUNG

KH CÁ NHÂN - DOANH NGHIỆP

0359.072.072 Mr.Tuấn
0356.072.072 Mr.Huy

HỖ TRỢ KỸ THUẬT

0358.072.072 Mr.Toản

HỖ TRỢ BẢO HÀNH

19006100 Bảo hành

Hotline Hồ Chí Minh

HỖ TRỢ TẠI HỒ CHÍ MINH

KH CÁ NHÂN - DOANH NGHIỆP

0968.123.666 Mr.Bình
0379.260.260 Mr.Khanh

HỖ TRỢ KỸ THUẬT

0345.260.260 Mr.Nhân

HỖ TRỢ BẢO HÀNH

19006100 Bảo hành
Trang tin công nghệ Trang khuyến mãi

Hotline Mua hàng

1 Hỗ Trợ Kỹ Thuật - Bảo Hành: 19006100
2 Hotline Hà Nội (Mr. Long): 0969.123.666
3 Hotline Hà Nội (Mr. Nghĩa): 0396.122.999
4 Hotline Hà Nội (Mr. Huy): 0396.138.999
5 Hotline Hà Nội (Mr. Hưng): 0988.163.666
6 Hotline Hà Nội (Mr. Duy): 0396.178.999
7 Hotline Hà Nội (Mr. Thụ): 0922.635.999
8 Hotline Hồ Chí Minh (Mr. Bình): 0968.123.666
9 Hotline Hồ Chí Minh (Mr. Khanh): 0379.260.260
0

Danh mục sản phẩm

Xây Dựng Cấu Hình
Máy Khỏe - Máy Đẹp Tin Công Nghệ Review Sản Phẩm Benchmarks Blog Thủ Thuật Tin Tức Game Wiki Tin Khuyến Mãi

Cluster là gì? Tìm hiểu về Cluster trong công nghệ máy tính

Đăng trong Kiến Thức Máy Tính

Cluster là một hệ thống bao gồm nhiều máy tính độc lập hoạt động cùng nhau như một hệ thống duy nhất. Cùng với khả năng mở rộng dễ dàng, Cluster giúp tăng cường hiệu suất tính toán, chịu lỗi tự động và tiết kiệm chi phí. Cluster là công nghệ quan trọng trong lĩnh vực công nghệ máy tính, đặc biệt được ứng dụng rộng rãi trong xử lý dữ liệu lớn và các ứng dụng phân tán.

1. Cluster là gì?

Clustering là một cấu trúc được thiết kế để tăng cường khả năng sẵn sàng và độ tin cậy của các hệ thống mạng máy tính. Nó bao gồm việc sử dụng nhiều máy chủ, liên kết chúng lại với nhau thành một nhóm, để tạo ra một hệ thống có khả năng chịu lỗi, nâng cao độ sẵn sàng của hệ thống mạng.

Cluster là một hệ thống gồm nhiều máy chủ được kết nối theo kiểu song song hoặc phân tán, hoạt động như một đơn vị đơn nhất. Khi một máy chủ trong cluster gặp sự cố, bảo trì hoặc nâng cấp, công việc của nó sẽ được chuyển tự động sang máy chủ khác trong cùng cluster, đảm bảo rằng hoạt động của hệ thống không bị gián đoạn. Quá trình chuyển giao này được gọi là "fail-over", và việc khôi phục lại tài nguyên của máy chủ trong cluster sau sự cố được gọi là "fail-back".

Cluster là gì? Cluster hoạt động theo cơ chế nào?

Cluster là gì? Cluster hoạt động theo cơ chế nào?

Khả năng mở rộng

Hệ thống phân cụm cần có khả năng mở rộng để có thể thêm hoặc giảm số lượng máy tính trong cụm một cách linh hoạt. Điều này giúp đáp ứng nhu cầu tăng cường sức mạnh tính toán mà không ảnh hưởng đến hoạt động của hệ thống.

Đồng bộ hóa dữ liệu

Các máy tính trong hệ thống phân cụm cần được đồng bộ hóa dữ liệu một cách hiệu quả. Sự đồng bộ hóa này đảm bảo rằng tất cả các nút trong cụm có cùng một bản sao dữ liệu, giúp đảm bảo tính nhất quán và độ tin cậy của hệ thống.

Khả năng chia sẻ tài nguyên

Hệ thống phân cụm cho phép các máy tính trong cụm chia sẻ tài nguyên như bộ nhớ, ổ cứng và thiết bị ngoại vi. Điều này giúp tối ưu hóa sử dụng tài nguyên và tăng cường khả năng xử lý dữ liệu của hệ thống.

Tính sẵn sàng cao

Hệ thống phân cụm cần đảm bảo tính sẵn sàng cao, tức là hệ thống vẫn hoạt động và đáp ứng yêu cầu khi có một hoặc nhiều máy tính trong cụm gặp sự cố. Để đảm bảo tính sẵn sàng cao, các máy tính trong cụm có thể được cấu hình theo cơ chế dự phòng hoặc sao lưu dữ liệu.

Hiệu suất cao

Một trong những yếu tố quan trọng của hệ thống phân cụm là khả năng xử lý dữ liệu với hiệu suất cao. Điều này đảm bảo rằng hệ thống có thể xử lý các tác vụ tính toán phức tạp và lớn một cách nhanh chóng và hiệu quả.

Bảo mật

Hệ thống phân cụm cần đảm bảo bảo mật thông tin trên tất cả các máy tính trong cụm. Các biện pháp bảo mật như mã hóa dữ liệu và kiểm soát quyền truy cập phải được triển khai để bảo vệ dữ liệu khỏi việc truy cập trái phép.

2. Nguyên tắc hoạt động và lưu ý của Cluster

Trong một hệ thống Cluster, mỗi máy chủ hay còn gọi là node được cấu hình hoạt động ở chế độ chủ động hoặc bị động. Khi ở chế độ chủ động, mọi yêu cầu đều được xử lý một cách tự động. Trong khi đó, khi node hoạt động ở chế độ bị động, nó sẽ ở trạng thái chờ, có nghĩa là node này sẽ sẵn sàng nhảy vào hoạt động để thay thế cho bất kỳ node nào khác trong hệ thống nếu như gặp sự cố hỏng hóc hoặc lỗi.

Nguyên tắc hoạt động và lưu ý của Cluster

Nguyên tắc hoạt động và lưu ý của Cluster

Lưu ý khi sử dụng hệ thống Cluster:

- Cần chú ý hiệu quả hoạt động của những cụm máy tính phụ thuộc rất nhiều vào sự tương thích giữa các ứng dụng, dịch vụ, phần cứng và phần mềm

- Không thể vận hành hệ thống Cluster hay NLB khi giữa các server sử dụng những hệ điều hành khác nhau dù chúng có hỗ trợ nhau hay không

- Những lỗi mà Cluster không thể khắc phục đó là virus xâm nhập, lỗi phần mềm hoặc lỗi của người sử dụng

- Để tránh mất dữ liệu do lỗi tác động cần xây dựng hệ thống bảo vệ chắc chắn cũng như có kế hoạch backup khôi phục dữ liệu

3. Yêu cầu khi thiết kế và lắp đặt các Cluster

Khi lắp đặt một cluster, có một số yêu cầu quan trọng như sau:

- Yêu cầu về khả năng hoạt động liên tục (High availability): Cần đảm bảo rằng tài nguyên mạng luôn ở trạng thái sẵn sàng tối đa để phục vụ người dùng cuối và hạn chế tối thiểu thời gian ngừng hoạt động không mong muốn của hệ thống.

Hệ thống cluster đảm bảo tính sẵn sàng cao

Hệ thống cluster đảm bảo tính sẵn sàng cao của các tài nguyên mạng

- Yêu cầu về độ tin cậy (Reliability): Độ tin cậy cao của cluster được định nghĩa là khả năng giảm thiểu sự cố và tăng cường khả năng chịu lỗi của hệ thống.

Cluster có khả năng đảm bảo độ tin cậy cao

Cluster có khả năng đảm bảo độ tin cậy cao luôn có Node 2 backup cho Note 1 nếu cần thiết

- Yêu cầu về khả năng mở rộng (Scalability): Hệ thống cần phải linh hoạt để dễ dàng nâng cấp hoặc mở rộng trong tương lai, bao gồm việc thêm thiết bị, máy tính vào hệ thống để cải thiện chất lượng dịch vụ, cũng như việc mở rộng số lượng người dùng, ứng dụng, dịch vụ và các tài nguyên mạng khác.

Ba yêu cầu này thường được gọi là RAS (Reliability-Availability-Scalability) và những hệ thống đáp ứng được ba yêu cầu này được xem là hệ thống RAS, không nên nhầm lẫn với Remote Access Service, là dịch vụ truy cập từ xa.

4. Cơ chế hoạt động của Cluster

Trong một cluster, mỗi máy chủ được gọi là một node (cluster node) và có thể hoạt động theo chế độ chủ động (active) hoặc thụ động (passive). Node chủ động sẽ xử lý các yêu cầu một cách chủ động, trong khi node thụ động sẽ ở trạng thái dự phòng, sẵn sàng để thay thế cho bất kỳ node nào gặp sự cố.

Cluster bao gồm các máy chủ gọi là node

Cluster bao gồm các máy chủ gọi là node, các node liên kết với nhau thành Network Interconnect

- Một cluster có thể bao gồm cả node chủ động và node thụ động. Việc cấu hình node nào là chủ động và node nào là thụ động có vai trò quan trọng. Xem xét các trường hợp sau:

- Nếu một node chủ động gặp sự cố và có một node thụ động sẵn sàng, các ứng dụng và dịch vụ từ node hỏng sẽ được chuyển nhanh chóng sang node thụ động. Node thụ động này, không chạy ứng dụng hay dịch vụ nào trước đó, sẽ tiếp quản toàn bộ công việc từ node hỏng mà không ảnh hưởng đến dịch vụ cung cấp cho người dùng (giả định rằng tất cả các máy chủ trong cluster có cấu hình phần cứng tương tự).

- Nếu tất cả các máy chủ trong cluster đều chủ động và một trong số chúng gặp sự cố, các ứng dụng và dịch vụ từ máy chủ hỏng sẽ phải chuyển sang một máy chủ khác cũng hoạt động ở chế độ chủ động. Máy chủ này đã đảm nhận các ứng dụng và dịch vụ khác, vì vậy khi tiếp nhận thêm công việc từ máy chủ hỏng, nó cần có cấu hình đủ mạnh để gánh thêm khối lượng công việc đó.

Trong một cấu trúc Cluster với mỗi node chủ động được hỗ trợ bởi một node thụ động, các máy chủ cần được cấu hình để khi xử lý công việc trung bình, chúng chỉ sử dụng khoảng 50% sức mạnh CPU và dung lượng bộ nhớ.

Đối với một cấu trúc Cluster có số lượng node chủ động cao hơn node thụ động, máy chủ cần được trang bị tài nguyên CPU và bộ nhớ mạnh hơn để có khả năng xử lý công việc dư thừa khi có node nào đó gặp sự cố.

Các node trong một cluster thường thuộc cùng một vùng mạng (domain) và có thể được thiết lập là máy điều khiển vùng (domain controllers) hoặc máy chủ thành viên. Trong một Cluster nhiều node, lý tưởng nhất là có ít nhất hai node hoạt động như máy điều khiển vùng, đồng thời đảm nhận việc failover cho các dịch vụ quan trọng của vùng. Nếu không có cấu hình này, khả năng sẵn sàng của các tài nguyên trên cluster sẽ phụ thuộc vào độ tin cậy của máy điều khiển vùng.

Chính nhờ những ưu điểm nổi bật này, công nghệ Cluster đã được triển khai rộng rãi trong các máy chủ, góp phần vào việc quản trị dữ liệu một cách tự động, an toàn và dễ dàng khôi phục khi có sự cố xảy ra.

5. Các thuật ngữ trong hệ thống Server Cluster

Failover

Failover là quá trình Failover có khả năng xảy ra 1 cách tự động. Khi 1 node trong cluster bị hỏng, những resource group sẽ được chuyển đến 1 hay nhiều node trong cluster mà còn hoạt động được. Quá trình tự động failover cũng giống như lập kế hoạch cho việc tái chỉ định quyền sở hữu những resource.

Node

Node là 1 server thuộc 1 cluster nào đó mà những ứng dụng và Cluster service được thiết lập

Cluster

Là 1 hệ thống song song đồng thời được phân phối bởi 1 nhóm những service dành riêng cho mục đích chạy những ứng dụng đặc biệt nào đó và kết nối với nhau để cung cấp khả năng chịu lỗi và load balance. Ngoài ra, cluster sử dụng để cung cấp những tính năng luôn sẵn sàng cho việc truy cập của người dùng. 

Failback

Khi một node trở lại phục vụ, Cluster trả lại quyền sở hữu tài nguyên cho nó và nó sẵn sàng để thực hiện yêu cầu

Quorum Resource

Trong mỗi Cluster, "Quorum resource" chịu trách nhiệm lưu trữ và bảo toàn thông tin cấu hình quan trọng cần thiết cho việc khôi phục các Resource của Cluster. Các Resource trong Cluster bao gồm cả phần cứng vật lý như ổ đĩa, card mạng, cũng như các thành phần logic như địa chỉ IP, ứng dụng, và cơ sở dữ liệu của chúng. Mỗi node trong Cluster được cấp quyền quản lý các resource cục bộ của nó.

Bên cạnh đó, Cluster cũng sở hữu các resource chung, bao gồm thiết bị lưu trữ dùng chung và card mạng riêng tư. Tất cả các node trong Cluster đều có khả năng truy cập vào những resource chung này. Một trong những resource chung quan trọng là "Quorum resource" - một ổ đĩa vật lý nằm trong loạt ổ đĩa chung của Cluster, giữ vai trò thiết yếu trong hoạt động của Cluster. Quorum resource này cần được phân bổ đặc biệt cho các hoạt động của node, như việc tạo một Cluster mới hay thêm node vào Cluster.

Resource Group

Resource group là một tập hợp logic của các resource trong một Cluster. Một resource group tiêu biểu được tạo ra bởi các resource liên kết logic với nhau như là các ứng dụng và các thiết bị ngoại vi và dữ liệu kết hợp với các ứng dụng đó. Resource group cũng có thể chứa đựng các thực thể của cluster và chỉ được liên kết khi cần như là các server ảo và địa chỉ IP.

6. Các thành phần của Cluster Service

Trong cấu trúc của Server Cluster, Dịch vụ Cluster (Cluster Service) hoạt động trên mỗi node và chịu trách nhiệm điều hành toàn bộ hoạt động của hệ thống. Dịch vụ này bao gồm nhiều thành phần phần mềm tương tác lẫn nhau, thực hiện các công việc như theo dõi, bảo đảm sự ổn định và quản lý việc di chuyển tài nguyên giữa các node.

Bao gồm nhiều thành phần phần mềm tương tác lẫn nhau

Bao gồm nhiều thành phần phần mềm tương tác lẫn nhau

Backup/Restore Manager

Cluster service đưa ra 1 API sử dụng để backup những cơ sở dữ liệu cluster, BackupClusterDatabase. Đầu tiên, BackupClusterDatabase tương tác với Failover manager, tiếp theo đẩy yêu cầu đến node có quorum resource. Database manager trên node sẽ được yêu cầu và sau đó tạo 1 bản backup cho quorum log file và những file checkpoint.

Resource Monitor

Được phát triển để cung cấp 1 interface giao tiếp giữa resource DLLs và Cluster service. Trong trường hợp cluster cần lấy dữ liệu từ 1 resource, resource monitor tiếp nhận yêu cầu và đưa yêu cầu đó đến resource DLL thích hợp. Ngược lại khi 1 resource DLL cần báo cáo trạng thái của nó hoặc thông báo cho cluster service 1 sự kiện, resource sẽ đưa thông tin này từ resource đến cluster service 

Node Manager

Chạy trên mỗi node đồng thời duy trì 1 danh sách cục bộ những những node, những network, những network interface trong cluster. Dựa vào sự giao tiếp giữa những node, node manager đảm bảo cho những node có cùng 1 danh sách những node đang hoạt động.

Membership Manager

Có nhiệm vụ chịu trách nhiệm duy trì 1 cái nhìn nhất quán về những node trong Cluster hiện đang hoạt động hay bị hỏng tại 1 thời điểm nhất định. Thành phần này tập trung chủ yếu vào thuật toán regroup được yêu cầu hoạt động bất cứ khi nào có dấu hiệu của 1 hay nhiều node bị lỗi.

Checkpoint Manager

Đảm bảo cho việc phục hồi từ resource bị lỗi, Checkpoint Manager tiến hành kiểm tra những khoá registry khi 1 resource được mang online và ghi dữ liệu checkpoint đến quorum resource trong trường hợp resource này offline.

7. Ứng dụng của hệ thống phân cụm trong công nghệ máy tính

Một ứng dụng phổ biến của hệ thống phân cụm là trong lĩnh vực khoa học và nghiên cứu. Nhờ việc kết hợp các máy tính có hiệu năng cao lại với nhau, các nhà nghiên cứu có thể tăng tốc độ tính toán và xử lý dữ liệu, từ đó giúp họ nhanh chóng tiến hành các phân tích phức tạp và mô phỏng khoa học.

Ngoài ra, hệ thống phân cụm cũng được sử dụng trong lĩnh vực viễn thông. Các máy tính trong hệ thống phân cụm có thể cùng nhau xử lý thông tin từ các thiết bị mạng như điện thoại di động hoặc trạm cơ sở, từ đó giúp tăng cường khả năng xử lý và lưu trữ dữ liệu của mạng.

Ứng dụng thông minh của Cluster

Ứng dụng thông minh của Cluster trong việc xử lý dữ liệu lớn

Trong lĩnh vực Internet, hệ thống phân cụm cũng chơi một vai trò quan trọng. Các công ty trực tuyến như Amazon hay Google thường sử dụng hệ thống phân cụm để xử lý hàng tỷ yêu cầu từ người dùng, từ việc tìm kiếm thông tin đến mua hàng trực tuyến. Nhờ hệ thống phân cụm, các dịch vụ này có thể thực hiện các tác vụ trên hàng triệu máy tính một cách nhanh chóng và hiệu quả.

Cuối cùng, hệ thống phân cụm cũng được ứng dụng rộng rãi trong lĩnh vực giải trí. Ví dụ, ngành công nghiệp game thường sử dụng hệ thống phân cụm để cung cấp trải nghiệm trực tuyến cho hàng ngàn người chơi cùng một lúc. Thông qua việc phân tải công việc trên nhiều máy tính, hệ thống phân cụm giúp đảm bảo rằng trò chơi vẫn diễn ra mượt mà và không bị gián đoạn.

Ứng dụng của Cluster trong lĩnh vực quản lý cơ sở dữ liệu:

Cluster thường được sử dụng cho các ứng dụng đòi hỏi hoạt động liên tục và ổn định (Stateful applications), bao gồm các máy chủ cơ sở dữ liệu như Microsoft MySQL Server, Microsoft Exchange Server, File and Print Server, và nhiều hơn nữa.

Mỗi node trong Cluster chia sẻ cùng một không gian lưu trữ dữ liệu, sử dụng công nghệ như SCSI hoặc Storage Area Network (SAN). Phiên bản Windows Server 2003 Enterprise và Datacenter hỗ trợ cluster với tối đa 8 node, trong khi Windows 2000 Advanced Server chỉ hỗ trợ 2 node và Windows 2000 Datacenter Server hỗ trợ lên đến 4 node.

Hệ thống phân cụm trong công nghệ máy tính là một công nghệ quan trọng giúp tạo ra các hệ thống có khả năng mở rộng và chịu lỗi. Nó cho phép các máy tính kết nối với nhau và chia sẻ tài nguyên, từ đó tăng cường hiệu năng và khả năng xử lý dữ liệu. Công nghệ phân cụm có thể được áp dụng trong nhiều lĩnh vực khác nhau, đóng góp vào sự phát triển và cải thiện của các ứng dụng và hệ thống máy tính.

Mai Văn Học

Mai Văn Học

Tôi là Mai Văn Học - Quản trị viên, tác giả các bài viết chuyên sâu về về các sản phẩm công nghệ, từ linh kiện PC đến bộ PC, laptop trên Hoanghapc.vn. Với kinh nghiệm phong phú và kiến thức sâu rộng, tôi cung cấp cái nhìn toàn diện, giúp người dùng hiểu rõ về tính năng, hiệu suất và giá trị của sản phẩm.

Bài viết mới nhất

Bài viết được xem nhiều

Sản phẩm khuyến mãi

popup
Chat Facebook (8h00 - 20h00)
Chat Zalo (8h00 - 20h00)
0969.123.666 (8h00 - 20h00)