Vietnamese (machine translation)

Lưu ý

Mục đích của file này là để độc giả tiếng Việt có thể đọc và hiểu tài liệu nhân kernel dễ dàng hơn, không phải để tạo ra một nhánh tài liệu riêng. Nếu bạn có bất kỳ nhận xét hoặc cập nhật nào cho file này, vui lòng thử cập nhật file tiếng Anh gốc trước. Nếu bạn thấy có sự khác biệt giữa bản dịch và bản gốc, hoặc có vấn đề về bản dịch, vui lòng gửi góp ý hoặc patch cho người dịch của file này, hoặc nhờ người bảo trì và người review tài liệu tiếng Việt giúp đỡ.

Bản gốc:

NVIDIA Tegra241 SoC Uncore Performance Monitoring Unit (PMU)

Người dịch:

Google Translate (machine translation)

Phiên bản gốc:

8541d8f725c6

Cảnh báo

Tài liệu này được dịch tự động bằng máy và chưa được review bởi người dịch. Nội dung có thể không chính xác hoặc khó hiểu ở một số chỗ. Khi có sự khác biệt với bản gốc, bản gốc luôn là chuẩn. Bản dịch chất lượng cao (được review) được đặt trong thư mục vi_VN/.

Bộ giám sát hiệu suất Uncore NVIDIA Tegra241 SoC (PMU)

NVIDIA Tegra241 SoC bao gồm nhiều PMU hệ thống khác nhau để đo hiệu suất chính các số liệu như băng thông bộ nhớ, độ trễ và mức sử dụng:

  • Vải kết hợp có thể mở rộng (SCF)

  • NVLink-C2C0

  • NVLink-C2C1

*Liên kết CNV * PCIE

Trình điều khiển PMU

Các PMU trong tài liệu này dựa trên Kiến trúc ARM CoreSight PMU như được mô tả trong tài liệu: ARM IHI 0091. Vì đây là kiến trúc tiêu chuẩn nên Các PMU được quản lý bởi một trình điều khiển chung “arm-cs-arch-pmu”. Trình điều khiển này mô tả các sự kiện và cấu hình có sẵn của từng PMU trong sysfs. Xin vui lòng xem các phần bên dưới để nhận đường dẫn sysfs của mỗi PMU. Giống như các trình điều khiển PMU không lõi khác, trình điều khiển cung cấp thuộc tính sysfs “cpumask” để hiển thị id CPU được sử dụng để xử lý sự kiện PMU. Ngoài ra còn có thuộc tính sysfs “liên kết_cpus”, chứa một danh sách các CPU được liên kết với phiên bản PMU.

SCF PMU

SCF PMU giám sát các sự kiện bộ đệm cấp hệ thống, lưu lượng truy cập CPU và thứ tự mạnh mẽ (SO) PCIE ghi lưu lượng truy cập vào bộ nhớ cục bộ/từ xa. Xin vui lòng xem ZZ0000ZZ để biết thêm thông tin về PMU phủ sóng giao thông.

Các sự kiện và tùy chọn cấu hình của thiết bị PMU này được mô tả trong sysfs, xem /sys/bus/event_source/devices/nvidia_scf_pmu_<socket-id>.

Cách sử dụng ví dụ:

  • Đếm id sự kiện 0x0 trong socket 0:

chỉ số hoàn hảo -a -e nvidia_scf_pmu_0/event=0x0/

  • Đếm id sự kiện 0x0 trong socket 1:

chỉ số hoàn hảo -a -e nvidia_scf_pmu_1/event=0x0/

PCIE PMU

PCIE PMU giám sát tất cả lưu lượng đọc/ghi từ các cổng gốc PCIE tới bộ nhớ cục bộ/từ xa. Vui lòng xem ZZ0000ZZ để biết thêm thông tin về phạm vi phủ sóng giao thông PMU.

Các sự kiện và tùy chọn cấu hình của thiết bị PMU này được mô tả trong sysfs, xem /sys/bus/event_source/devices/nvidia_pcie_pmu_<socket-id>.

Mỗi ổ cắm SoC có thể hỗ trợ nhiều cổng gốc. Người dùng có thể sử dụng Tham số bitmap “root_port” để chọn (các) cổng cần giám sát, tức là. “root_port=0xF” tương ứng với cổng gốc 0 đến 3. PMU sẽ giám sát tất cả gốc cổng theo mặc định nếu không được chỉ định. /sys/bus/event_source/devices/nvidia_pcie_pmu_<socket-id>/format/root_port hiển thị các bit hợp lệ có thể được đặt trong tham số “root_port”.

Cách sử dụng ví dụ:

  • Đếm id sự kiện 0x0 từ cổng gốc 0 và 1 của socket 0:

chỉ số hoàn hảo -a -e nvidia_pcie_pmu_0/event=0x0,root_port=0x3/

  • Đếm id sự kiện 0x0 từ cổng gốc 0 và 1 của socket 1:

chỉ số hoàn hảo -a -e nvidia_pcie_pmu_1/event=0x0,root_port=0x3/

Bảo hiểm giao thông

Phạm vi phủ sóng lưu lượng PMU có thể thay đổi tùy thuộc vào cấu hình chip:

  • ZZ0000ZZ: Hopper GPU được kết nối với Grace SoC.

Cấu hình ví dụ với hai Grace SoC:

*******************************ZZ0002ZZ******************************
  • SOCKET-A * * SOCKET-B *

  • ::::::::: * * :::::::: *

  • : PCIE : * * : PCIE : *

  • ::::::::: * * :::::::: *

  • ZZ0004ZZ *

  • ZZ0005ZZ *

  • ::::::: ::::::::: * * ::::::::: ::::::: *

  • : : : : * * : : : : *

  • : GPU :<--NVLink-->: Grace :<---CNVLink--->: Grace :<--NVLink-->: GPU : *

  • : : C2C : SoC : * * : SoC : C2C : : *

  • ::::::: ::::::::: * * ::::::::: ::::::: *

  • ZZ0006ZZ * * ZZ0007ZZ *

  • ZZ0008ZZ * * ZZ0009ZZ *

  • &&&&&&&&&&&&&&&* * &&&&&&&&&&&&&&&*

  • & GMEM & & CMEM & * * & CMEM & & GMEM & *

  • &&&&&&&&&&&&&&&* * &&&&&&&&&&&&&&&*

*****************************ZZ0003ZZ****************************

GMEM = Bộ nhớ GPU (ví dụ: HBM)

CMEM = Bộ nhớ CPU (ví dụ: LPDDR5X)

| Bảng sau chứa phạm vi lưu lượng truy cập của Grace SoC PMU trong socket-A:

Nguồn ZZ0000ZZ | + +-------+----------+-------------+------+----------+----------+ ZZ0001ZZ ZZ0002ZZGPU Không-ATSZZ0003ZZ Ổ cắm-B ZZ0004ZZ ZZ0005ZZPCI R/W|Translated,|Đã dịch ZZ0007ZZ CPU/PCIE1ZZ0008ZZ ZZ0009ZZ ZZ0010ZZ ZZ0011ZZ ZZ0012ZZ +===============+========+=============================================================================================================================== ZZ0013ZZ PCIE |NVLink-C2C0|NVLink-C2C1ZZ0015ZZ SCF PMU ZZ0016ZZ ZZ0017ZZ PMU ZZ0018ZZPMU ZZ0019ZZ ZZ0020ZZ +--------------+-------+----------+----------+------+----------+----------+ ZZ0021ZZ PCIE | N/A |NVLink-C2C1ZZ0023ZZ SCF PMU ZZ0024ZZ ZZ0025ZZ PMU ZZ0026ZZPMU ZZ0027ZZ ZZ0028ZZ +--------------+-------+----------+----------+------+----------+----------+ ZZ0029ZZ PCIE |NVLink-C2C0|NVLink-C2C1ZZ0031ZZ ZZ0032ZZ ZZ0033ZZ PMU ZZ0034ZZPMU ZZ0035ZZ Không áp dụng ZZ0036ZZ ZZ0037ZZ ZZ0038ZZ ZZ0039ZZ ZZ0040ZZ +--------------+-------+----------+----------+------+----------+----------+ ZZ0041ZZ PCIE |NVLink-C2C0|NVLink-C2C1ZZ0043ZZ ZZ0044ZZ ZZ0045ZZ PMU ZZ0046ZZPMU ZZ0047ZZ Không áp dụng ZZ0048ZZ +--------------+-------+----------+----------+------+----------+----------+

Lưu lượng PCIE1 thể hiện việc ghi theo thứ tự mạnh mẽ (SO).

Lưu lượng PCIE2 đại diện cho việc đọc và ghi theo thứ tự thoải mái (RO).

  • ZZ0000ZZ: hai SoC Grace CPU được kết nối.

Cấu hình ví dụ với hai Grace SoC:

****************ZZ0002ZZ***************
  • SOCKET-A * * SOCKET-B *

  • ::::::::: * * :::::::: *

  • : PCIE : * * : PCIE : *

  • ::::::::: * * :::::::: *

  • ZZ0004ZZ *

  • ZZ0005ZZ *

  • ::::::::: * * ::::::::: *

  • : : * * : : *

  • : Grace :<--------NVLink------->: Grace : *

  • : SoC : * C2C * : SoC : *

  • ::::::::: * * ::::::::: *

  • ZZ0006ZZ *

  • ZZ0007ZZ *

  • &&&&&&&&* * &&&&&&&& *

  • & CMEM & * * & CMEM & *

  • &&&&&&&&* * &&&&&&&& *

**************ZZ0003ZZ*************

GMEM = Bộ nhớ GPU (ví dụ: HBM)

CMEM = Bộ nhớ CPU (ví dụ: LPDDR5X)

| Bảng sau chứa phạm vi lưu lượng truy cập của Grace SoC PMU trong socket-A:

Nguồn ZZ0000ZZ | + +----------+----------+----------+-------------+ ZZ0001ZZ ZZ0002ZZ Ổ cắm-B ZZ0003ZZ ZZ0004ZZ PCI R/W ZZ0005ZZ CPU/PCIE1ZZ0006ZZ ZZ0007ZZ ZZ0008ZZ ZZ0009ZZ +==================+========================================================+ ZZ0010ZZ PCIE PMU ZZ0011ZZ SCF PMU ZZ0012ZZ ZZ0013ZZ ZZ0014ZZ ZZ0015ZZ +--------+----------+---------+----------+-------------+ ZZ0016ZZ ZZ0017ZZ ZZ0018ZZ ZZ0019ZZ PCIE PMU ZZ0020ZZ Không áp dụng ZZ0021ZZ ZZ0022ZZ ZZ0023ZZ ZZ0024ZZ +--------+----------+---------+----------+-------------+

Lưu lượng PCIE1 thể hiện việc ghi theo thứ tự mạnh mẽ (SO).

Lưu lượng PCIE2 đại diện cho việc đọc và ghi theo thứ tự thoải mái (RO).