amdgpu kfd TTM USERPTR

2023-06-01 06:17:04

amdgpu kfd TTM USERPTR

- USERPTR
- - alloc of gpu
  - - vm_alloc_memory_of_gpu
    - bo_create
    - wrapper 驅動gfx 側自己的bo, 管理chardev側的bo, 标記這個bo是chardev這邊申請的
    - init_user_pages 将真正的userptr綁定到tbo的ttm_tt
    - 将 kgd_mem轉換為idr
  - map to gpu

USERPTR

alloc of gpu

vm_alloc_memory_of_gpu

domain = AMDGPU_GEM_DOMAIN_GTT;

alloc_domain = AMDGPU_GEM_DOMAIN_CPU;

alloc_flags = 0;

bp:

domain: GEM_DOMAIN_CPU(alloc_domain)

bo_type: ttm_bo_type_device

alloc_flags: 0

bo_create

為了shadow bo, wrapper了do_create

bo_do_create

acc_size = 存儲這個bo占用的真正頁面所需要的空間

preferred_domain = domain = GEM_DOMAIN_CPU;

— bo_placement_from_domain()

places[c].fpfn = 0;

places[c].lpfn = 0;

places[c].flags = TTM_PL_FLAG_SYSTEM;

bo->allowed_domains = bo->preferred_domains;

bo->flags = bp->flags;
1. ttm_bo_init_reserved
  
  bo->type = ttm_bo_type_device;
  
  bo->num_pages (size + PAGE_SIZE - 1) >> PAGE_SHIFT;
  
  bo->mem.size = page對齊的位元組數量
  
  bo->mem.mm_node = NULL; 存儲bo在目前domain的位置的node
  
  bo->mem.mem_type = TTM_PL_SYSTEM . 預設建立的是SYSTEM,
  
  bo->mem.placement = (TTM_PL_FLAG_SYSTEM | TTM_PL_FLAG_CACHED); 預設
  
  屬性是SYSTEM | cached
  
  placement->busy_placement = places; 移動位置和建立位置是一樣的, USERPTR都是在SYSTEM
  
  上述三步 , USERPTR的tbo在第一次invalid校驗compact是通過的
  
  bo->acc_size = acc_size; 這個size包括三部分(page ,CPU, DMA)
  
  drm_vma_offset_add 如果是CPU可見記憶體, 将目前bo的vma添加到drm, 可以進行mmap了. 需要ttm_vm.c處理fault.
  1. ttm_bo_validate()
    1. 相容性比對 ttm_bo_mem_compat , USERPTR是相容的, 不走下邊的2, 隻走到3
    2. palcement不相容需要移動bo ttm_bo_move_buffer
    3. 建立存儲系統記憶體頁面的結構 ttm_tt_create
      1. bdev->driver->ttm_tt_create(bo, TTM_PAGE_FLAG_ZERO_ALLOC);
        
        申請GTT的存儲結構(page array ) 以及對應的頁面映射(bind)的方式

wrapper 驅動gfx 側自己的bo, 管理chardev側的bo, 标記這個bo是chardev這邊申請的

使用的是 struct kgd_mem

bo->kfd_bo = *mem; 标記這個bo是給chardev使用

(*mem)->bo = bo; chardev這邊找到tbo;

(*mem)->va = va; 申請時提供的va

(*mem)->domain = domain; 最終需要映射到的位置

(*mem)->mapped_to_gpu_memory = 0; 申請時還沒有映射到GPU側

(*mem)->process_info = avm->process_info; 儲存計算的程序

init_user_pages 将真正的userptr綁定到tbo的ttm_tt

`amdgpu_ttm_tt_get_user_pages`
		`amdgpu_bo_reserve`
		`hmm_device_entry_to_page` 擷取頁面資訊,登記到pages的數組中, 這個數組就是ttm_tt

将 kgd_mem轉換為idr

map to gpu

根據裝置(n_device) 來循環頁表映射的

通過handel找到 alloc時的mem
通過mem就知道對應的tbo, 并且在alloc時已經設定這個bo的目标domain(GTT)
reserve_bo_and_vm 目前bo停止移動, 需要預留進行map
1388 – 1411 mapping , 進行頁表更新

amdgpu kfd TTM USERPTR

amdgpu kfd TTM USERPTR

USERPTR

alloc of gpu

vm_alloc_memory_of_gpu

bo_create

wrapper 驅動gfx 側自己的bo, 管理chardev側的bo, 标記這個bo是chardev這邊申請的

init_user_pages 将真正的userptr綁定到tbo的ttm_tt

将 kgd_mem轉換為idr

map to gpu

繼續閱讀

Apache (You don't have permission to access / on this server.）

debian9更新4.9.0核心到4.19.2核心過程

centOS7 配置 vsftpd 虛拟使用者及權限Vsftpd配置虛拟使用者及權限

linux-svn解除安裝與安裝

vsftp虛拟多使用者多權限一鍵部署腳本

Ubuntu14.04 LTS下安裝mongodb

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三