Linux

[Hotfix] Cuda 설치 시 발생 문제 해결

Linuxias 2023. 9. 10. 22:50
반응형

nvidia-drm driver 문제

문제

nvidia-drm driver 문제는 아래와 같은 Log를 남긴다. nvidia-drm 커널 모듈이 이미 커널에 로드되어 사용중이기 때문에 설치가 어렵다는 내용이다.

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel.  This may be because it is in use (for example, by an X server, a CUDA program, or 
         the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading.  Please be sure to exit any programs    
         that may be using the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your kernel supports module unloading,   
         and you still receive this message, then an error may have occured that has corrupted an NVIDIA kernel module's usage count, for which the simplest remedy is to     
         reboot your computer.

해결

문제 해결 방법은 간단하다. nvidia-drm 모듈을 제거시킨 후 설치를 진행한다. 하지만 nvidia-drm 모듈은 Graphics 환경에서는 제거가 되지 않기 때문에 아래 순서를 따른다.

1. nvidia-drm 모듈 Unloading

먼저 graphic 환경에서 terminal 환경으로 변경한 후 nvidia-drm 모듈 사용 여부를 확인한다. 사용 중인 경우 nvidia-drm 을 제거한 후 정상적으로 제거되었는지 확인하는 과정이다.

$sudo systemctl isolate multi-user.target
$lsmod | grep nvidia.drm
$sudo modprobe -r nvidia-drm
$lsmod | grep nvidia.drm


2. cuda 설치

cuda를 다운받은 경로로 이동하여 설치한다. 아래에서는 runfile 기반 설치 방식이다.

$sudo sh cuda_{your_download_version}_linux.run

3. 설치 후 Cuda 버전 업데이트 확인

$nvidia-smi

4. GUI 환경 재시작

$sudo systemctl start graphical.target



 

반응형