Memasang CUDA pada Windows tidak perlu menjadi kerumitan jika anda tahu ke mana hendak beralih dan versi yang mana untuk dipadankan. Dalam panduan praktikal ini, saya akan membawa anda langkah demi langkah melalui semua yang anda perlukan untuk mendapatkan kit alat, pemacu yang betul dan utiliti pengesahan berfungsi dan berjalan, pada Windows asli dan menggunakan WSL. Ideanya adalah untuk membunuh GPU anda. sungguh memecut beban kerja anda, tanpa kejutan keserasian.
Selain pemasangan asas, saya akan merangkumi kes penggunaan dunia sebenar dan keperluan khas (seperti ML.NET Model Builder dengan kebergantungan warisan), alternatif pemasangan dengan Conda dan pip, penyepaduan dengan Visual Studio dan ujian deviceQuery dan bandwidthTest klasik. Anda juga akan melihat cara mendiagnosis masalah pemandu biasa, pengesanan GPU dan versi CUDA tidak sepadan yang biasanya melambatkan orang pada kali pertama.
Apakah CUDA dan mengapa ia penting pada Windows?
CUDA ialah platform dan model pengaturcaraan NVIDIA untuk pengkomputeran selari yang membolehkan anda memunggah bahagian paling intensif aplikasi anda ke GPU. CPU mengendalikan kerja berurutan dan GPU mengendalikan selari secara besar-besaran, masing-masing mempunyai ingatan sendiri, mengelakkan kesesakan dan membenarkan kerja serentak.
GPU yang didayakan CUDA menampilkan ratusan atau ribuan teras yang menjalankan puluhan ribu utas. Perpustakaan seperti cuBLAS, cuDNN dan NVCC lengkapkan kit supaya anda boleh menyusun, nyahpepijat dan memprofilkan perisian dipercepatkan GPU anda pada Windows.
Keperluan sistem dan keserasian pada Windows
Pertama sekali, anda perlu menyemak sama ada sistem anda serasi dengan toolkit yang anda inginkan. Pada sistem Windows semasa, Sokongan CUDA 13.0 U1: Windows 11 24H2, 23H2, 22H2-SV2; Windows 10 22H2; Windows Server 2022 dan 2025.
Penyusun dan IDE yang disokong: Visual Studio 2022 17.x (MSVC 193x) dengan C++11/14/17/20 dan Visual Studio 2019 16.x (MSVC 192x) dengan C++11/14/17. The sokongan untuk VS2017 Ia telah dialih keluar dalam CUDA 13.0 dan untuk VS2015 ia telah ditamatkan sejak CUDA 11.1, jadi laraskan projek anda.
Nota 32-bit penting: Sejak CUDA 12.0, tiada lagi rantai alat 32-bit (asli atau merentas platform). Pemacu akan terus menjalankan binari 32-bit pada GeForce. Ada seni bina; Hopper tidak lagi menyokong 32 bit.
Perkakasan yang disyorkan: GPU NVIDIA dengan Keupayaan Pengiraan yang sesuai untuk versi anda (untuk senario umum, 3.0 atau lebih tinggi; lihat senarai rasmi), memori yang mencukupi, dan dalam kes tertentu yang lebih menuntut. Untuk Pembina Model (klasifikasi imej), sekurang-kurangnya VRAM 6 GB berdedikasi, manakala untuk kegunaan asas minimum 4 GB disebut.
Semak sama ada anda mempunyai GPU yang serasi dan versi yang anda ada

Untuk menyemak model GPU anda dalam Windows: Tetapan > Sistem > Paparan > Tetapan lanjutan. Di sana anda akan melihat pembuatan dan model di bawah Maklumat Paparan, sangat berguna untuk mengesahkan keserasian.
Anda juga boleh menggunakan Pengurus Tugas pada tab Prestasi dan pilih panel GPU untuk melihat butiran. Jika ia tidak muncul, buka Pengurus Peranti dan lihat pada Penyesuai paparan; Jika pemandu NVIDIA tiada, pasangkannya.
Untuk menyemak pemasangan CUDA, buka PowerShell atau CMD dan jalankan nvcc --version o nvcc -V. Ini mengembalikan versi pengkompil NVCC dipasang; jika ia tidak bertindak balas, PATH kit alat tidak dikonfigurasikan atau ia tidak dipasang dengan betul.
Jika anda perlu mengemas kini pemacu, GeForce Experience mencadangkan versi terkini, atau muat turunnya daripada tapak web pemandu NVIDIA rasmi. Pemacu yang dikemas kini biasanya menyelesaikan masalah ini. ketidakserasian toolkit dan kegagalan pengesanan.
Muat turun NVIDIA CUDA Toolkit: Format dan Integriti
Pergi ke halaman muat turun CUDA rasmi NVIDIA dan pilih Windows. Anda boleh memilih sama ada Pemasang Rangkaian (muat turun minimum, kemudian pakej atas permintaan) atau Pemasang Penuh (semuanya disertakan). Pemasang penuh bagus untuk komputer luar talian atau untuk penempatan perusahaan.
Selepas memuat turun, amalan yang baik untuk mengesahkan jumlah semak MD5 yang diterbitkan untuk memastikan fail itu tidak rosak. Jika cincangan tidak sepadan, muat turun semula pemasang dan mengelakkan sakit kepala kemudian.
Sejak CUDA 13, pemacu NVIDIA tidak lagi disertakan dalam Toolkit. Pasang pemacu secara berasingan daripada Halaman pemacu NVIDIA dan kemudian Toolkit; elakkan mencampurkan versi yang tidak serasi.
Pemasangan pada Windows: mod grafik, senyap dan pengekstrakan
Pemasangan grafik: Jalankan pemasang dan ikuti langkah. Pilih lokasi, terima lesen dan pilih komponen seperti Toolkit, Nsight Compute/Systems dan contoh.
Pemasangan senyap: Anda boleh melancarkan pemasang dengan -s untuk mod senyap dan tambah parameter untuk subpakej tertentu. Jika anda tidak mahu memulakan semula automatik, tambah -n dan anda menguruskan but semula pada penghujungnya.
Pengekstrakan manual: Dengan 7-Zip/WinZip, anda boleh mengekstrak keseluruhan pakej untuk memeriksa kandungannya. Toolkit terletak di dalam folder. Kit Alat CUDA dan penyepaduan Visual Studio dalam direktori senama; fail .dll dan .nvi yang anda lihat dalam akar pemasang bukanlah fail yang boleh dipasang seperti itu.
Laluan Kit Alat Lalai: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0. Apabila memasang subpakej Anda boleh memilih hanya apa yang anda perlukan (contohnya, nvcc_13.0 untuk penyusun, cudart_13.0 untuk masa larian, cublas_13.0/cublas_dev_13.0, cufft_13.0, curand_13.0, cusolver_13.0, cusparse_13.0, nsight_compute_13.0, nsight_systems_13.0, nvrtc_13.0, nvdisasm_13.0, nvprune_13.0, opencl_13.0, sanitizer_13.0, thrust_13.0, dan lain-lain.). Dengan cara ini anda mengurangkan jejak dan masa pemasangan.
Nyahpasang: Semua subpakej boleh dialih keluar daripada Panel Kawalan > Program dan Ciri. Berguna jika anda ingin memasang semula versi. bersih atau menukar cawangan tanpa sebarang jenazah.
Model pemacu dalam Windows: WDDM vs TCC
Pada Windows 10 dan lebih baru, pemacu NVIDIA boleh beroperasi dalam dua mod: WDDM (untuk peranti paparan) dan TCC (untuk pengiraan GPU seperti Tesla atau Titan tertentu). Anda boleh menyemak dan menukar mod dengan nvidia-smi pada kad yang disokong; kebanyakan kad GeForce moden menggunakan WDDM secara lalai.
Sahkan pemasangan: nvcc, sampel dan ujian
Semak versi NVCC dengan nvcc -V. Jika arahan itu berfungsi, PATH dan pemasangan asas telah disediakan.
Klonkan Sampel CUDA daripada GitHub di nvidia/cuda-samples, susun dan jalankannya deviceQuery. Ia sepatutnya mengesan peranti anda dan mengembalikan a ujian lulus; jika tidak, semak pemacu dan perkakasan.
Juga berjalan bandwidthTest untuk mengesahkan jalur lebar peranti hos. Jika ujian lulus, komunikasi CPU-GPU adalah OK. Sebarang ralat di sini biasanya merujuk kepada pemacu atau pemasangan Toolkit.
Penyepaduan dengan Visual Studio dan infrastruktur projek
Sampel dan projek anda boleh disusun dengan penyelesaian VS 2019/2022. Templat NVIDIA menyediakan projek C++ dengan Bina Penyesuaian CUDA untuk versi anda (contohnya, CUDA 13.0 Runtime).
Fail .props Kit Alat: VS 2019 mempunyai prop C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\MSBuild\Microsoft\VC\v160\BuildCustomizations dan VS 2022 in C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Microsoft\VC\v170\BuildCustomizations. Laluan ini membolehkan VS mencari peraturan dan harta benda daripada CUDA.
Dalam projek baharu, buat daripada Templat NVIDIA > CUDA untuk versi yang dipasang. Dalam projek sedia ada, pergi ke Bina Ketergantungan > Bina Penyesuaian dan tandakan versi CUDA anda atau tuding ke $(CUDA_PATH) jika anda mahu sentiasa menggunakan yang paling baru dipasang.
Selepas memasang atau menyahpasang Toolkit, sahkan itu $(CUDA_PATH) menunjuk ke folder yang betul. Akses Pemboleh ubah Persekitaran daripada System Properties untuk menyemak dan melaraskan nilai jika perlu.
Fail dengan kod CUDA mesti ditandakan sebagai jenis CUDA C/C++. Anda boleh menambahnya daripada Tambah Item Baharu > NVIDIA CUDA 13.0 > Kod C/C++ CUDA dalam Visual Studio.
Pasang CUDA dengan Conda dan pip
Conda: NVIDIA menerbitkan pakej pada saluran Anacondanya (anaconda.org/nvidia) untuk memasang Kit Alat penuh atau versi sebelumnya yang khusus. Untuk menyemat versi sebelumnya, tambahkan keluarkan label kepada arahan pemasangan dan Conda akan menyelesaikan kebergantungan.
pip: NVIDIA menyediakan Wheels untuk memasang komponen CUDA yang berorientasikan terutamanya kepada runtime Python. Pasang pertama nvidia-pyindex dan pastikan anda mempunyai pip dan setuptools yang dikemas kini. Anda boleh memasukkan baris yang sepadan dalam anda requirements.txt Sekiranya anda lebih suka.
Metapackages pada Windows untuk CUDA 12 (cu12) yang menarik daripada versi terkini yang tersedia: antara lain, nvidia-cublas-cu12, nvidia-cuda-cccl-cu12, nvidia-cuda-cupti-cu12, nvidia-cuda-nvcc-cu12, nvidia-cuda-nvrtc-cu12, nvidia-cuda-opencl-cu12, nvidia-cuda-runtime-cu12, nvidia-cuda-sanitizer-api-cu12, nvidia-cufft-cu12, nvidia-curand-cu12, nvidia-cusolver-cu12, nvidia-cusparse-cu12, nvidia-npp-cu12, nvidia-nvfatbin-cu12, nvidia-nvjitlink-cu12, nvidia-nvjpeg-cu12, nvidia-nvml-dev-cu12, nvidia-nvtx-cu12.
Metapackages ini memasang pakej versi tertentu, contohnya dengan akhiran cu129: nvidia-cublas-cu129, nvidia-cuda-cccl-cu129, nvidia-cuda-cupti-cu129, nvidia-cuda-nvcc-cu129, nvidia-cuda-nvrtc-cu129, nvidia-cuda-opencl-cu129, nvidia-cuda-runtime-cu129, nvidia-cuda-sanitizer-api-cu129, nvidia-cufft-cu129, nvidia-curand-cu129, nvidia-cusolver-cu129, nvidia-cusparse-cu129, nvidia-npp-cu129, nvidia-nvfatbin-cu129, nvidia-nvjitlink-cu129, nvidia-nvjpeg-cu129, nvidia-nvml-dev-cu129, nvidia-nvtx-cu129. Ingat bahawa CUDA Wheels tidak termasuk alat pembangun, hanya masa jalan.
Menggunakan pip bermakna persekitaran CUDA terikat dengan persekitaran Python anda. Jika anda bercadang untuk menyusun atau menjalankan di luar persekitaran itu, pasang juga Kit alat peringkat sistem untuk mengelakkan ketidakkonsistenan laluan.
CUDA pada WSL: Windows 11 dan Windows 10 21H2
Windows 11 dan Windows 10 21H2 (dan kemudiannya) membenarkan anda menjalankan rangka kerja dan perpustakaan ML dipercepatkan CUDA dalam WSL. Ini termasuk PyTorch, TensorFlow, Docker dan NVIDIA Container Toolkit, sama seperti yang anda lakukan pada Linux asli.
Langkah 1: Pasang pemacu NVIDIA yang didayakan CUDA untuk WSL daripada tapak web rasmi. Pemacu ini direka khusus untuk mendedahkan GPU dalam pengedaran. Linux pada WSL.
Langkah 2: Dayakan WSL dan tambahkan pengedaran berasaskan glibc (Ubuntu/Debian). Kemas kini kernel daripada Windows Update dan sahkan bahawa ia adalah 5.10.43.3 atau lebih tinggi berlari wsl cat /proc/version dalam PowerShell.
Langkah 3: Ikuti panduan NVIDIA CUDA pada WSL untuk memasang Toolkit dalam distro dan/atau mengkonfigurasi NVIDIA Docker. Anda akan dapat menggunakan Linux biasa mengalir dengan pecutan dan memisahkan persekitaran dengan sempurna daripada Windows hos.
Senario kehidupan sebenar: komputer riba campuran AMD + NVIDIA dan ralat dengan 12.8/11.8
Mari kita anggap Lenovo Ideapad 5 Pro dengan AMD Ryzen, AMD Radeon iGPU dan NVIDIA GeForce GTX dGPU. Apabila berlari nvidia-smi muncul Pemandu 526.56 dan CUDA Versi 12.0, tetapi cuba memasang CUDA 12.8 atau 11.8 nampaknya tidak berfungsi.
Kunci untuk memahaminya: baris Versi CUDA daripada nvidia-smi menunjukkan versi masa jalan CUDA maksimum yang disokong oleh pemacu anda, bukan Toolkit yang dipasang. Pemandu 526.56 Ia menyokong CUDA 12.0 dan 11.8, tetapi bukan 12.8, yang memerlukan pemacu yang lebih baharu (cawangan 55x/56x). Kemas kini kepada pemacu baru-baru ini (Studio atau Game Ready DCH) daripada tapak web NVIDIA dan ulangi pemasangan.
Pada komputer hibrid, semak dalam Panel Kawalan NVIDIA atau Tetapan Grafik Windows untuk memastikan apl pengkomputeran anda menggunakan GPU NVIDIA. Jika dGPU tidak digunakan, nvidia-smi Ini mungkin menyebabkan masalah, atau rangka kerja mungkin dimuatkan pada AMD iGPU, yang tidak menyokong CUDA. Pertimbangkan pemasangan pemacu yang bersih dan sahkan bahawa GeForce Experience mengesan perkakasan.
Keperluan Khas: ML.NET Model Builder (klasifikasi imej sahaja)
Untuk senario klasifikasi imej dengan Model Builder, Microsoft memerlukan tindanan khusus: CUDA 10.1 dan cuDNN 7.6.4. Berhati-hati dengan ini kerana versi yang lebih baharu tidak menyokong aliran khusus itu.
Langkah utama dengan cuDNN 7.6.4: muat turun ZIP untuk CUDA 10.1, nyahzip dan salin cudnn64_7.dll daripada cuda\bin a C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin. Anda tidak boleh mempunyai berbilang versi cuDNN pada masa yang sama; mengalih keluar sisa versi lain untuk mengelakkan konflik semasa pelaksanaan.
Keperluan perkakasan untuk senario ini: sekurang-kurangnya satu GPU berkeupayaan CUDA dan 6 GB memori khusus. Jika anda tidak mempunyai GPU tempatan, Model Builder boleh melatih mesin maya GPU. Azure, atau akhirnya pada CPU, walaupun dengan masa latihan yang lebih lama.
Diagnosis cepat dan penyelesaian masalah biasa
GPU tidak muncul dalam Tetapan atau Pengurus Tugas: Buka Pengurus Peranti, lihat di bawah Penyesuai Paparan dan pasang pemacu yang sesuai. Tiada pemandu. NVIDIA, Windows tidak akan mendedahkan dGPU kepada apl.
Semak versi CUDA sistem: dalam PowerShell/CMD run nvcc --version. Jika gagal, semak sama ada Toolkit dipasang dan bahawa PATH sertakan folder bin daripada Kit Alat.
Kit alat tidak mengesan peranti CUDA: Pastikan pemacu dikemas kini dan GPU anda berada dalam senarai berkeupayaan CUDA. deviceQuery y Ujian lebar jalur Ia adalah termometer anda untuk mengesahkan bahawa timbunan perkakas-pemacu-alatan bertindak balas.
Mod pemacu yang salah untuk pengiraan: Pada pengiraan GPU, gunakan nvidia-smi untuk menyemak/menogol TCC jika berkenaan. Pada kebanyakan GeForce komputer riba, wddm Ia adalah mod yang dimaksudkan dan anda tidak boleh mengubahnya.
Ketergantungan berkonflik dengan rangka kerja Python: Jika anda menggunakan CUDA Wheels melalui pip, ingat bahawa ia hanya meliputi masa jalan dan terikat dengan persekitaran maya. Untuk menyusun sambungan atau menggunakan alatan, pasang juga Kit Alat Sistem, atau gunakan Conda untuk mengurus semuanya secara pukal.
Contoh, sampel dan amalan baik
Untuk mengesahkan prestasi dan kefungsian, susun dan jalankan deviceQuery y bandwidthTest daripada penyelesaian VS dalam repositori sampel. Binaan biasanya meninggalkan binari dalam laluan seperti Sampel CUDA\v13.0\bin\win64\Release jika anda mengekalkan nilai lalai.
Untuk melihat potensi CUDA secara visual, jalankan sampel grafik seperti particles. Di luar demo, mereka akan membantu anda mengambil rujukan untuk kegunaan memori yang dikongsi dan corak grid/blok dalam projek anda sendiri.
Alternatif awan dengan GPU
Jika anda tidak mahu bergelut dengan pemacu tempatan atau memerlukan kemuncak kuasa, anda boleh memilih contoh awan dengan GPU moden (A100, RTX 4090, A6000, dsb.). Perkhidmatan ini menawarkan penempatan segera, templat untuk PyTorch/TensorFlow dan pay-as-you-go, berguna untuk latihan intensif atau ujian pantas.
Nota dan markah
Dokumentasi teknikal NVIDIA dan pakej tertakluk kepada perubahan tanpa notis. Sentiasa semak nota pelepasan dan keserasian yang dikemas kini sebelum memasang pemacu atau Kit Alat dalam pengeluaran.
OpenCL ialah tanda dagangan Apple Inc. yang digunakan di bawah lesen oleh Khronos Group. NVIDIA dan logonya ialah tanda dagangan atau tanda dagangan berdaftar bagi NVIDIA Corporation di AS dan negara lain.
Dengan pemacu yang betul, kit alat yang betul dan beberapa ujian yang dilakukan dengan baik, Windows adalah asas yang kukuh untuk CUDA: anda boleh membangunkan dengan Visual Studio, mengesahkan dengan sampel rasmi, menjalankan rangka kerja AI dalam WSL seperti dalam Linux dan, jika anda tersekat, tarik pemasang alternatif (Conda/pip) atau pun awan untuk mengelak daripada dibiarkan tergantung; yang penting adalah untuk menyelaraskan versi pemacu dan kit alat, sahkan bahawa GPU NVIDIA adalah yang sebenarnya digunakan, dan menyokong anda deviceQuery/bandwidthTest untuk memastikan semuanya hijau. Kongsi tutorial ini dan lebih ramai pengguna akan tahu cara memasang CUDA pada Windows.