cuda- все статьи тега


Почему заполняемость CUDA определяется с точки зрения количества активных искажений по сравнению с максимальными поддерживаемыми искажениями

Заполняемость определяется как число активных искажений по сравнению с числом максимальных искажений, поддерживаемых на одном потоковом Мультипроцессоре. Допустим, у меня есть 4 блока, работающих на одном SM, каждый блок имеет 320 потоков, то есть 10 деформаций, поэтому 40 деформаций на одном SM. Заполняемость составляет 40/48, при условии, что максимальные деформации на одном см равны 48 (CC 2.икс). Но в общей сложности у меня есть 320 * 4 потока, работающих на одном SM, и есть только 48 ядер ...

В чем разница между ядрами CUDA и tensor?

Я совершенно новичок в терминах, связанных с вычислениями HPC, но я только что увидел, что EC2 выпустила свой новый тип экземпляра на AWS, который работает на новой Nvidia Tesla V100, которая имеет оба типа "ядер": ядра Cuda (5.120) и тензорные ядра (640). В чем разница между ними обоими? ...

Метод Симпсона для интеграции вещественных функций с CUDA

Я пытаюсь кодировать интеграцию по методу Симпсона в CUDA. Это формула для Правила Симпсона Где x_k = a + k*h. Вот мой код __device__ void initThreadBounds(int *n_start, int *n_end, int n, int totalBlocks, int blockWidth) { int threadId = blockWidth * blockIdx.x + threadIdx.x; int nextThreadId = threadId + 1; int threads = blockWidth * totalBlocks; *n_start = (threadId * n)/ threads; *n_end = (ne ...

Использование CUDA с Visual Studio 2017

Я пытаюсь установить CUDA, но получаю сообщение "не найдена поддерживаемая версия visual studio". Я думаю, что это связано с тем, что я использую Visual Studio 2017 (Community), а CUDA в настоящее время поддерживает только Visual Studio 2015. К сожалению, Microsoft не позволяет мне загружать старые версии Visual Studio без оплаты абонентской платы. Есть ли способ обойти проблему совместимости с VS 2017, или Я не могу использовать CUDA? ...

Очень медленная производительность анализа cusparse csrsv

Я написал решатель сопряженного градиента (для линейной системы уравнений) с предварительным условием LU, я использовал статьи доктора Максима Наумова на исследовательском сообществе nvidia в качестве руководства, шаг обновления остатков, который требует решения нижней треугольной матричной системы, а затем решение верхней треугольной матричной системы делится на две фазы: ]} Фаза анализа (которая использует модель разреженности и определяет уровень распараллеливания). фаза решения сам. Сог ...

"неизвестная ошибка" при использовании функции динамического выделения внутри устройства в CUDA

Я пытаюсь реализовать связанный список в приложении CUDA для моделирования растущей сети. В oder для этого я использую malloc внутри функции __device__, стремясь выделить память в глобальной памяти. Код такой: void __device__ insereviz(Vizinhos **lista, Nodo *novizinho, int *Gteste) { Vizinhos *vizinho; vizinho=(Vizinhos *)malloc(sizeof(Vizinhos)); vizinho->viz=novizinho; vizinho->proxviz=*lista; *lista=vizinho; novizinho->k=novizinho->k+1; } После определ ...

Создание DLL из CUDA с помощью nvcc

Я хочу создать .dll из кода CUDA (kernel.cu) для использования этой библиотеки из внешней программы на языке Си. После нескольких попыток я просто оставил простую функцию C в файле. cu. Код следующий: Kernel.cu #include <stdio.h> #include "kernel.h" void hello(const char *s) { printf("Hello %sn", s); }/* Ядро.h #ifndef KERNEL_H #define KERNEL_H #include "cuda_runtime.h" #include "device_launch_parameters.h" #ifdef __cplusplus extern "C" { #endif void __declspec(dllexpo ...

Как получить версию cuda?

есть ли быстрая команда или скрипт для проверки версии установленного CUDA? Я нашел руководство 4.0 в каталоге установки, но не уверен, является ли фактическая установленная версия таковой или нет. ...

Использование GPU из контейнера docker?

Я ищу способ использовать GPU изнутри контейнера docker. контейнер будет выполнить произвольный код, поэтому я не хочу использовать привилегированный режим. какие-либо советы? из предыдущих исследований я понял, что run -v и / или LXC cgroup был способ пойти, но я не уверен, как именно это сделать ...

НВИДИА против АМД: производительность графических процессоров

Я хотел бы услышать от людей с опытом кодирования для обоих. Лично у меня есть только опыт работы с NVIDIA. NVIDIA CUDA кажется гораздо более популярным, чем конкуренция. (Просто подсчитывая теги вопросов на этом форуме, "cuda" превосходит "opencl" 3:1, а "nvidia" превосходит " ati "15:1, и вообще нет тега для "ati-stream"). с другой стороны, согласно Википедии, карты ATI/AMD должны иметь гораздо больший потенциал, особенно за доллар. Этот самая быстрая карта NVIDIA на рынке на сегодняшний де ...

Несоответствие версии драйвера NVIDIA NVML / библиотеки

когда я запускаю nvidia-smi Я получаю следующее сообщение: Failed to initialize NVML: Driver/library version mismatch час назад я получил то же сообщение и удалил свою библиотеку cuda, и я смог запустить nvidia-smi, получаем следующий результат: после этого я скачал cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb С официальная страница NVIDIA а потом просто: sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb sudo apt-get update sudo apt-get install cuda export PATH=/ ...

Эмулятор GPU для программирования CUDA без аппаратного обеспечения

вопрос: есть ли эмулятор для карты Geforce, который позволит мне программировать и тестировать CUDA без фактического оборудования? Info: Я хочу ускорить несколько моих симуляций в CUDA, но моя проблема в том, что я не всегда нахожусь на своем рабочем столе для этой разработки. Я хотел бы сделать некоторую работу на моем нетбуке вместо этого, но мой нетбук не имеет GPU. Теперь, насколько я знаю, вам нужен CUDA способный GPU для запуска CUDA. Есть как обойти это? Казалось бы, единственный спосо ...

Что такое конфликт? (Выполнение программирования Cuda / OpenCL)

Я читал руководство по программированию для CUDA и OpenCL, и я не могу понять, что такое банковский конфликт. Они просто погружаются в то, как решить проблему, не вдаваясь в подробности самой темы. Кто-нибудь может помочь мне понять это? У меня нет предпочтений, если помощь находится в контексте CUDA/OpenCL или просто банковских конфликтов в целом в информатике. ...

Как выбрать размеры сетки и блока для ядер CUDA?

это вопрос о том, как определить размеры сетки, блока и потока CUDA. Это дополнительный вопрос к тому, который размещен здесь: https://stackoverflow.com/a/5643838/1292251 по этой ссылке ответ от talonmies содержит фрагмент кода (см. ниже). Я не понимаю комментарий "значение, обычно выбираемое настройкой и аппаратными ограничениями". Я не нашел хорошего объяснения или разъяснения того, что объясняет это в Документация CUDA. Таким образом, мой вопрос заключается в том, как определить оптимальны ...

Могу ли я запустить CUDA на интегрированном графическом процессоре Intel?

У меня есть очень простой ноутбук Toshiba с процессором i3. Кроме того, у меня нет никакой дорогой видеокарты. В настройках дисплея я вижу Intel(HD) Graphics как видеоадаптер. Я планирую изучить программирование cuda. Но я не уверен, могу ли я сделать это на своем ноутбуке, поскольку у него нет графического процессора nvidia CUDA. на самом деле, я сомневаюсь, если у меня даже есть GPU o_o Так что, я был бы признателен, если кто-то может сказать мне, если я могу сделать CUDA Программирование с ...