Introducción a Vultr Talon Cloud GPU

Una Unidad de procesamiento gráfico (GPU) es un hardware especializado inicialmente diseñado para gráficos por computadora y procesamiento de imágenes. Su estructura altamente paralela los hace más eficientes que las Unidades Centrales de Procesamiento (CPU) de uso general para algoritmos que procesan grandes bloques de datos en paralelo. Tradicionalmente, debe instalar un servidor local con una o más GPU para acceder a esta potencia. Esto es caro e inflexible, pero hay una alternativa.

Empezando

Si desea saltar directamente, vea el Vultr Talon Cloud GPU Quickstart, que explica cómo implementar un Cloud Aplicación GPU o GPU Compute Marketplace. NVIDIA también tiene un gran catálogo de contenedores de software modelos de IA preentrenados y Jupyter Notebooks listos para implementar en Vultr Cloud GPU para empezar.

Acerca de Vultr Talon

Trabajando en close En colaboración con NVIDIA, desarrollamos la plataforma Vultr Talon impulsada por NVIDIA GPU y NVIDIA IA empresarial software. En lugar de adjuntar una GPU física completa a un servidor en la nube, adjuntamos una fracción en forma de GPU virtual (vGPU) para crear un nuevo tipo de instancia: la Cloud GPU .

Cuando despliegas un Vultr Cloud Instancia de GPU, no hay problemas con la instalación del controlador o problemas de licencia. Puede omitir todos esos pasos y ejecutar una aplicación impulsada por GPU NVIDIA en minutos. Puede elegir una fracción de GPU para su carga de trabajo y presupuesto y luego escalarla hacia arriba o hacia abajo según sea necesario. Cloud Las GPU son ideales para una variedad de aplicaciones en la nube como aplicaciones de Big Data, Infraestructura de escritorio virtual (VDI), Aprendizaje automático (ML), Inteligencia artificial (IA), Computación de alto rendimiento (HPC), codificación de video, soluciones de juegos en la nube, general- computación de propósito con CUDA, renderizado de gráficos y más.

Cloud Las GPU son fáciles

Vultr preinstala todo lo que necesita para comenzar. Nuestro Cloud Las GPU vienen con controladores NVIDIA con licencia, el Kit de herramientas CUDA y Red neuronal profunda CUDA (cuDNN) biblioteca. Si desea un sistema operativo personalizado que no está en nuestra biblioteca, simplemente instálelo cloud-init y nosotros instalaremos automáticamente todos esos componentes por usted. Luego, siga los pasos en nuestro Cloud GPU Quickstart y, en un par de minutos, tendrá una Cloud Instancia de GPU lista para usar, con facturación por hora baja y sin compromisos a largo plazo.

Cloud Las GPU son asequibles

Las GPU dedicadas son costosas y, a menudo, infrautilizadas, pero puede usar Cloud GPU para hacer coincidir sus cargas de trabajo con la potencia de procesamiento que necesita, ahorrándole tiempo y dinero. Además, Cloud Las GPU vienen en fracciones asequibles que van desde 1/20 de una tarjeta hasta una totalmente dedicada GPU NVIDIA A100 . Nuestros servidores Bare Metal también admiten múltiples tarjetas para sus aplicaciones más exigentes.

Cloud Las GPU son ideales para entrenar modelos en subconjuntos más pequeños de sus datos y luego aumentar al máximo el rendimiento más adelante. Para examplepodría usar un escenario como este:

  1. Implementar un pequeño Cloud Instancia de GPU, luego adjunte un volumen de Block Storage con su conjunto de datos.
  2. Entrene una red neuronal en una parte de esos datos y guarde el modelo en Block Storage.
  3. Separe el Block Storage y destruya la pequeña instancia.
  4. Implementar un mayor Cloud GPU y adjunte el Block Storage. Luego, cargue el modelo guardado y procese el conjunto de datos completo.

Esta es una ventaja sobre las GPU dedicadas, que son costosas y, a menudo, infrautilizadas. Puedes usar Cloud GPU para hacer coincidir sus cargas de trabajo con la potencia de procesamiento requerida, ahorrándole tiempo y dinero. Ya no es necesario comprar, instalar y mantener sus propias GPU en las instalaciones.

Acerca de la virtualización de GPU

Tradicionalmente, las aplicaciones de GPU requieren un servidor local o un servidor en la nube con una GPU totalmente dedicada que se ejecuta en modo de transferencia. Lamentablemente, esas soluciones cuestan miles de dólares al mes. Vultr ofrece una alternativa: Cloud Instancias de GPU divididas en GPU virtuales (vGPU), lo que le permite elegir el nivel de rendimiento que coincida con su carga de trabajo y presupuesto. Las vGPU funcionan con NVIDIA AI Enterprise, que presenta su instancia de servidor con una vGPU que se parece a una GPU física. Cada vGPU tiene su propio segmento de memoria dedicado y una parte correspondiente de la potencia de cómputo de la GPU física. Las vGPU ejecutan todos los mismos marcos, bibliotecas y sistemas operativos que una GPU física.

Vultr ofrece dos tipos de partición vGPU: Partición temporal de vGPU y Partición espacial de GPU de múltiples instancias (MIG) .

  • Partición temporal de vGPU se realiza a través de software para entregar recursos de GPU rentables a las aplicaciones. está disponible en Cloud Planes de GPU con menos de 10 GB de GPU RAM.
  • Cloud Planes de GPU con GPU RAM de 10 GB y mayor aprovechamiento Partición espacial MIG para aislar por completo la memoria caché de gran ancho de banda y los núcleos vGPU. Esto permite que varias instancias de GPU se ejecuten en paralelo en una sola GPU NVIDIA A100 física.

Tipos de servidores GPU

Vultr ofrece ambos Cloud Opciones GPU y Bare Metal.

  • Cloud GPU los servidores están optimizados con recursos dedicados de vCPU y vGPU. Estos son ideales para aplicaciones informáticas de alto rendimiento, como codificación de video, juegos en la nube y representación de gráficos.
  • Metal básico Los servidores con GPU son hardware dedicado de un solo arrendatario para aplicaciones con los requisitos de rendimiento y seguridad más exigentes.

Nuestro Cloud Las GPU vienen en una variedad de configuraciones de memoria y cómputo.

vultr Cloud Modelos de GPU

Ofrecemos una selección de modelos de GPU con diferentes características.

NVIDIA A40

NVIDIA A40 acelera sus cargas de trabajo informáticas visuales más exigentes con los núcleos RT Core, Tensor Core y CUDA Core de arquitectura Ampere más recientes. Estos son ideales para VDI, codificación de video, soluciones de juegos en la nube, cargas de trabajo CUDA, ML e IA. Nuestro A40 Cloud Los servidores GPU cuentan con tecnología NVIDIA RTX de próxima generación para sus cargas de trabajo de visualización profesional más avanzadas.

Nuestros servidores equipados con A40 tienen:

  • Núcleos RT de segunda generación
  • Núcleos tensoriales de tercera generación
  • Arquitectura de amperios Núcleos CUDA

Para aplicaciones de VDI, renderizado, visualización y juegos en la nube, recomendamos nuestros servidores equipados con A40.

NVIDIA A100

NVIDIA A100 es la plataforma insignia para aprendizaje profundo, HPC, análisis de datos y HPC. Acelera más de 700 aplicaciones de HPC y todos los marcos de aprendizaje profundo, incluidos TensorFlow, PyTorch, MxNet, Theano y Apache Chispa – chispear. Nuestros servidores equipados con A100 tienen Tensor Cores de tercera generación y Ampere Architecture CUDA Cores. Debido a que el A100 está diseñado para potenciar las cargas de trabajo informáticas de IA y HPC, no incluye RT Cores para la aceleración del trazado de rayos y no está diseñado para aplicaciones VDI.

Nuestro A100 equipado Cloud Las GPU tienen CuDNN de NVIDIA biblioteca preinstalada para rutinas aceleradas por GPU, como convolución hacia adelante y hacia atrás, agrupación, normalización y capas de activación.

Casos de uso

vultr Cloud Los servidores de GPU son ideales para cualquier persona que necesite implementar y escalar aplicaciones impulsadas por GPU rápidamente. Aquí hay una descripción general rápida de algunas razones populares para usar un Vultr Cloud servidor GPU.

Aprendizaje automático e inteligencia artificial

Aprendizaje automático (ML) es un método poderoso para construir algoritmos de predicción a partir de grandes conjuntos de datos. Los algoritmos de predicción de ML impulsan las redes sociales, las tiendas en línea, los motores de búsqueda, los servicios de transmisión y las aplicaciones de seguridad de la información.

Inteligencia artificial (AI) permite que los sistemas inteligentes imiten funciones cognitivas como la toma de decisiones y el reconocimiento de voz. La IA utiliza grandes conjuntos de datos de entrenamiento para aprender a lograr un objetivo específico.

Una subcategoría de AI y ML es Visión por computador que entrena redes neuronales convolucionales (CNN) para reconocer objetos en imágenes. La visión por computadora es útil para la automatización de procesos, el cuidado de la salud, los automóviles autónomos, la clasificación de imágenes y más.

Cloud Las GPU aceleran las tareas de ML, AI y Computer Vision con marcos como:

  • TensorFlow : un marco de aprendizaje automático de código abierto y una biblioteca de aprendizaje profundo desarrollada por Google.
  • PyTorch : una biblioteca de aprendizaje automático de código abierto para Python desarrollada por FacebookEl laboratorio de investigación de IA de .
  • Teano : una biblioteca de Python de alto rendimiento para el cálculo de tensores, diseñada para que sea fácil de escribir y comprender.
  • Apache MXNet : un marco de aprendizaje profundo de código abierto que presenta una interfaz de desarrollo fácil de usar.
  • MATLAB : con solo unas pocas líneas de código MATLAB, puede incorporar el aprendizaje profundo en sus aplicaciones.

Grandes datos

Grandes datos extrae información significativa de conjuntos de datos grandes y complejos. Big data se caracteriza por las “tres V”: volumen, velocidad y variedad. Volumen generalmente se mide en terabytes, petabytes o incluso exabytes. Los datos se crean, leen, mueven y analizan a alta velocidad , como en las plataformas de redes sociales. Y consiste en un variedad de formatos de datos como fotos, video, audio y documentos complejos.

Las GPU ayudan a procesar big data con sistemas como:

  • Hadoop : una aplicación de procesamiento paralelo para grandes conjuntos de datos distribuidos en múltiples nodos.
  • Apache Chispa – chispear : Un rápido motor de procesamiento general multilingüe compatible con los datos de Hadoop.
  • Apache Tormenta : Un sistema de computación en tiempo real diseñado para flujos ilimitados de datos.

Codificación de vídeo

Las GPU pueden acelerar la codificación de video que consume muchos recursos, lo que convierte un formato de fuente de video original a otro formato adecuado para otros dispositivos, velocidades de bits o herramientas. Para examplepuede usar GPU con una herramienta como FFmpeg para convertir video sin procesar al formato H.264, que es el formato de video más utilizado para la web.

Informática de propósito general con CUDA

CUDA (Arquitectura de dispositivo unificado de computación) es una API diseñada para usar una GPU para computación de uso general, con lenguajes como C, C++ y Fortran. Para obtener más información sobre cómo usar CUDA con un Vultr Cloud GPU, consulte estos recursos en NVIDIA Developer Zone:

Procesamiento de gráficos y VDI

El procesamiento de gráficos es un caso de uso tradicional para las GPU. Los videojuegos, la realidad virtual, las aplicaciones geoespaciales como ArcGIS e incluso los entornos de escritorio modernos como Windows, Mac y Linux requieren soporte de GPU para un rendimiento aceptable.

Ray Tracing es una técnica para simular los efectos de la luz y los dispositivos emisores de luz en una escena. Este proceso computacionalmente intensivo simula la iluminación de la escena, los reflejos, las refracciones, las sombras y la iluminación indirecta. Es posible realizar el trazado de rayos en tiempo real con aceleración de GPU. Nuestros servidores equipados con A40 con RT Cores de segunda generación y Tensor Cores de tercera generación son ideales para el trazado de rayos.

Preguntas frecuentes

¿Cómo se asignan las vGPU?

Cuando despliegas un Cloud GPU, puede elegir la configuración de vGPU más rentable para su aplicación. Seleccione un tamaño que va desde 1/20 de una GPU física y 4 GB de RAM hasta la tarjeta GPU completa y 80 GB de RAM.

¿Puedo usar más de una GPU?

¡Sí! Tenemos planes Bare Metal con hasta 4 GPU. Póngase en contacto con nuestro equipo de ventas para implementar un servidor Bare Metal con más de una GPU.

¿Se comparten las vGPU?

No. Vultr dedica cada núcleo vGPU a su servidor en la nube; no se comparten con otros clientes. Su instancia nunca espera otros procesos. Sus cargas de trabajo pueden ejecutarse a máxima velocidad y eficiencia con el 100 % de su vGPU, todo el día, todos los días.

¿Necesito instalar controladores?

No, no es necesario instalar controladores. Vultr preinstala todo lo que necesita para comenzar. Nuestro Cloud Las GPU vienen con controladores NVIDIA con licencia, el Kit de herramientas CUDA y Red neuronal profunda CUDA (cuDNN) biblioteca. Si desea un sistema operativo personalizado que no está en nuestra biblioteca, simplemente instálelo cloud-init e instalaremos automáticamente todos los controladores y bibliotecas que necesita a través de los datos del proveedor de cloud-init.

¿Cómo empiezo?

Ver el Vultr Talon Cloud Guía de inicio rápido de GPU para comenzar.

Título del artículo Nombre (opcional) Correo electrónico (opcional) Descripción

Enviar sugerencia

Related Posts