viernes, 24 de mayo de 2019

Arquitecturas y Funcionamiento de las tajetas graficas en Smarphones y computadores

Arquitecturas de las tarjetas graficas en Smarphones

Junto al procesador , ya sea un Snapdragon, mediatek, Kirin o Exynos, nos encontramos con una GPU integrada que normalmente lleva el nombre Adreno o Mali,Estas suelen ser mas mas utilizadas en los smarphones a dia de hoy.

GPU Mali

La arquitectura de Midgard

 Lo que estamos viendo aquí es un solo núcleo de sombreado de Midgard, que a pesar del nombre de "sombreador" en realidad contiene mucho más. Un núcleo de sombreado en este contexto contiene el núcleo de sombreado real dentro de uno de los bloques de sombreado "tri pipe" de Midgard, pero también contiene una unidad de configuración de triángulos, rasterizador, hardware de Z y stencil, un ROP / blender, hardware de mosaico y un creador de hilo de cálculo Específicamente para alimentar un tri pipe con cargas de trabajo de cómputo.


Midgard, y Mali-T760 en particular en nuestro caso, está diseñado para aumentar y disminuir el rendimiento y el tamaño en base a estos núcleos de sombreado. Si bien contienen una gran parte del hardware para una GPU, no tienen una GPU completa por sí solos. En su lugar, están diseñados para ser distribuidos en múltiplos y luego alimentados por una colección de hardware de apoyo para hacer una GPU completa. Esta combinación de hardware compartido y conteos de núcleos escalables permite que los diseños de Midgard puedan escalar desde núcleos simples hasta 16 núcleos en la configuración más grande de Mali-T760MP16



El hardware compartido en Midgard se ocupa principalmente de administrar la interacción de los núcleos de sombreado, y luego proporciona el caché L2 y todas las demás interfaces de memoria para acceder a la memoria principal y / o al caché de la CPU. En el caso de Mali-T760 hay 1 unidad de administración de tareas y unidad de administración de memoria, pero 2 conjuntos de caché L2 y la interfaz AMBA que conecta la GPU con el resto del sistema.

Saltando de vuelta al núcleo mismo, hablemos un poco sobre el tri pipe. Discutiremos la ejecución aritmética y de subprocesos en la página siguiente, pero desde un alto nivel, un tri pipe está compuesto por uno o más bloques ALU, una unidad de carga / almacenamiento y una unidad de textura. Desde un alto nivel, la inclusión de ALU, carga / almacenamiento y texturización en un solo bloque es bastante típica de una GPU. Sin embargo, el número variable de bloques ALU es poco común para una GPU. Muchos diseños de GPU mantienen la misma estructura y replican lo que equivale al tri pipe, en lugar de variar el número de unidades en el tri pipe.




Dicho todo entonces, Midgard implementa una serie de trucos para reducir el consumo de energía. Cada optimización de renderización de la que hemos hablado hasta ahora es una optimización de potencia, pero además de eso, Midgard implementa la sincronización de reloj y la compuerta de potencia de grano fino para apagar el uso de energía (o al menos reducirla) para cada bloque inactivo según la situación. permite. Cada núcleo de sombreado se asienta en su propio dominio de energía, lo que permite que los núcleos se apaguen en el caso de cargas de trabajo ligeras.

Incluso dentro de esos núcleos de sombreado, los diversos bloques se pueden sincronizar para reducir su consumo de energía. Dentro de la unidad aritmética de Midgard, las unidades escalares y vectoriales se pueden sincronizar por separado, hasta las líneas SIMD individuales de la propia unidad vectorial.

En última instancia, solo hay mucho que puede hacer ARM para reducir el uso de energía cuando se necesita un bloque. En esos casos, ARM se basa en lograr un equilibrio entre las velocidades de reloj (relativamente hambrientas de poder) y las GPU amplias, y utilizar tecnologías de rechazo de la carga de trabajo para hacer lo que puedan (y veremos un par de más en un momento). Pero en lugar de la capacidad de reducir aún más el consumo de energía bajo carga, ARM le da a los bloques de Midgard la oportunidad de descansar siempre que pueden.

 GPU Adreno

 

 

 

 


Arquitectura de Nvidia Pascal vs AMD Polaris GPU


Como sabemos, NVIDIA y AMD son los dos principales fabricantes de GPU en el mundo. La última arquitectura de GPU de Nvidia es Pascal, mientras que AMD tiene la arquitectura Polaris en sus últimas tarjetas gráficas de la serie Radeon RX 400.

 

NVIDIA Pascal GPU Arquitectura


NVIDIA Pascal es la arquitectura GPU más reciente y avanzada que se utiliza en las tarjetas gráficas actuales de la serie GeForce GTX 10. El proceso de fabricación utilizado es de 16 nm y la arquitectura lleva el nombre del matemático francés Blaise Pascal. 
Diagrama de Pascal GPU Architecture.

Pascal es el sucesor de la arquitectura Maxwell que se utilizó en la serie GeForce 900, 800M y en los últimos modelos de las tarjetas gráficas de la serie 700. Cada nueva arquitectura de GPU tiene algunas mejoras sobre las antiguas y Pascal aquí no es una excepción. Pascal es una arquitectura GPU muy avanzada que se ha creado utilizando el último y ultrarrápido FinFET. FinFET o Fin Field Effect Transistor es un transistor especial no plano o 3D que se utiliza en el diseño de procesadores modernos. Los núcleos del procesador en Nvidia GeForce Architecture se denominan CUDA Cores. Los chips de GPU utilizados son GP100, GP102, GP104, GP106, GP107 y GP108.

Pascal también cuenta con las tecnologías NVIDIA GameWorks para un juego más suave y experiencias cinematográficas. También incluye la nueva captura de imágenes de 360 ​​grados y la compatibilidad con G-Sync. El sucesor de la arquitectura de la GPU de Pascal es Volta y se utiliza en las tarjetas gráficas de juegos y estaciones de trabajo de Nvidia.

Características de la Arquitectura Pascal  

Eficiencia energética: Pascal le ofrece el mejor rendimiento de juego con un menor consumo de energía. Las tarjetas gráficas de la serie GeForce 10 tienen un menor consumo de energía y menos generación de calor en comparación con las tarjetas gráficas nvidia más antiguas y sus homólogos de AMD.

Listo para VR: es totalmente compatible con VR y le brinda la mejor experiencia de realidad virtual en las tarjetas gráficas de la serie GeForce 10.

Compatibilidad con DirectX 12: es totalmente compatible con la última API de DirectX 12 y proporciona un notable aumento de rendimiento en los últimos juegos de DirectX 12.

Compatibilidad con memoria más rápida: junto con GDDR5, Pascal es compatible con la última memoria GDDR5X que, en teoría, es dos veces más rápida que GDDR5. El soporte para GDDR5X se encuentra solo en las tarjetas gráficas de gama más alta, como GTX 1080 y GTX 1080 Ti .

Arquitectura AMD Polaris GPU

Polaris es la última arquitectura de GPU utilizada en las últimas tarjetas gráficas de la serie AMD RX 400. Polaris combina el conjunto de instrucciones gráficas Graphics Core Next (GCN) de cuarta generación, la última tecnología de proceso FinFET de 14nm y la innumerable tecnología de administración de energía patentada de AMD. Los núcleos de los procesadores en la arquitectura AMD se denominan Stream Processors.




Las tarjetas gráficas AMD basadas en la arquitectura Polaris se ejecutan de manera fresca y silenciosa, además de proporcionar el máximo rendimiento. El consumo de energía de las tarjetas gráficas basadas en Polaris de AMD es significativamente menor que las que no son Polaris. AMD Polaris es compatible con FreeSync y el sucesor de Polaris es la arquitectura Vega GPU.

Características de la arquitectura GPU Polaris

VR Ready: la nueva arquitectura de Polaris GPU le brinda una experiencia de VR sin problemas, sin retrasos ni contratiempos.

Compatibilidad con Directx12: es totalmente compatible con la última versión de DirectX, que es DirectX 12.

Compatibilidad con Vulkan: Polaris es totalmente compatible con Vulkan, que es una API de gráficos de nueva generación y se utiliza en juegos modernos como DOOM.

Compatibilidad con HDR: AMD Polaris es compatible con la tecnología HDR o High Dynamic Range para proporcionar imágenes realistas en su monitor.


Comparación de la arquitectura de la GPU Pascal y Polaris

ArquitecturaNvidia PascalAMD Polaris
FabricanteNVIDIAAMD
GPU compatibleSerie GTX 10Serie Radeon RX 400
Proceso de fabricación14nm, 16nm14nm
Soporte de memoriaGDDR5, GDDR5XGDDR5
Soporte VR
Soporte de HDMIHDMI 2.0bHDMI 2.0b
DirectX 12
Apoyo de VulkanMaloBueno
Soporte de DisplayPortDisplayPort 1.4DisplayPort 1.3
PredecesorMaxwellGCN
SucesorVoltaVega

No hay comentarios:

Publicar un comentario