Antes da chegada das GeForce RTX 20, a NVIDIA lançaria a primeira geração de Tensor Cores com a arquitetura Volta em 2017. Inicialmente disponível somente em GPUs profissionais, os núcleos voltados para o processamento de Inteligência Artificial passaram a ser acessíveis pela massa a partir de setembro de 2018 com a chegada das GPUs Turing.

  • Comparativo entre placas da linha NVIDIA GeForce RTX
  • História das GPUs NVIDIA GeForce RTX e seu impacto no mercado

Esse momento marca uma grande mudança na tradicional série GPUs da NVIDIA, iniciando o encerramento da linha GeForce GTX. Uma das maiores mudanças com as RTX é adição dos núcleos Tensor, entre outras novidades como os núcleos voltados para o processamento de ray tracing.

O que são e como funcionam os Tensor Cores?

Em poucas palavras, os Tensor Cores são núcleos responsáveis por processamento (ou aceleração) e treinamento de diferentes modelos de IA generativa. A NVIDIA define a tecnologia da seguinte forma:


Entre no Canal do WhatsApp do e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

“Os Núcleos Tensor permitem computação de precisão mista, adaptando cálculos dinamicamente para acelerar o rendimento, preservando a precisão e fornecendo segurança aprimorada”.

As GeForce RTX 50 contam com a última geração de Tensor Cores (Imagem: NVIDIA/Divulgação)

Com suporte a precisões FP8, FP16 e TF32, os Tensor Cores conseguem acelerar o treinamento de IA com trilhões de parâmetros que poderiam demorar vários meses em um tempo reduzido e de forma mais eficiente, além de entregar resultados mais precisos.

Atualmente, os núcleos Tensor estão na 5ª geração através da arquitetura Blackwell, que já havia estreado em GPUs de alto desempenho para data centers e agora chegou à linha GeForce RTX 50. A NVIDIA promete um salto de 45x na aceleração de IA em relação à geração anterior, Hopper.

Aplicações dos Tensor Cores

Essa tecnologia é totalmente voltada para IA e não existe outro uso para ela. Mas dentro de suas capacidades, diversas aplicações se beneficiam dessa aceleração.

Deep Learning e IA em geral

Os Tensor Cores são essenciais em Deep Learning em complexas redes neurais, presentes em grandes servidores, através de inferência em diversos modelos de linguagens. Isso acontece com o DLSS, suite de upscaling, entre outros recursos, que usam os resultados obtidos com o treinamento de IA intensivo, aperfeiçoando a qualidade do trabalho cada vez mais.

Além disso, esses núcleos também são voltados para a aceleração de IA em geral. Um exemplo prático é através de aplicações como ChatGPT com texto ou qualquer outro que gere imagens através de comandos, como o próprio Copilot da Microsoft. A tecnologia da NVIDIA é usada para acelerar o processamento nessas situações.

Ray Tracing

Apesar das placas de vídeo da NVIDIA terem núcleos específicos para o processamento de ray tracing, os Tensor Cores entram em ação em situações bem específicas. A partir do DLSS 3.7, a NVIDIA lançou a tecnologia Ray Reconstruction. Através de IA, é possível melhorar a qualidade de imagem com ray tracing.

Esse recurso é melhorado constantemente, assim como o upscaling e o gerador de quadros, features que também usam IA. Por isso, os núcleos Tensor são necessários para usufruir desse benefício. É válido ressaltar que isso está disponível para qualquer GPU GeForce RTX.

Um exemplo da implementação de Ray tracing em um jogo (Imagem: NVIDIA/Divulgação)

DLSS

Quase todos os recursos presentes nesse pacote fazem uso de IA. Seja o upscaling, gerador de quadros, ray reconstruction e DLAA (Anti-Aliasing por IA), todos eles fazem uso dos Tensor Cores. Quanto mais moderna a geração desses núcleos, mais desempenho entrega.

Segundo a NVIDIA, esse recurso usado por PC gamers donos de GPUs GeForce RTX é constantemente aprimorado, todos os dias sem parar, já há 6 anos, através das melhores GPUs que a NVIDIA dispõe para IA. Tudo isso dentro da rede neural focada para esse recurso.

Placas de vídeo NVIDIA com Tensor Cores

A NVIDIA dispõe de diferentes placas profissionais equipados com Tensor Cores, como já mencionado aqui. Abaixo você pode conferir todas as séries de placas de vídeo da linha GeForce RTX com esses núcleos. Lembrando que as equivalentes mobile também oferecem a tecnologia. Alguns SKUs são exclusivos de notebooks, como as RTX 2050 e 4050.

Série de GPUs Arquitetura
GeForce RTX 20 Turing
2ª geração de Tensor Cores
GeForce RTX 30 Ampere
3ª geração de Tensor Cores
GeForce RTX 40 Ada Lovelace
4ª geração de Tensor Cores
GeForce RTX 50 Blackwell
5ª geração de Tensor Cores

Tensor Cores vs CUDA Cores: quais são as diferenças?

Os CUDA Cores existem desde 2006 nas GPUs da NVIDIA. Esses núcleos têm como principal objetivo a computação paralela em geral, de qualquer aplicação que faça uso otimizado dessa arquitetura, seja um software para edição de vídeo ou um jogo. Ou seja, seu uso é amplo, capaz até mesmo de processar IA, embora de forma menos eficiente.

A RTX 5080 é a segunda GPU mais forte do lineup Blackwell (Foto: Brenno Barreira/CanalTech)

Já os núcleos Tensor, como já abordado aqui, são voltados para inferência e aceleração de IA de forma totalmente otimizada, entregando o melhor resultado de forma eficiente. Na verdade, esses núcleos não têm outro uso a não ser esse.

Conclusão

A capacidade dos Tensor Cores em lidarem com IA tem sido o maior ponto de marketing da NVIDIA nos últimos anos. Isso tem ficado cada vez mais forte na linha GeForce RTX para jogos, sendo esse recurso o principal quando falamos em evolução geracional de GPUs. Um exemplo claro e recente é o quanto a as RTX 50 evoluíram sobre as RTX 40. Em poder bruto, pouca coisa, mas quando consideramos a performance com IA, a evolução é considerável.

Isso acontece porque o Time Verde tem investido todos os seus esforços em aprimorar os núcleos Tensor a cada nova geração GPUs, trazendo grandes saltos em desempenho com IA em diferentes segmentos, como data centers, o principal deles para a empresa. Graças a isso e as otimizações a nível de software, ela tem se tornado a maior empresa do mundo em qualquer indústria existente.

Veja mais do CTUP:

  • O que é um transistor RibbonFET?
  • O que é VPU, o cérebro por trás da visão computacional?
  • 5 melhores placas de vídeo AMD Radeon para diferentes perfis de uso

Leia mais matérias no ItechNews .