FPGA Stratix 10 NX da INTEL otimizada para IA

A matriz da FPGA Stratix 10 NX INTEL inclui um novo tipo de bloco aritmético tensor otimizado para IA, denominado AI Tensor Block.

FPGA Stratix 10 NX da INTEL otimizada para IA

Autor do post:Franciele Nornberg
Post publicado:janeiro 7, 2021
Categoria do post:Fabricantes / Indústria 4.0 / Inteligência Artificial / Semicondutores

Compartilhe

A FPGA Stratix® 10 NX da INTEL foi desenvolvida para que os clientes pudessem dimensionar seus projetos com crescente complexidade de Inteligência Artificial ( IA), enquanto continuam a fornecer resultados em tempo real.

Os modelos de Inteligência Artificial (IA) têm crescido em complexidade e tamanho.

Eles estão ultrapassando rapidamente as inovações em recursos de computação e capacidade de memória disponível em um único dispositivo.

A complexidade do modelo de IA agora dobra a cada 3,5 meses ou cerca de 10 vezes por ano, gerando uma demanda cada vez maior na capacidade de computação de IA.

Desta forma, os requisitos de memória para modelos de IA também estão aumentando devido a um número crescente de parâmetros ou pesos em um modelo.

A FPGA Stratix® 10 NX é a primeira FPGA otimizada para IA da Intel.

Ela foi desenvolvida para permitir que os clientes dimensionem seus projetos com crescente complexidade de IA, enquanto continuam a fornecer resultados em tempo real.

A matriz da FPGA Stratix 10 NX INTEL inclui um novo tipo de bloco aritmético tensor otimizado para IA, denominado AI Tensor Block.

AI Tensor Block

Os blocos são ajustados para as multiplicações matriciais ou vetoriais comuns usadas para cálculos de IA.

Eles contêm matrizes densas de multiplicadores de baixa precisão normalmente usados para aritmética de modelo de IA.

Assim, para construir multiplicadores de maior precisão são agregados os multiplicadores menores.

A arquitetura do AI Tensor Block contém três unidades de produto escalar. Cada unidade possui dez multiplicadores e dez acumuladores para um total de 30 multiplicadores e 30 acumuladores dentro de cada bloco.

As precisões de base dos multiplicadores de bloco tensor IA são INT8 e INT4 juntamente com o expoente compartilhado para suportar os formatos numéricos de Bloco Ponto Flutuante de 16 (Bloco FP16) e Bloco Ponto Flutuante de 12 (Bloco FP12).

Sendo assim, para oferecer suporte a cálculos de vetores maiores, vários blocos tensor IA podem ser colocados em cascata.

O White Paper intitulado “Pushing AI Boundaries with Scalable Compute-Focused FPGAs” cobre os novos recursos e capacidades de desempenho dos FPGAs Intel Stratix 10 NX.

Veja a FPGA Intel Stratix 10 NX em ação, no artigo:

“WaveNet Neural Network roda em Intel® Stratix® 10 NX FPGA, sintetiza 256 fluxos de áudio de 16 kHz em tempo real”.

Compartilhe

Franciele Nornberg

Mestre em Engenharia Elétrica pela UFSC (2019), graduada em Engenharia Elétrica pelo IFSul em 2017. Trabalha na Macnica DHW desde 2019. Seu conhecimento técnico somado a utilização das boas práticas de copywriter são responsáveis pelos excelentes conteúdos divulgados no blog da Macnica. Franciele é também Instrutora Autorizada FPGA Intel e portanto, responsável pelo Treinamento FPGA Intel.

Semicondutores

Soluções IoT & AI

Cases

Treinamento FPGA