May 13th, 2019

2017

Мое интервью для StorageNews на Skolkovo Robotics & AI

Интервью в StorageNews: Микросхемы нового поколения для ускорения вычислений нейросетей
(Интерью с Юрием Панчулом – старшим инженером по проектированию интегральных схем для ускорения вычислений нейросетей стартапа Кремниевой Долины компании Wave Computing )



SN. Чем занимается ваша компания и с чем вы едете на форум Skolkovo Robotics 2019 в «Сколково?

Ю.П. В «Сколково» я презентую наш проект Triton, который представляет собой комбинацию трех типов вычислительных устройств для ускорения вычислений нейросетей:


  • первый тип – кластер из классических процессоров общего назначения;

  • второй – процессор потоков данных (dataflow processor) на основании архитектуры крупнозернистого реконфигурируемого массива CGRA (Coarse Grained Reconfigurable Array);

  • третий тип – матричный умножитель на основе систолического массива из умножителей-сумматоров (multiply-add). Эти устройства представляют собой три разных способа организации вычислений с разным балансом гибкости и производительности.



Если говорить о них подробнее, то классические процессоры – самые гибкие. Они могут вычислить все множество нейросетей, определяемых стандартами типа TensorFlow и ONNX.

Процессоры потоков данных могут вычислять в 10 раз быстрее, чем кластеры классических процессоров, но накладывают ограничения на типы узлов нейросети. При этом они могут вычислять многое из того, что не могут вычислять матричные ускорители, например, необычные активационные функции (activation function).

Матричные умножители ориентированы на вычисления узкого подмножества и ориентированы на сверточные сети (CNN – Convolutional neural network). Зато они вычисляют по порядку в 10 раз быстрее, чем процессоры потоков данных, и в 100 раз быстрее, чем кластеры из процессоров общего назначения.

Если мерить по плотности производительности (по количеству операций, которые можно выполнить на структуре размеров в один квадратный миллиметр микросхемы), то процессоры потоков данных на порядок больше по вычислительной плотности, чем классические. А матричные на порядок больше по вычислительной плотности, чем процессоры потоков данных.

Collapse )

Презентации:


  1. Triton AI Platform

  2. Current MIPS core offering

  3. MIPS Open