ГЛАВНАЯ   НОВОСТИ   СМАРТФОНЫ И ПЛАНШЕТЫ   НОУТБУКИ И ПК   ФОТОТЕХНИКА   ГАДЖЕТЫ   ИГРЫ И ПРИЛОЖЕНИЯ   ИНТЕРНЕТ
© d-devices.ru
Цифровые устройства и популярные гаджеты
Powered by
Aleks WebStudio
26.06.2017   Тензорный процессор положил на лопатки традиционные чипы
   Несколько лет назад в Google подсчитали, что, если все пользователи начнут по две-три минуты в день нагружать сервисы компании для распознавания речи, то ей может понадобиться вдвое больше ЦОДов.  Однако, вместо того чтобы расширять площадь помещений и устанавливать новые серверы, в Google решили спроектировать специализированное оборудование для задач машинного обучения. Так появился т.н. "тензорный процессор" (Tensor Processing Unit, TPU), чип, ускоряющий работу нейронных сетей, на котором происходит вывод умозаключений. Не так давно Google опубликовала доклад о преимуществах TPU по сравнению с центральными и графическими процессорами.
   Тензорный процессор имеет вид специализированной интегральной схемы - чипа, созданного для конкретной задачи и со своим набором инструкций. При этом  тензорные процессоры обладают достаточной гибкостью, и поэтому используемые модели машинного обучения можно менять.

   В среднем тензорный процессор в 15-30 раз быстрее выполняет задачи вывода умозаключений, чем традиционные серверные CPU и GPU.  Производительность в расчете на ватт у TPU в 25-80 раз выше, чем у центрального и графического чипов.

   Еще одна ключевая характеристика TPU - время отклика, которое у данного процессора гораздо меньше, чем у процессоров других типов. В Google особо подчеркивают, что системы машинного обучения должны выдавать ответы быстро, чтобы обеспечивать высокое качество обслуживания пользователей.

   Особенно хорошие результаты TPU демонстрируют с точки зрения энергоэффективности. Этот показатель намного увеличивает затраты, когда приходится использовать огромные массивы оборудования для обработки данных.

   Достигнутые результаты имеют большое значение для Google, поскольку компания в последнее время активно развивает средства машинного обучения.  В Google уже провели испытания своих процессоров на нескольких сервисах, в которых используется вывод умозаключений нейронными сетями, т.е. почти на всех приложениях такого типа, работающих в дата-центрах интернет-гиганта.

   Но и характеристики самого TPU можно улучшить. В частности, если использовать с ним память GDDR5, то можно было бы повысить быстродействие. Как следует из доклада Google, недостаточная пропускная способность памяти негативно сказалась на скорости ряда приложений во время тестирования.

   Кроме того, в Google выражают уверенность, что производительность можно было бы увеличить путем оптимизации программного обеспечения, в частности одной из сверточных нейронных сетей, носящей название CNN1.  Данные в искусственных нейронных сетях передаются по той же схеме, что и в головном мозге человека, а сверточные нейросети моделируют процесс обработки мозгом визуальной информации.

   Учитывая, что CNN1 сейчас работает на TPU в 70 с лишним раз быстрее, чем на центральном процессоре, разработчики вполне удовлетворены результатом. А потому неясно, будут ли проведены описанные оптимизации. 

   Google тестировала тензорные процессоры в сравнении с обычными CPU выпущенными приблизительно в то же время. Не исключено, что более новые чипы традиционной архитектуры могут, как минимум сократить отставание от TPU по производительности.