#70: Карпаты о Tesla Autopilot на CVPR’21, перерыве Distill и болтовне о фламандских скроллерах…

Всем привет, добро пожаловать в Dynamicly Typed #70. В сегодняшнем выпуске я резюмировал выступление Андрея Карпати об обновлениях системы автопилота Tesla на CVPR ’21. Далее в разделе о продуктах искусственного интеллекта у меня есть ссылки на приложение для обнаружения LEGO и методологию автоматизированного проектирования микросхем, используемую для разработки TPU последнего поколения Google. Что касается исследований в области машинного обучения, я написал об годичном перерыве Distill и открытии исходного кода модели AlphaFold DeepMind. Наконец, что касается искусственного интеллекта, связанного с изменением климата, я освещал запуск CCAI Wiki, а в качестве интересных вещей я нашел проект, который сплетничает о фламандских политиках за то, что они смотрят в свои телефоны во время дебатов. Счастливое воскресенье!

Произведенный искусственный интеллект 🔌

Карпаты на Tesla Autopilot на CVPR ‘21

Глава отдела искусственного интеллекта Tesla Андрей Карпати выступил с основным докладом на семинаре CVPR 2021 по автономному вождению, рассказав об обновлениях системы автономного вождения компании Autopilot. Как и его выступление в прошлом году на Scaled ML 2020, это были отличные часы, если вы заинтересованы в искусственном интеллекте. Разговор начинается с ценности, которую дополнительная автономия уже обеспечивает сегодня, в виде автоматического экстренного торможения, предупреждений управления дорожным движением (впереди красный свет!) и предотвращения неправильного нажатия педали (PMM) — остановки водителя. от пола, когда они собирались ударить по тормозам.

Затем Карпати подробно рассказывает о следующем поколении автопилота: Tesla «удалила» радарный датчик из последних новых автомобилей и теперь полагается только на зрение. «Если наша [человеческая] нейронная сеть может определять глубину и скорость, могут ли это делать и синтетические нейронные сети? Внутри [в Tesla] наш ответ — однозначное «да». Это подтверждается тем фактом, что новый подход к автопилоту, основанный только на зрении, имеет более высокую точность и отзыва, чем предыдущий подход слияния датчиков.

Откуда команда Autopilot получает достаточно большой и разнообразный набор данных для обучения такой модели машинного зрения? Разумеется, из миллионного автопарка! В настоящее время в автопарке Tesla работает 221 триггер, реализованный вручную, для обнаружения сценариев, которые они могут захотеть просмотреть для получения обучающих данных. (Может ли неактивный светофор в кузове движущегося грузовика быть 222-м?) После сбора эти изображения помечаются как автономные с помощью комбинации человеческих аннотаторов, старых радарных датчиков и очень больших нейронных сетей — что было бы слишком медленно развертываются в автомобилях, но очень полезны в этой автономной обстановке.

Таким образом, цикл Tesla Data Engine выглядит следующим образом: (1) развертывание моделей в фантомном режиме; (2) наблюдать за их предсказаниями; (3) тонкая настройка триггеров для сбора новых обучающих данных; (4) создавать новые модульные тесты из неверных прогнозов; (5) добавить аналогичные примеры в набор данных; (6) переподготовка; и повторить. Окончательный набор данных для этого первого выпуска новой системы Autopilot объемом 1,5 петабайта семь раз прошел этот цикл теневого режима. Он содержит шесть миллиардов помеченных объектов в одном миллионе 10-секундных видеороликов.

Нейронная сеть, обученная на этих данных, имеет основу ResNet для базовой обработки изображений, которая разветвляется на «головы», затем «стволы» и затем «конечные» детекторы. Это амортизирует обучение на разных уровнях и позволяет нескольким инженерам сначала работать над разными головками параллельно, а затем синхронизироваться для переобучения магистральной сети. Я раньше не слышал об этой структуре, позволяющей большой команде (около 50 человек) работать над одной большой нейронной сетью — очень круто.

И, наконец, что касается развертывания, Tesla теперь также вертикально интегрирована: они создали свой собственный компьютер FSD («Полное самостоятельное вождение») со своим собственным нейронным движком.

Карпати сделал новый акцент на автоматическую маркировку: использование гораздо более тяжелой модели, чем вы когда-либо могли использовать в производстве, для выполнения (первой попытки) маркировки данных в автономном режиме, а затем человек немного очищает ее, это очень мощно. И его общий вывод остался в соответствии с общей позицией Теслы в отношении самостоятельного вождения: нет автопарка, нет движения.

Быстрые ссылки на искусственный интеллект 🔌

🧱 Brickit — это приложение для iOS, которое использует компьютерное зрение для идентификации кубиков LEGO в большой куче, а затем показывает вам список проектов, которые вы можете построить из этих кубиков — с инструкциями! Самое впечатляющее то, что он может обнаруживать так много мелких объектов столь разных классов на одном снимке. Я предполагаю, что он делает это, разбивая изображение или перемещая окно по фотографии, а затем пропуская меньшие изображения через какую-то пользовательскую модель, основанную на Core ML и нейронном движке iPhone; но я не могу найти много информации о том, как именно работает приложение. Brickit — отличный пример искусственного интеллекта: его основная функциональность обеспечивается очень сложным машинным обучением, но он абстрагируется от этого в простой пользовательский интерфейс.
🖥 Исследователи искусственного интеллекта Google Азалия Мирхосейни и Анна Голди опубликовали статью в журнале Nature о своей методологии проектирования компьютерных чипов на основе ИИ, в которой используется архитектура сверточной нейронной сети на основе граничного графа, способная изучать богатые и переносимые представления чипа. Этот метод, обученный на наборе данных из 10 000 планов этажей, заменяет месяцы интенсивных усилий для людей и дает более оптимальный конечный результат. Я освещал это исследование, когда оно впервые появилось в апреле 2020 года, но теперь большая новость заключается в том, что оно было запущено в производство: Мирхосейни и Голди использовали его для разработки следующего поколения тензорных процессоров Google (TPU)!

Исследования в области машинного обучения 🎛

⏸ Distill, моя, любимая, машина, обучение, журнал, уходит в отпуск. Может быть, я сглазил в прошлом месяце, когда надеялся, что основание Anthropic, новой исследовательской компании по безопасности ИИ, основанной многими людьми из Distill, не повлияет на их работу над журналом. Упс. За последние пять лет новшества Distill, заключающиеся в том, чтобы быть доступным только для Интернета — не принуждать статьи вписываться в двухколоночные статические PDF-файлы — и явно заботиться о публикации объяснителей и артефактов, вывели объяснимость ИИ на совершенно новый уровень. Я буду очень скучать по этой ленте тщательно отполированных интерактивных статей, но я также понимаю решение редакционной группы: они обнаружили, что их наставничество, шаблон статьи, сообщество и преданные авторы были более важными для превосходного качества работы над Distill. , чем то, что Distill является собственным журналом. Они думают, что будущее статей в стиле Distill — это самостоятельная публикация либо на разовых веб-сайтах, либо на гипотетическом «Distill Arxiv. соображения — выгорание волонтеров тоже сыграло свою роль.
🧬 AlphaFold, нейронная сеть свертывания белков DeepMind, которая представила собой прорыв в структурной биологии, теперь доступна с открытым исходным кодом. Документ модели Высокоточное предсказание структуры белка с помощью AlphaFold, автор Jumper et al. (2021) опубликован в Nature; код находится на GitHub по адресу deepmind/alphafold. Многие в сообществе просили об этом.

Искусственный интеллект для климатического кризиса 🌍

🌍 Теперь есть Climate Change AI Wiki. В нем есть разделы, посвященные климату + исследованиям машинного обучения в области смягчения последствий, адаптации, науки о климате и инструментов для действий. Некоторые из моих любимых страниц на данный момент — это страницы, посвященные системам электроснабжения, транспорту, лесному хозяйству и другому землепользованию и прогнозу погоды. Хороший сайт в закладки!

Классные вещи ✨

👀 Бельгийский художник Dries Depoorter запустил проект под названием The Flemish Scrollers, который смотрит ежедневные прямые трансляции фламандского парламента и использует компьютерное зрение, чтобы определять, когда бельгийские политики смотрят в свой телефон, а не обращают на них внимание. Всякий раз, когда это происходит, @FlemishScroller болтает в Твиттере, публикуя в Твиттере видеоклип и отмечая отвлеченных политиков. Очень забавно!

Спасибо за прочтение! Если вам понравился этот выпуск Dynamically Typed, рассмотрите возможность подписаться, чтобы получать новый выпуск прямо на ваш почтовый ящик каждое второе воскресенье.

Первоначально опубликовано 18 июля 2021 г. на странице https://dynamicallytyped.com.

#70: Карпаты о Tesla Autopilot на CVPR’21, перерыве Distill и болтовне о фламандских скроллерах…

Произведенный искусственный интеллект 🔌

Исследования в области машинного обучения 🎛

Искусственный интеллект для климатического кризиса 🌍

Классные вещи ✨

Похожие вопросы