Обновления SOTA с 29 августа по 4 сентября 2022 г.

  • Временная локализация действий
  • Поиск информации
  • Предсказание ссылок

Это сообщение представляет собой объединение ежедневных сообщений в Твиттере, отслеживающих изменения SOTA.

Для этих задач также доступен официальный выпуск кода (в большинстве случаев с предварительно обученными моделями)

‌‌#1 SOTA в локализации темпорального действия на наборе данных THUMOS’14

Статья: ActionFormer: Локализация моментов действий с помощью трансформеров

Отправлено 16 февраля 2022 г. (v1), последняя редакция — 28 августа 2022 г. (v2). Код обновлен 31 августа 2022 г.

Примечания. Эта модель сочетает в себе многомасштабное представление признаков с локальным вниманием к себе и использует облегченный декодер для классификации каждого момента времени и оценки соответствующих границ действия.

Код: Ссылка на Github

Название модели:ActionFormer (функции I3D)

Оценка (↑): 66,8 (предыдущая: 56,7)

Δ: 10,1 (показатель: mAP)

Ссылки на модели. Предварительно обученные модели на странице Github

Лицензия: лицензия MIT

Ссылка на демонстрационную страницу? Нет на сегодняшний день

Ссылка на Google Colab? Нет на сегодняшний день

Образ контейнера? Нет на сегодняшний день

№1 SOTA в поиске информации по набору данных CQADupStack

Статья: SGPT: встраивание предложений GPT для семантического поиска

Отправлено 17 февраля 2022 г. (v1), последняя редакция — 28 августа 2022 г. (v5). Код обновлен 31 августа 2022 г.

Примечания. Большие языковые модели плохо справляются с задачами встраивания подобия или семантического поиска. В этой статье предлагается подход к использованию больших языковых моделей для этих двух задач. Предлагаются две архитектуры — одна для вложений, а другая для семантического поиска.

Код: Ссылка на Github

Название модели:SGPT-BE-5.8B

Оценка (↑):.16 (Предыдущая: .145)

Δ: 015 (Показатель: mAP@100)

Ссылки на модели. Доступ к предварительно обученным моделям можно получить из HuggingFace. Примеры кода для доступа на Github page

Лицензия: лицензия MIT

Ссылка на демонстрационную страницу? Страницы с моделями HuggingFaceимеют демоверсии

Ссылка на Google Colab? Нет на сегодняшний день

Образ контейнера? Нет на сегодняшний день

‌#1 SOTA в прогнозировании ссылок на наборе данных OGBL-DDI

Статья: АДАПТИВНЫЕ ГРАФИЧЕСКИЕ ДИФФУЗИОННЫЕ СЕТИ

Отправлено 30 декабря 2020 г. (v1), последняя редакция — 2 сентября 2022 г. (v2). Код обновлен 21 сентября 2021 года. Код не обновлялся после последней бумажной версии

Примечания. Стандартные методы диффузии графов сочетают в себе большие и плотные степени матрицы перехода с предопределенными весовыми коэффициентами. Вместо этого в этой статье сочетаются меньшие представления узлов с несколькими переходами с обучаемыми и обобщенными весовыми коэффициентами. Утверждается, что этот подход решает проблемы переобучения и чрезмерного сглаживания глубоких GNNS.

Код: Ссылка на Github

Название модели:AGDN

Оценка (↑):.9538 (Предыдущая: .9284)

Δ: 015 0,0254 (показатель: количество тестов при 20 проходах)

Ссылки на модели. Обученные модели еще не выпущены

Лицензия: лицензия MIT

Ссылка на демонстрационную страницу? Нет на сегодняшний день

Ссылка на Google Colab? Нет на сегодняшний день

Образ контейнера? Нет на сегодняшний день