НОВОСТИ Data Science Digest (June 2020)

Alvaros
Онлайн
Регистрация
14.05.16
Сообщения
21.452
Реакции
101
Репутация
204
b3-suhbqy_yduggja9wwy_uasny.png


Приветствую всех!

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning и не забывайте подписываться на наш .

Статьи


  • — вводная статья о фреймворке Catalyst.
  • — краткое описание форматов с плавающей запятой и где они используются.
  • — об обучении и применении простых CNN для анализа MPT головного мозга.
  • — о новой ML-модели, которую создал DeepMind совместно с Moorfields Eye Hospital и Google Health для распознавания развития заболевания сетчатки.
  • — одно из самых полных руководств по настройке DL-пайплайна с Catalyst и развертыванию модели в продакшене.
  • — о трендах и решениях использования ML на производствах.
  • — подробное объяснение метрик ML моделей для задач классификации.
  • — технические детали использования компьютерного зрения для продукта дополненной реальности.
  • — о челенжах и возможностях использования ML в здравоохранении.
  • — о том, как на продакшене минимизировать время отклика DL-модели.
  • — детальное руководство о мониторинге ML-моделей в продакшене.
  • — про CADx (computer-aided diagnosis) системы в здравоохранении и использование ML-моделей в них.
  • — об экстраполяции — основной проблеме использования случайного леса для регрессии.
  • — про Tesseract OCR для обнаружения и распознавания текста на изображениях.
  • — обзорная статья о BERT и разбор популярных кейсов его использования.

Научные статьи


Ежедневно в канале #article_essence Slack-чата обсуждаются разные научные статьи. Кто еще не присоединился к нашему сообществу, приглашаю сделать это, а пока предлагаю свежую подборку из канала.

  • — самый простой и надёжный на данный момент способ визуализировать «а куда же смотрит нейронка».
  • — усовершенствование архитектуры для text to image AttnGAN, суть которого в том, что в генератор изображения добавлен вход сегментационной маски генерируемого объекта. Также разработан вариант с self-attention, когда маска генерируется непосредственно из текста с помощью отдельного генератора.
  • — новая SOTA в talking head generation, где отдельное внимание уделили раздельному получению ландмарок лица, а также обучили отдельную сеть для генерации моргания глаз.
  • — новая работа по weakly supervised семантической сегментации, в которой для получения карт сегментации используются только метки классов. Достаточно проста в обучении, показывает себя либо наравне либо лучше текущей state of the art.
  • — Хорошо работающая графовая нейронная сеть для матчинга локальных фичей и получения гомографии (альтернатива RANSAC). Основана на графовом механизме внимания.
  • — GAN для генерации синтетики для обучения self-driving машин, генерирует различные виды одного маршрута, используя данные с лидара, а также семантическую и инстанс сегментацию
  • — способ получения точной и геометрически правдоподобной карты глубины для всех кадров видео, используя предобученную single-image depth estimation модельку.
  • — новая сота в Unsupervised Domian Adaptaion (это когда обученную на большом количестве синтетики модель адаптируют к реальным данным без лейблов на реальных данных)

Датасеты


  • - корпус по фонетике на 700 языков.
  • — один из крупнейших датасетов для распознавания лиц, содержащий 3.3М изображений.
  • — датасет для идентификации таблеток.
  • — датасет для распознавания лиц с масками.
  • — датасет стереоизображений дикой природы, содержащий 49 368 пар изображений.
  • — датасет из 491 CT сканого головного мозга.

Видео


  • .
  • ICLR 2020 Recordings: , .
  • ( ).
  • .
  • .

Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя полезное. Буду благодарен за любые предложения для следующего дайджеста.

Присоединяйтесь к дайджеста и его страницам в соцсетях: , , , .
 
Сверху Снизу