Ток-шоу OH, MY CODE #7 — Всё о Data science или учимся предсказывать погоду ★РОЗЫГРЫШ ПОДАРКА

Библиотека fastText от Facebook теперь оптимизирована и под мобильные устройства

FAIR, группа по исследованиям в области искусственного интеллекта компании Facebook, выпустила обновление fastText, высокоскоростной открытой библиотеки для классификации текста. Изначально библиотека поддерживала работу с 90 языками, но в новой версии доступно уже 294 языка. Также был уменьшен размер и снижены требования к памяти.

Классификаторы текста наподобие fastText упрощают создание инструментов для анализа языков. Такой анализ необходим, например, для маркировки заголовков-приманок, а также для фильтрации спама.

Основные преимущества обновлённой версии fastText

Первоначально библиотека разрабатывалась для целого ряда устройств. К сожалению, в своём первозданном виде для работы она требовала несколько гигабайтов оперативной памяти. Это не проблема, если вы работаете в лаборатории с новейшим оборудованием, но это становится настоящей катастрофой, когда речь заходит о работе на мобильных устройствах.

В сотрудничестве с командой, разработавшей другой open source проект от Facebook — FAISS (библиотека алгоритмов поиска ближайших соседей), FAIR удалось сократить необходимый объём памяти с нескольких гигабайт до всего лишь пары сотен килобайт. Исследователи утверждают:

Читать далее Библиотека fastText от Facebook теперь оптимизирована и под мобильные устройства

Что делать, если вы хотите изучать ИИ, но не шарите в математике? Собираем и настраиваем систему

Рассказывает Даниель Джеффрис 


Итак, займёмся подбором комплектующих. Я предложу три варианта: бюджетный, средний и навороченный.

Читать далее Что делать, если вы хотите изучать ИИ, но не шарите в математике? Собираем и настраиваем систему

Нейросеть научили генерировать изображения анимешных девушек

Исследователи из университетов Стоуни-Брук, Тунцзи и Карнеги-Меллон, а также Фуданского университета, создали систему, способную самостоятельно генерировать стилизованные под аниме изображения девушек. Об этом команда сообщила в своём блоге.

Читать далее Нейросеть научили генерировать изображения анимешных девушек

Яндекс.Переводчик начал использовать нейронные сети

Статистический перевод используется с самого начала работы сервиса. Сейчас же перевод выполняется двумя моделями одновременно, после чего алгоритм машинного обучения CatBoost сравнивает результаты и предлагает лучший.

Нейронная сеть не разбивает входящие предложения на отдельные слова, как это делает статистический перевод, а обрабатывает их целиком. Именно поэтому перевод получается более гладким, с согласованием окончаний и с сохранением контекста и приближается по точности к литературному. Однако, встретив непонятное слово, сеть начнёт «придумывать» его перевод, чего лишён статистический перевод.

Читать далее Яндекс.Переводчик начал использовать нейронные сети

Команда DeepMind открыла доступ к платформе для машинного обучения

Недавно команда DeepMind (сейчас входит в состав холдинга Alphabet) сообщила о предоставлении бесплатного доступа к исходному коду платформы DeepMind Lab. Это сервис машинного обучения на базе Quake III, который предназначен для обучения искусственного интеллекта решению задач в трехмерном пространстве без вмешательства человека. Основой платформы является движок игры Quake III Arena.  Читать далее Команда DeepMind открыла доступ к платформе для машинного обучения

Раскрытие потенциала технологии Big Data в облаке

В настоящее время эти две новейшие технологии в области ИКТ занимают первое место в новостных лентах, обещая совершить революцию в вычислениях, практике деловых отношений, образовании и большинстве областей знания, которые можно представить.

С одной стороны, Big Data — это развивающаяся парадигма для крупномасштабного управления распределенными данными, которая позволяет обрабатывать большие объемы информации, что находится за пределами возможностей традиционных технологий работы с БД. С другой стороны, облачные вычисления  появились в качестве парадигмы для распределенных вычислительных систем, цель которых заключается в предоставлении программного обеспечения как услуги через Интернет.

Облачные вычисления предполагают наличие гибких моделей доставки и масштабируемой инфраструктуры для поддержки требований технологии Big Data по хранению и вычислению. Таким образом, обе технологии объединяются, чтобы предложить неизмеримый ассортимент получаемой информации, производить серьезный аналитический анализ и увеличить спектр услуг и ресурсов для приложений в любой области, заинтересованной в развитии ИКТ и инноваций.

И облачные вычисления, и Big Data быстро развиваются и становятся широко распространенным явлением, но необходимо определенное  усилие, чтобы создать целостную среду, в которой они одновременно могут процветать и полностью реализовывать свой потенциал. Амбициозная научная цель проекта Cloud4BigData (C4BD), запущенного Мадридским научно-исследовательским институтом IMDEA Networks, Политехническим университетом Мадрида и Университетом короля Хуана Карлоса — это облегчить конвергенцию технологий Big Data с их основной облачной инфраструктурой, достигая:

Читать далее Раскрытие потенциала технологии Big Data в облаке