Вы, скорее всего, уже не раз встречались с термином машинного обучения. Его часто используют наравне с термином искусственного интеллекта.
Машинное обучение — это подсистема искусственного интеллекта, и оба эти понятия изобрели в MIT в конце 50-х годов XX века.
Из статьи вы узнаете:
Примеры и история машинного обучения
Машинное обучение — это то, с чем вы, возможно, встречаетесь каждый день, не задумываясь. Голосовые помощники Siri и Alexa, системы распознавания голоса Facebook и Microsoft, рекомендации Amazon и Netflix, технология, которая не дает беспилотным машинам врезаться в разные предметы — все это результаты машинного обучения.
Несмотря на то, что эти системы далеко не так сложно устроены, как мозг человека, они достигли больших успехов, например, выиграв у людей-соперников в шахматных партиях, игре в покер.
На протяжении нескольких десятилетий машинное обучение и искусственный интеллект лежали на полке, считаясь нереалистичными и переоцененными. Этот период даже назвали зимой искусственного интеллекта.
Сейчас на протяжении нескольких лет машинное обучение и искусственный интеллект снова бурно развиваются. Это происходит благодаря технологическим прорывам, дешевым компьютерным ресурсам и множеству данных, на которых обучаются модели машинного обучения.
Самообучаемое программное обеспечение
Традиционное ПО отлично следует инструкциям, но ужасно импровизирует. Системы машинного обучения программируют себя сами. Они создают свои инструкции и дополняют их, учась на примерах.
Классический пример — распознавание картинок. Покажите системе машинного обучения много фотографий собак, отмеченных ярлыком «собака», а также котов, деревьев, детей, бананов или любого другого объекта, отмеченного ярлыком «не собака». Если система правильно натренирована, она научится распознавать собак.
Спам-фильтр в вашем почтовом клиенте — хороший пример машинного обучения в действии. После того, как ему показали миллионы примеров спама, а также примеры неспама, он научился распознавать ключевые характеристики ненужных сообщений. Он не всегда правильно срабатывает, но обычно верно распознает спам.
Контролируемое и неконтролируемое обучение
Контролируемое обучение — это когда человек выдал алгоритму машинного обучения огромный набор тренировочных данных, проанализировал результаты и постоянно корректировал настройки, чтобы получить ожидаемый результат. Результатом будет то, что машина смогла идентифицировать данные, с которыми раньше не сталкивалась.
Это похоже на то, когда фильтр случайно отправляет в спам сообщение от разрешенного отправителя,а вы нажимаете на кнопку «Не спам». Чем чаще вы это делаете, тем корректнее работает фильтр.
Самые распространенные задачи контролируемого обучения — классификация и прогнозирование. Распознавание спама и фотографий — задачи классификации.
Предсказание цен на бирже — классический пример прогнозирования.
Неконтролируемое обучение — второй тип машинного обучения.
В этом виде обучения система внимательно изучает большие массивы данных, чтобы выучить, как выглядят «правильные» данные. Потом это поможет ей распознавать аномалии и скрытые паттерны. Неконтролируемое машинное обучение полезно, когда вы не знаете, чего ищете и не можете натренировать систему, чтобы она это нашла.
Системы неконтролируемого обучения могут определить паттерны в больших массивах данных во много раз быстрее, чем люди. Поэтому банки используют их, чтобы помечать фальсифицированные транзакции, маркетологи используют их, чтобы определить клиентов с похожими свойствами, а ПО безопасности использует их, чтобы распознавать подозрительную деятельность в сети.
Объединение в кластеры — пример алгоритма неконтролируемого обучения. Кластеризация используется как секретный ингредиент для сегментации клиентов.
Поиск ассоциативных правил — еще один алгоритм неконтролируемого обучения.
Он применяется для рекомендательных сервисов.
Ограничения машинного обучения
Так как каждая система машинного обучения создает свои связи, понять, как одна из них работает, — сложно. Вы не можете повернуть процесс вспять, чтобы понять, почему ваша система может отличить пекинеса от персидского кота. Пока система работает, все остальное нас не волнует.
Но система машинного обучения может быть настолько корректной, насколько корректны данные, которые ей предоставляют. Если систему плохо тренируют или дают недостаточно данных, алгоритм машинного обучения может выдать не только ложные, но и дискриминационные результаты.
Компания Hewlett-Packard попала в неприятную ситуацию в 2009 году, когда технология распознавания лиц, встроенная в веб-камеру ноутбука HP, не смогла распознать лица афроамериканцев. В июне 2015 неправильно работающие алгоритмы в приложении Google Photos идентифицировали двух афроамериканцев как горилл.
ДБот Taybot от Microsoft в 2016 году провел эксперимент, чтобы проверить, может ли система искусственного интеллекта смоделировать разговор людей, обучаясь по твитам. Меньше чем за день злобные тролли в Твиттере превратили Taybot в чат-бот, разжигающий ненависть и межнациональную рознь.
Словарик машинного обучения
Машинное обучение — только верхушка айсберга искусственного интеллекта. Другие концепты, тесно связанные с машинным обучением: нейронные сети, глубокой обучение и когнитивные вычисления.
Нейронная сеть. Компьютерная архитектура, имитирующая структуру нейронов в мозге, где каждый искусственный нейрон, микросхема, связан с другими нейронами внутри системы.
Нейронные сети выложены слоями. Нейроны в одном слое передают данные множественным нейронам в следующем слое, и так далее, пока они не достигнут слоя вывода. Финальный слой — это там, где нейронная сеть выдает свои лучшие догадки. Например, говорит, что это был за объект в форме собаки и на сколько процентов она в этом уверена.
Существует много типов нейронных сетей, которые решают разные проблемы. Сети с большим количеством слоев называются глубокими нейронными сетями. Нейронные сети — один из самых важных инструментов, которые используется в сценариях машинного обучения.
Глубокое обучение. В нем используются многослойные, или глубокие нейронные сети, чтобы прийти к решениям, основанным на «несовершенной» или неполной информации. Система глубокого обучения DeepStack победила 11 профессиональных игроков в покер в декабре 2017. Она смогла это сделать благодаря тому, что постоянно пересчитывала свою стратегию после каждого раунда ставок.
Когнитивные вычисления. Вместо того, чтобы заменить ум человека, как это пытается делать искусственный интеллект, когнитивные вычисления существуют для того, чтобы его улучшить. Это поможет врачам лучше ставить диагнозы, финансовым руководителям принимать более умные решения.
Это, конечно же, очень базовая статья.Если хотите ближе познакомиться с тонкостями искусственного интеллекта и машинного обучения, можете почитать серию постов от Адама Гейтгая или подождать наших следующих выпусков, где мы подробнее расскажем о каждом из этих концептов.
Несмотря на шумиху вокруг искусственного интеллекта, мы не преувеличим, если скажем, что машинное обучение и связанные с ним технологии меняют мир.
Источник: статья в издании InfoWorld