Все, что вам нужно знать о машинном обучении [интервью специалиста по данным]

Опубликовано: 2022-05-25

Научная фантастика нарисовала множество ужасающих картин будущего, когда машины захватят мир. Эти мрачные представления о всемогущих машинах — одно из многих заблуждений людей об ИИ и машинном обучении.

В этой статье наш специалист по машинному обучению Юусо Лассила отвечает на наиболее часто задаваемые вопросы о машинном обучении и рассказывает нам, почему машины еще не совсем готовы захватить мир.

Машинное обучение

1. Что такое машинное обучение?

Машинное обучение означает, что машина может учиться без программирования. Машинное обучение и ИИ часто ошибочно используют как синонимы, но это не одно и то же. Машинное обучение на самом деле является подмножеством ИИ.

«ИИ — довольно плохо определенный термин. Это может означать что угодно», — объясняет Лассила.

Большая разница между машинным обучением и ИИ заключается в том, что ИИ не всегда нужны данные. Например, некоторые говорят, что поиск оптимального маршрута на карте — это ИИ. Этот процесс основан не на данных, а на алгоритме .

С другой стороны, машинное обучение — это ИИ, который использует данные для обучения. Преимущество машинного обучения заключается в том, что программисту не нужно знать, как модель решает проблему. Это означает, что машина может использовать методы, о которых программист не знал. Сегодня машинное обучение играет важную роль во многих отраслях.

2. Как используется машинное обучение?

Машинное обучение пытается понять данные и структуры в них. Проще говоря, давайте возьмем то, что любит Интернет: фотографии кошек и собак! Итак, если у вас есть сотни изображений ваших любимых пушистых друзей в случайном порядке, вы можете использовать машинное обучение, чтобы различать эти изображения. Машина может организовать данные таким образом, что в итоге вы получите, например, только изображения кошек.

«Машинное обучение будет прогнозировать значения на основе данных, которые вы ему передаете, и понимать эти данные», — говорит Лассила.

Обычный способ использования машинного обучения — классификация данных, как в нашем примере с изображениями кошек и собак выше. Однако машинное обучение также используется в чат-ботах с искусственным интеллектом и для различных типов прогнозов. Например, машинное обучение можно использовать для оценки стоимости дома на основе размера, местоположения, года постройки и другой информации.

3. Как машины учатся?

Машинное обучение обычно пытается минимизировать ошибки модели. Во-первых, он начинается со случайных ответов. Затем люди дают ему правильные ответы, объясняет Лассила.

Есть способ измерить, насколько ошибалась машина в ответах, которые она давала. В некоторых моделях машинного обучения для минимизации ошибок используется дифференцирование.

Дифференцируя, вы можете рассчитать, в какую сторону следует изменить параметры, чтобы уменьшить значение функции ошибок.

«Тогда вы знаете, как изменить свои параметры, чтобы значение функции уменьшилось. Затем вы делаете небольшой шаг к меньшей ошибке, изменяя параметры. Так вы сведете к минимуму ошибки», — говорит Лассила.

4. Может ли машина быть безошибочной?

Теоретически возможно, что ошибок нет, но в реальном мире этого не происходит. Даже в лучшем случае машина может получить только 99,9% правильных данных.

«Для классификации мы можем измерить точность», — говорит Лассила. Обычно неплохой считается точность 90-95%. Когда допустимая погрешность становится достаточно низкой, машина готова к запуску в производство. Насколько низким должен быть предел погрешности, прежде чем продукт сможет быть запущен, зависит от задачи, которую должна выполнять машина.

Говоря о чат-ботах с искусственным интеллектом, трудно сказать, когда бот будет более полезным, чем раздражающим, поскольку у чат-ботов с искусственным интеллектом может быть как можно больше примеров вопросов. Машина всегда должна выбрать лучший из доступных ответов. Насколько корректна машина, зависит от количества примеров вопросов.

«Если у вас есть один вопрос, машина всегда права. Если у вас их два, мы надеемся, что это довольно часто правильный ответ, но если у вас есть 100 вопросов, то машина, скорее всего, выберет неправильный ответ», — объясняет Лассила.

5. Что такое глубокое обучение?

Глубокое обучение — это метод машинного обучения, в котором используются слои в моделях. Один слой производит вывод, и этот вывод передается второму слою и так далее. Глубокое обучение обычно выполняется в нейронных сетях .

«Нейронные сети очень удобны, потому что они хорошо адаптируются к различным форматам ввода и вывода», — говорит Лассила.

Нейронные сети очень универсальны, поэтому у них много вариантов использования. Чат-боты с искусственным интеллектом также обычно используют нейронные сети.

«Мы создаем эти вложения предложений из сообщений, которые являются просто векторными точками в пространстве. Затем мы измеряем их сходство. Он использует нейронную сеть. В нем много слоев, и в конце он дает результат», — объясняет Лассила.

Также существует множество методов машинного обучения, которые не являются глубокими. Например, машины опорных векторов или деревья решений .

6. Каковы узкие места машинного обучения?

Данные — это одна из тех вещей, которые накладывают ограничения на машинное обучение. Если у вас нет данных, машинное обучение не сработает. Вам также нужны вычислительные ресурсы. Часто модели также вызывают ограничения.

«Для базовых задач, таких как классификация, модели хороши. И в этих случаях вы просто ограничены данными и вычислительными ресурсами. Но в некоторых областях модели еще не так хороши», — говорит Лассила.

Чем больше данных, тем лучше, если у вас есть ресурсы для вычисления этих данных. Но данные должны быть хорошего качества. Кроме того, модели должны быть большими, чтобы модель могла обрабатывать все сложные входные данные, которые она может получить. Вам нужна большая вычислительная мощность, чтобы машина могла обрабатывать эти данные.

«Вы можете иметь доступ к большому количеству данных. На самом деле проблема не в этом». — говорит Лассила. «Вопрос в моделях и времени, необходимом для их обучения. Для хранения этих моделей требуется много памяти».

Еще одна ловушка машинного обучения — доступная в настоящее время модельная архитектура для некоторых задач. На данный момент нет хорошей архитектуры модели для встраивания предложений.

«Мы все еще продолжаемся, чтобы найти действительно хорошую модель», — говорит Лассила.

7. Как вы обучаете машину?

Во-первых, вам нужно много данных, а данные, которые вы используете для обучения моделей, нуждаются в человеческих ярлыках.

«В крупных компаниях, использующих машинное обучение, есть армии людей, которые просто маркируют данные, — объясняет Лассила.

Даже если бот может начать маркировать данные со временем, вы не хотите использовать ответы, которые дает вам модель, в качестве обучающих данных. Модели ошибаются чаще, чем люди. Если вы используете машинную маркировку в качестве обучающих данных, вы снова обучаете модели этим ошибкам.

«Это приведет к тому, что ошибки будут становиться все больше и больше. “

Также можно использовать активное обучение , когда модели могут сказать, какие точки данных было бы полезно пометить. Это может сделать обучение более эффективным. «Машина может управлять процессом этикетирования. Тем не менее, люди должны делать маркировку, чтобы ошибки не распространялись. “

После того, как люди обучили модель с данными, машина должна быть в состоянии воспроизвести эту маркировку для невидимых входных данных. Но если вам нужны новые ответы, люди должны снова пометить данные.

Будущее ИИ

8. Каково будущее машинного обучения?

В настоящее время машинное обучение развивается очень быстро. Несколько лет назад была представлена ​​еще одна модель глубокого обучения — модель-трансформер. Открытие модели трансформатора оказало огромное влияние на машинное обучение.

«Мы перестроили все исследовательское поле вокруг этого открытия. Это действительно хорошо сработало», — объясняет Лассила.

Модель трансформатора также используется в чат-ботах ИИ с обработкой естественного языка. «Но в какой-то момент мы достигнем конца пути в том, насколько хорошо мы можем использовать эту архитектуру», — говорит Лассила. «Надеюсь, мы найдем что-то новое, что даст еще лучшие результаты».

9. Будут ли машины захватывать мир?

Люди ожидают слишком многого или недостаточного от ИИ и машинного обучения.

«Отсутствует понимание возможностей ИИ, — говорит Лассила.

Так что, похоже, машины еще не захватят мир. Прежде чем это произойдет, ботам нужно преодолеть несколько препятствий.

«Модели и архитектура еще не готовы. У нас есть данные и вычислительные ресурсы для создания хорошего ИИ, но нам все еще нужны эти хорошие архитектуры, чтобы роботы взяли верх».

Хотя ИИ еще не готов захватить мир, он возьмет на себя некоторые рабочие места.

«В какой-то момент некоторые рабочие места могут быть заменены искусственным интеллектом. Это будут повторяющиеся работы, не требующие особых размышлений», — говорит Лассила.

Есть два способа думать о том, как ИИ изменит рынок труда. Во-первых, ИИ заменяет рабочие места, но он также может улучшить рабочие места. Он может работать вместе с людьми. Хорошим примером этого являются чат- боты , которые могут подключаться к живому агенту, когда они не могут помочь посетителю веб-сайта.

«ИИ может повысить эффективность многих рабочих мест».

Тем не менее, вам все еще нужны человеческие ресурсы для борьбы с неточностями. ИИ не думает как человек. Он использует разные методы. И иногда нам непонятно, почему он что-то показывает.

«Одна из самых больших проблем с ИИ заключается в том, что машина не объясняет, почему она создала определенный результат. Это может иметь смысл для модели, но не для людей».

Если вы хотите узнать больше о машинном обучении и искусственном интеллекте, ознакомьтесь с нашим руководством по чат-ботам с искусственным интеллектом .