logo
 

РУССКИЙ ЯЗЫК

ЛИТЕРАТУРА

 

ИСТОРИЯ РОССИИ

БИОЛОГИЯ

ГЕОГРАФИЯ

МАТЕМАТИКА

Кластеризация является одной из наиболее часто используемых форм обучения без учителя. Вместо того чтобы учить ИИ классифицировать данные (например, «кошки» или «собаки»), мы можем вообще не знать, как это лучше делать, и рассчитывать на то, что компьютер сам выберет подходящий способ. Продавцы хотят лучше понимать своих покупателей. Если компьютер обнаружит, что есть, скажем, пять основных типов клиентов (матери, молодые люди, те, кто делает покупки в выходные, любители скидок, лояльные покупатели) и в зависимости от типа они покупают разные вещи в разное время, продавец сможет лучше удовлетворить потребности каждого клиента, а не относиться ко всем одинаково. Та же идея лежит в основе систем рекомендаций, позволяющих находить сходства между потребителями и предлагать им новые продукты.

Если я похож на вас по возрасту, полу, стране проживания и оценил несколько тех же книг, что и вы, после того как я приобрету новый товар и/или поставлю ему высокую оценку, вы можете получить предложение попробовать тот же продукт. Объединение достаточного количества данных от тысяч или даже миллионов потребителей порой ведет к удивительно предсказуемым рекомендациям. Такой подход известен как совместная фильтрация, и он предполагает использование алгоритмов кластеризации для группирования людей.

 

 

САМООРГАНИЗУЮЩИЕСЯ КАРТЫ

Существует большое количество алгоритмов кластеризации. Например, самоорганизующиеся карты – одна из версий нейронных сетей Кохонена, названных в честь их изобретателя, финского ученого Теуво Кохонена. Принцип самоорганизующихся карт – размещение искусственных нейронов в сеткообразном пространстве карты – имеет отдаленное сходство с тем, как сенсорная информация обрабатывается в человеческом мозге. Когда в такие карты поступают новые данные, положение (или «вес») соседних нейронов смещается в сторону расположения каждой точки данных в сети. После итеративного, то есть предполагающего повторяющиеся действия, процесса подачи данных и подстройки нейронов самоорганизующиеся карты получают набор нейронов, который приблизительно соответствует распределению всех основных точек данных. Это может использоваться как для визуализации различных классов уже известных данных, так и для классификации новых точек данных.

 


 

Думайте о неконтролируемом обучении как о математической версии «рыбак рыбака видит издалека».

КЭССИ КОЗЫРЬКОВ, главный инженер по принятию решений в Google (2018)

 

Существует множество видов обучения без учителя и даже комбинации контролируемого и неконтролируемого типов (скажем, с частичным обучением). Несмотря на то что они чрезвычайно важны в сфере бизнеса для анализа, классификации и прогнозирования, при управлении роботами все еще возникают проблемы. Например, из-за присваивания коэффициентов доверия. Если я робот и мне поручено проложить лучший маршрут по сложному ландшафту, избегая неизвестных препятствий, из-за которых я могу застрять, я должен составить последовательность решений. Успех более позднего решения будет зависеть от более ранних: если я повернул налево, чтобы обогнуть озеро, дальше мне следует найти путь через реку; если я повернул направо, чтобы обогнуть озеро, теперь я должен преодолеть груды камней. Контролируемое обучение не поможет мне научиться, поскольку в данном случае препятствия и их последовательность заранее неизвестны, а значит, мне не удастся понять, какие из моих решений, скорее всего, будут правильными, а какие приведут в ловушку.

Обучение без контроля, такое как кластеризация, может помочь мне классифицировать типы встречающихся мне препятствий, но, опять же, оно не позволит мне узнать, какой путь следует выбрать. У меня нет возможности определить правильность каждого отдельного решения (присвоить ему коэффициент) в цепочке выборов, которые я должен сделать. Не зная, насколько хорошо я справился, как я могу научиться?

 

Поиск

 

ФИЗИКА

 

Блок "Поделиться"

 
 
Яндекс.Метрика Top.Mail.Ru

Copyright © 2021 High School Rights Reserved.