Новая рубрика: google обучает роботов обучать других роботов
Компания Google в последнее время ведет работы в области так называемой «облачной робототехники». Это явление, когда роботы, обучившиеся самостоятельно выполнять какое-либо действие, могут поделиться «опытом» с другими роботами, просто передав информацию любым доступным методом связи. Такой принцип обучения позволяет избежать момент перепрограммирования, или, так сказать, «переобучения», при постановке технике новых задач.
Суть «облачной робототехники» состоит в следующем: в ее основе лежат нейросети, которые определяют и хранят последовательность выполняемых действий, отвечают за процессы автоматизма и передачу информации. В общем, за все то, что мы называем опытом. Роботам на базе нейронных сетей можно поставить любую задачу, и искусственный мозг сам найдет пути решения. В дальнейшем при выполнении этих действий несколько раз, робот выработает оптимальный алгоритм, который сумеет передать другим машинам, и те будут использовать и совершенствовать его, не начиная каждый раз с нуля.
Ученые из компании Google Research протестировали свой алгоритм на трех видах роботов, выполняющих разные задачи: открывание дверей, изучение предметов на подносе и видоизмененный вариант первого опыта, когда робот обучался не самостоятельно, а управлялся человеком с последующей задачей усовершенствовать полученные навыки.
В первом случае у машины ушло достаточно много времени для понимания того, то для открытия двери необходимо взяться за ручку, повернуть ее и надавить на дверь. Зато все последующие роботы использовали этот алгоритм, пропуская момент обучения.
В эксперименте с подносом машины были предоставлены сами себе и в течение нескольких часов изучали причинно-следственные связи между предметами (для примера: чайник — чашка — сахар: что с этим делать, очевидно лишь нам, роботам же пришлось «учиться»).
Эксперимент номер три после обучения робота оператором был отдан на откуп «коллективному сознанию», которое быстро совместно нашло оптимальные варианты решения, отличающиеся различными исходными положениями манипуляторов и конечным итогом, ускорявшим произведение манипуляции.
Самым интересным стал момент, когда одного из роботов заставили открывать дверь, на которой была установлена ручка совершенно другого типа. Машина отлично справилась с задачей.
Зачем это все нужно, помимо построений теорий о восстании машин? Все просто: подобное ускорение процесса обучения даст возможность промышленным роботам приступать к выполнению сложных задач гораздо быстрее, чем при традиционном подходе.
Источник: http://allinka.ru