anhinga_anhinga (
anhinga_anhinga) wrote2012-12-12 08:04 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
A robot with impressive language capabilities
This is a prototype of an elderly home care robot developed by a very small group at IBM (with the benign indifference from their employer corporation that does not want to deal with robots and headaches and liabilities associated with robots). Its ability to verbally communicate with a human and to learn from a human is very impressive (basically, one can program this robot to a large extent simply by talking to it). Here is a demo video from the talk at the AGI-12 conference:
http://www.youtube.com/watch?v=M2RXDI3QYNU
The paper itself, "An Extensible Language Interface for Robot Manipulation", explaining to some extent how this works can be found here:
http://www.mindmakers.org/boards/18/topics/73
and the free online version of AGI-12 proceedings is here (scroll down to AGI-12 Contributed Paper Sessions):
http://www.mindmakers.org/projects/agiconf-2012/wiki/Schedule
http://www.youtube.com/watch?v=M2RXDI3QYNU
The paper itself, "An Extensible Language Interface for Robot Manipulation", explaining to some extent how this works can be found here:
http://www.mindmakers.org/boards/18/topics/73
and the free online version of AGI-12 proceedings is here (scroll down to AGI-12 Contributed Paper Sessions):
http://www.mindmakers.org/projects/agiconf-2012/wiki/Schedule
no subject
no subject
Но тем не менее разные полезные роботы скоро будут широко доступны, похоже. Технология уже близка к этому.
no subject
no subject
no subject
no subject
Это ещё далеко до идеала, но уже очень неплохо (у нас телефонный сёрвис через Интернет, который даёт компания Vonage, я думаю, что это уже много кто умеет, вряд ли Vonage уникален в этом смысле)...
no subject
no subject
no subject
Фрегимус, что нового слышно в МИТ по поводу http://www.cs.unb.ca/~goldfarb/ETSbook/ETS6.pdf?
no subject
Про статью я иногда вспоминаю, но так, чтобы сесть и прочитать, у меня пока не выходт. Нахрапом взять ее не получилось.
no subject
Я как раз только что её прочел, см. (http://x-ghbdtn.livejournal.com/5719.html)
no subject
А Вы видите, как прикладывать ETS к практическим задачам?
Мне не хватает моего английского, возможно за этим что-то есть, а я не могу понять, хотя некоторые примеры авторов ETS из физики, как бы намекают, что данный труд можно и не читать.
no subject
Предупреждаю, в "бурбулине" я не специалист, меня их математические методы заинтересовали.
no subject
В моей интерпретации (возможно неверной) - это все очень похоже на фричество.
Ну а что касается в мат.аппарате - я инженер и меня он интересует лишь, как средство решения прикладных задач в "когнитивистике". "Бурбулин" - это лишь одна из немногих задач, которые надо научиться решать для систем, "размерность" которых с одной стороны не достаточна, чтобы работала статистика, а с другой стороны слишком велика, чтобы их можно было анализировать "традиционной механикой".
no subject
Те моменты теорката, которые затрагиваются у Гольдфарба, можно посмотреть в недавнем обзоре http://arxiv.org/abs/1307.4038 "An alternative Gospel of structure: order, composition, processes", это вступление к "Quantum Physics and Linguistics: A Compositional, Diagrammatic Discourse". Только сам Гольдфарб про теоркат не говорит, а изображает самостоятельное изобретение велосипеда.
no subject
no subject
no subject
articulatory corpus (я не знаю, как выглядят артикуляторные корпусы - это необработанный звук?) на 14 классов (типов фонем? почему 14?) у них получилось 77% совпадений. Что там за алгоритм, как в нем используются авторские ETS - ни слова.
Будем смотреть дальше, в поисках чего-нибудь содержательного.
no subject
Алгоритм там описан словами, без особой математики и оригинальной терминологии, он отношения к ETS не имеет. Исходные данные это не звук, если я правильно понял, а Electromagnetic Articulograph (EMA), Laryngograph and Electropalatograph (EPG) measurements. Им сделали кластеризацию, причем индивидуально по человеку (clustering, making use of an efficient variant of k-means described in [9], is applied to the entire data available for the particular speaker), а дальше фиксировали, в какой кластер попадают данные этих артикулографов, ларингографов и электропалатографов. Какие 14 фонем выбраны - там есть табличка. По кластеризации ссылка на “An Efficient k-Means Clustering Algorithm: Analysis and Implementation,” IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 24, а их ETS не причем.
no subject
no subject
no subject
Спасибо, очень интересная ссылка.