anhinga_anhinga: (Default)
[personal profile] anhinga_anhinga
Тестовый сайт "Комсомолки" зажигает !

Ищу достойные аналоги для англоязычных текстов, а то CNN скучный очень...

Особый кайф: ЖЖ хорошо через эту штуку читать, особенно свой собственный.

а мне кажется kp.ru лучше.

Date: 2005-05-01 05:17 pm (UTC)
From: [identity profile] borisliv.livejournal.com
а мне кажется kp.ru лучше.

Re: а мне кажется kp.ru лучше.

Date: 2005-05-01 05:35 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
В тестовом сайте интересна его неофициальность. Сколько я понимаю, это просто полигон для экспериментов, и клево, что он открыт для всех...

Но меня-то заинтересовал их скрипт BBB.pl, на который ссылается Free Researcher.

Скрипт этот с кайфом применяется к любому русскоязычному тексту. Например, можно сравнить
http://www.livejournal.com/users/anhinga_anhinga/11005.html
и
http://test.kp.ru/cgi-bin/slovari/BBB.pl?&url=http://www.livejournal.com/users/anhinga_anhinga/11005.html

При этом каждый раз делается несколько другое преобразование текста, так что идя по последнему линку несколько раз, каждый раз получаешь новый прикол...

Date: 2005-05-02 12:46 am (UTC)
From: [identity profile] aa-kir.livejournal.com
Прикол, что и говорить.

Re: а мне кажется kp.ru лучше.

Date: 2005-05-01 06:11 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
:-) Да, и все линки этот скрипт преобразует соответственно, так что можно ходить по преобразованному Интернету :-)

Date: 2005-05-03 01:12 pm (UTC)
From: [identity profile] a-s-pavlov.livejournal.com
Видал я подобный прикол. (где - не помню) Текст разбивается, перемешивается и добляются нецензурные вставки.

Date: 2005-05-03 02:25 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
Здесь гораздо более тонкая работа. Тут и словари используются для смысловых замен, и аллитерации генерируются, и чего только нет...

Идея преобразования текста сама по себе не нова, но такое качество не часто встречается...

пазлы

Date: 2005-05-03 02:30 pm (UTC)
From: [identity profile] a-s-pavlov.livejournal.com
(Брюзжа под нос)
оно конечно... забавно... словари для смысловых замен.
Если взять картину, произвольно разбить ее на пазлы, перемешать, произвольно стыковать, пробелы затонировать по ближайшему цветовому соответствию... кадрировать полученое месиво до первоначального размера...
Дальнейшее дорисует фантазия :)

P.S Вам известне алгоритм по которому работает этот скрипт?

Re: пазлы

Date: 2005-05-03 02:54 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
Ну можно ведь и не совсем произвольно :-) А, например, гармонично, в каком-нибудь разумном смысле (с картинками, например, преобразования Фурье помогают) :-)

> Дальнейшее дорисует фантазия :)

Еще бы! Такая замечательная нервная сеть, как та, что находится в голове у читателя/зрителя, должна принимать горячее участие в формировании произведения искусства. Тем более, что без нее никакого восприятия все равно не бывает...

Когда книжку перечитываешь, настолько другой смысл каждый раз...

> Вам известне алгоритм по которому работает этот скрипт?

Нет, к большому моему сожалению. Но кое какие закономерности я заметил...

Очень хотелось бы поговорить с автором...

Re: пазлы

Date: 2005-05-03 03:04 pm (UTC)
From: [identity profile] a-s-pavlov.livejournal.com
>А, например, гармонично, в каком-нибудь разумном смысле
Угу. осталась малость - определить этот "разумный смысл".
Отсечь все лишнее
И тогда бот сможет пересказать содержание сайта "своими словами" :)
>Но кое какие закономерности я заметил...
Рад. Архимед, Ньютон и пр. - тоже замечали некоторые закономерности :)
>Очень хотелось бы поговорить с автором...
Аналогично.

Re: пазлы

Date: 2005-05-03 04:37 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
> Угу. осталась малость - определить этот "разумный смысл"

Есть много разных разумных способов, канонического способа нет.

Картинки, например, можно для начала раскладывать по частотам, и делать разные преобразования в разных частотных компонентах, потом собирать обратно. Наша зрительная нервная система тоже широко использует этот прием...

> Отсечь все лишнее

Шумоподавление - штука полезная!

> И тогда бот сможет пересказать содержание сайта "своими словами" :)

Ну, кое какое автоматическое порождение кратких аннотаций статей имеется...

Re: пазлы

Date: 2005-05-04 10:21 am (UTC)
From: [identity profile] a-s-pavlov.livejournal.com
можно для начала раскладывать по частотам, и делать разные преобразования в разных частотных компонентах
Да, инструмент - правильный IMHO, надо только определится - что есть эти самые частоты. Точнее - которые из них актуальны, критичны - а какие - опциональны.
Трудность в том, что актуализация аспектов(частот) может менятся. Причем весьма замысловато.
Шумоподавление - штука полезная!

И опасная. НЕ то подавить можно. Шум - он как грязь. Это сигнал не на своем месте.
-Что у вас там к сковороде налипло, еле отчистила...
-Спасибо мама, это был тефлон.

Ну, кое какое автоматическое порождение кратких аннотаций статей имеется..

Не могу оценить работу английского греммера в MS Word, а на русском - про него и говорить не хочется. Хотя делала его вроде Орфус -там разработчиков трудно обвинить в непрофессионализме
Просто... потери при переходе(моделировании) с семантического уровня на синтаксический - невосполнимы.
Как это у вас, у математиков... Преобразование обратимое но НЕ непрерывное. Это если спроецировать фигуру на отрезок, а потом пытаться восстановить исходную форму.

Re: пазлы

Date: 2005-05-04 03:37 pm (UTC)
From: [identity profile] anhinga-anhinga.livejournal.com
Мне кажется, это все можно понять только через эксперименты с разными вариантами...

Re: пазлы

Date: 2005-05-05 09:31 am (UTC)
From: [identity profile] a-s-pavlov.livejournal.com
да, безусловно.
О том и печаль.
Модель сделать хочется.
И погонять ее в разных режимах :)

Profile

anhinga_anhinga: (Default)
anhinga_anhinga

July 2021

S M T W T F S
    123
45678910
11121314151617
18 192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 25th, 2025 04:10 pm
Powered by Dreamwidth Studios