Конец истории

Выводы исследования по матлингвистике
Для автоматической систематизации массива случайных текстов Интернета была поставлена и решена задача сравнение текстов между собой по содержанию и их распределение по тематическим разделам, которые в этом процессе и формируются (в исходном состоянии нет ни одного раздела).

Иными словами, программа без участия человека самостоятельно читает произвольный текст, определяет, о чем речь, и направляет его в соответствующий тематический раздел каталога, либо образует в нем новый раздел, если содержание текста ни к чему из того что есть не подходит. Качество работы алгоритма определялось сравнением того, что получилось, с каталогом, составленным человеком. «Человеческий интеллект» выступает здесь в качестве эталона. Основная цель исследования состояла в выборе таких параметров алгоритма, которые дают максимальное совпадение каталогов, составленных человеком и «машиной».

Сравнение текущего каталога с эталоном выполнялось на каждой итерации, что делало процесс его становления наблюдаемым от самого начала, и до момента прерывания процесса. В итоге, кроме решения «чисто лингвистической» задачи, здесь получился побочный результат, — история становления каталога, которую можно пошагово проследить. Каталог – это уже система текстов, что отличает его от исходного неупорядоченного массива.

Здесь напрашивается такая аналогия: процесс становления каталога это история становления упорядоченной системы из хаоса. После оцифровки текстов алгоритм работал исключительно с таблицами чисел. Но это значит, что при надлежащей оцифровке систем другого типа, можно и для них провести подобное исследование и также проследить их становление, развитие, деградацию, распад. Такие опыты открыли бы возможность моделировать поведение и предсказывать направление развития больших систем, эксперименты с которыми затруднительны или невозможны. Особенно интересно было бы подвести под алгоритм системы социальные (например, государственные) для моделирования будущего, предсказания и предупреждения катастроф, поскольку модель может дать понимание, что и как надо для этого изменить.

Проведенные опыты становления системы текстов показали такие результаты. От исходного неупорядоченного состояния система постепенно нормализовалась, в ней возникали объекты (разделы), все более соответствующие эталону. «Машинный интеллект» двигался в правильном направлении, — к «человеческому» результату. Однако, после того как соответствие достигало некоторого максимума, дальнейшие изменения вели к деградации, и в зависимости от параметров алгоритма, она происходило по одному из трех сценариев.
1. В одном из вариантов, после прохождения максимума, возникал единственный раздел, который поглощал все другие и, в конце концов, вбирал в себя все, что было в системе (аналог — коллапс, «черная дыра»). Для дальнейших изменений состояния уже не было никаких причин.
2. В другом варианте оставалось несколько активных разделов, которые объединялись между собой, затем снова распадались, что циклически повторялось. Принципиальные изменения не происходили и в системе уже не было причин для выхода из образовавшейся цикличности, история завершалась.
3. Еще одна история длилась бесконечно. В ней не было цикличности, но параметр соответствия «рукотворному варианту» колебался возле некоторого уровня. Приходилось прерывать процесс.

Найти окончательный алгоритм самоорганизации, при котором конечное соответствие эталону максимальное, не получилось, поскольку в реальных условиях эталона нет, а в самой системе не нашлось признака «совершенства», который мог бы показать, когда взаимодействия следует прекратить. Система в своем развитии достигала максимума, но затем размывалась, — медленно, быстро, сильно или не очень.

Возможно, подобные истории (с деградацией) вызваны конечностью системы, в квазибесконечной, все могло бы быть иначе. Во всяком случае, на начальном этапе, когда еще есть много свободных элементов и взаимодействия групп между собой происходят нечасто, наблюдается исключительно поступательное развитие. Но надо заметить, что в реальном мире систем с бесконечным числом элементов нет, потому рано или поздно конечность, подчиняясь некому системному закону, неизбежно заставит перейти от прогрессивного развития к деградации.

Важный результат исследования состоит в том, что были выявлены параметры алгоритма, которые определяют историю развития системы. Это переменные, т.е. для них можно выбрать оптимальные значения. Впрочем, они определяют не столько историю развития, как ее конца. Этап прогрессивного развития для разных значений переменных (в определенном диапазоне) выполняется схоже. Различаются лишь скорость и значения достигаемых максимумов и формы деградации.

В принципе, были бы интересны исследования с воздействием субъективного фактора на ход истории, — например, стороннее вмешательство в процесс при определенных условиях. В исследовании статус всех элементов (текстов) был одинаковый. Однако, можно было бы некоторым из них придать особые свойства. Наконец, в испытаниях текст, попавший в раздел, теряет свободу абсолютно, как элемент он исчезает из системы и существует в ней лишь в связанном состоянии. Здесь тоже можно было бы проиграть разные варианты «системной свободы». Т.е. данное направление способно породить большое многообразие экспериментов и, соответственно, результатов.

Вывод
Существует некий закон развития, справедливый для конечных систем. Их поведение на завершающем этапе определяется внутренними константами. В проведенном исследовании константы устанавливались субъективно, экспериментально были определены их благоприятные значения.

Исследование было проведено для конкретной (лингвистической) системы. Распространение результатов на другие системы пока не более чем предположение, гипотеза. Однако, если действительно будет обнаружено существование некого всеобщего закона развития для других систем, это имело бы фундаментальное значение для некоторых наук. В частности, для истории это стало бы хорошей иллюстрацией теории К. Маркса, утверждающей существование объективных законов развития общества.

Более подробное описание и результаты исследования приведены в [3].

Литература
1. Ханов О.А.Вычисление информации, содержащейся в текстах. Журнал «Инновации» 08 (118) август, 2008, с.107-108
2. Андрей Часовских Обзор алгоритмов кластеризации данных
3. Ханов О.А.Опыты практической самоорганизации

17.02.2018

Автор: Ханов Олег Алексеевич | слов 795


Добавить комментарий