WWW.LIB.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Электронные матриалы
 


«Михайлов Дмитрий Владимирович Диссертация на соискание учёной степени доктора физико-математических наук 05. 13. 17 – теоретические основы информатики Научный консультант: д. ...»

Теоретические основы, методы и алгоритмы

формирования знаний о синонимии

для задач анализа и сжатия текстовой информации

Михайлов Дмитрий Владимирович

Диссертация на соискание учёной степени

доктора физико-математических наук

05. 13. 17 – теоретические основы информатики

Научный консультант: д. т. н., профессор Емельянов Г.М.

Великий Новгород, 2012 г.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 1/55

Объект, предмет и цель исследования

Предмет исследования Методы и алгоритмы формирования знаний о синонимии.

Объект исследования Программные средства распознавания, анализа и сжатия текста на Естественном Языке (ЕЯ).

Основная цель диссертационной работы Разработка и теоретическое обоснование структуры знаний о синонимии, а также методов и алгоритмов их формирования и использования для совокупности задач оценки схожести смыслов текстов предметноограниченного ЕЯ, автоматизации пополнения и компрессии баз языковых и предметных знаний.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 2/55 Исследования по наиболее близким направлениям, 1972–2012

1. Семантические повторы и смыслосохраняющее сжатие текста [Гиндин С. И., 1972]

2. Концепция лингвистических моделей СмыслТекст [Мельчук И. А., 1974]

3. Лексическая семантика [Апресян Ю. Д., 1974]

4. Анализ ЕЯ-высказываний ограниченного жанра с учётом закономерностей выражения смысла [Нариньяни А. С., 1979]

5. Логико-функциональная формализация перифразирования [Тузов В. А., 1984]

6. Морфологическая контекстно-зависимая интерпретация [Демьянков В. З., 1985]

7. Русский общесемантический словарь [Леонтьева Н. Н., 1997]

8. Модель смысловой эквивалентности на базе -грамматик [Емельянов Г. М., 1999]

9. Модели опыта в процессах деятельности [Соснин П. И., 2001]

10. Система анализа интеллектуальных заимствований Антиплагиат [2005–2012]

11. Теория K-языков [Фомичёв В. А., 2005]

12. Принципы онтологического анализа и синтеза в процессах интеграции профессиональных знаний, представляемых ЕЯ-текстами [Минаков И. А., 2007]

13. Уточнение поискового запроса выделением синтаксем [Exactus, 2004–2012]

14. Метод определения неестественного происхождения документа на основе статистики встречаемости пар соседних слов в тексте [Райгородский А. М., 2009]

15. Поиск сходства документов на основе замкнутых множеств [Кузнецов С. О., 2010] Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 3/55 Актуальность данного исследования

1. Ни один из подходов 1–11, 13–15 не предполагает рассмотрение целостного образа ситуации использования ЕЯ для описания фрагмента действительности.

2. Подход 9 включает формализацию субъективного и коллективного опыта на базе известных моделей знаний,в том числе реализацию построения и применения естественно-профессионального языка, но о конкретных её способах не говорится.

3. Алгоритмы в рамках подхода 10 анализируют сходство буквенного состава текстов и замену слов синонимами, но не принадлежность к языковому описанию сходных фрагментов действительности.

4. Подход 15 работает с замкнутыми множествами последовательностей слов фиксированной длины, которая зависит от конкретной задачи.

5. Набор связей между минимальными семантико-синтаксическими единицами в рамках подхода 13 требуют более детального изучения.

6. Словарная система в модели 8 является закрытой, компонент формирования условий применимости синонимических преобразований деревьев отсутствует.

7. Алгоритмы синтаксического и семантического анализа ЕЯ-предложений в рамках подхода 12, реализуя субъектно-ориентированную модель приобретения знаний из текста, делают смысловой контекст зависимым от точки зрения субъекта, что существенно, в частности, для интерпретации тестов открытой формы.

Вывод: необходимы методы представления знаний о ситуациях использования ЕЯ, позволяющие эффективно реализовывать взаимодействие языковых и предметных знаний, чему и посвящена данная работа.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 4/55 Задачи исследования Основные задачи исследования Анализ известных методов формализации семантики конструкций естественного языка и определение функциональных требований к механизму сравнения смыслов (Глава 1).

Разработка и исследование методов анализа Семантической Эквивалентности (СЭ) на уровне абстрактной лексики (Глава 2).

Разработка методов автоматизированного формирования и кластеризации знаний о семантике конструкций предметноограниченного ЕЯ с учётом взаимосвязи языковых уровней (Глава 3).

Исследование и алгоритмизация механизма использования морфологии и синтаксиса ЕЯ для задач кластеризации, разделения и сжатия баз предметных и языковых знаний (Глава 4).

Разработка и исследование методов численной оценки семантической схожести текстов предметно-ограниченного ЕЯ (Глава 5).

Разработка архитектуры системы контроля знаний, реализующей предложенные принципы, методы и алгоритмы (Глава 6).

–  –  –

Основные задачи:

Анализ известных методов формализации семантики языковых конструкций.

Формулировка общих требований к процессу установления семантической эквивалентности текстов относительно предметноограниченного подмножества естественного языка.

Важнейшие результаты (п. 6 паспорта специльности 05. 13. 17):

Концепция Ситуации Языкового Употребления (СЯУ) как единицы формализованного описания семантики естественного языка.

Подход к формированию и экспериментальной оценке знаний в виде классов семантической эквивалентности текстов, учитывающий целостный образ ситуации употребления предметно-ограниченного естественного языка для описания факта действительности.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 5/55 Задачи исследования Основные задачи и результаты второй главы

Основные задачи:

1 Описание на функциональном уровне задачи увеличения полноты представления смысла для прецедентов ситуаций синонимии уровня абстрактной лексики.

Разработка принципов выделения сверхфразовых единств на уровне глубинного синтаксиса.

Важнейший результаты (пп. 4 и 10 паспорта специльности 05. 13. 17):

1 Теоретическое обоснование разрешимости задачи построения системы целевых выводов в грамматике деревьев на основе динамической информационной модели совокупности её правил.

Метод выделения сверхфразовых единств в текстах на уровне глубинного синтаксиса как основа сжатия информации прецедентов классов смысловой эквивалентности уровня абстрактной лексики.

При этом динамическая информационная модель совокупности правил грамматики деревьев сводит решение указанной задачи к известным задачам сетей Петри. Предложенное решение учитывает недетерминорованный характер порождения деревьев глубинного синтаксиса в процессе их синонимических преобразований.

назад к основным задачам работы подробнее Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 5/55 Задачи исследования Основные задачи и результаты третьей главы

Основные задачи:

1 Формализация понятия прецедента ситуации синонимии с опорой на введённые в предыдущих главах базовые понятия.

Автоматизация накопления и экспериментальной оценки знаний об условиях применимости синонимических преобразований деревьев глубинного синтаксиса, рассмотренных во второй главе.

Разработка и исследование принципов формирования и кластеризации семантических отношений в рамках концепции ситуации языкового употребления.

Важнейший результаты (пп. 5 и 6 паспорта специльности 05. 13. 17):

1 Метод выделения синтагматических зависимостей сравнением символьных последовательностей, составляющих эквивалентные по смыслу фразы предметно-ограниченного естественного языка.

Программная реализация указанного метода (имеется свидетельство об официальной регистрации программы для ЭВМ), позволяющая выделять произвольные отношения в рамках СЯУ за время, оцениваемое сверху как квадрат произведения числа сравниваемых СЭ-фраз и максимального числа слов во фразе.

назад к основным задачам работы подробнее Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 5/55 Задачи исследования Синтаксический разбор как основа выделения признаков текста

Основные задачи, решаемые в четвёртой главе:

Алгоритмизация механизма использования синтаксического контекста существительного для выделения классов смысловой эквивалентности текстов по результатам их синтаксического разбора.

Разработка принципов выделения и классификации частичных смысловых эквивалентностей как обобщение свойств семантики генитивной конструкции русского языка.

Важнейший результаты (п. 6 паспорта специльности 05. 13. 17):

Алгоритмы формирования объектно-признакового описания ситуаций языкового употребления с примененем внешней программы синтаксического анализа.

Методика экспериментальной оценки соотношения смыслов в рамках

–  –  –

Основные задачи:

Развитие предложенного в третьей главе принципа выделения и кластеризации синтакксических отношений на случаи наличия синонимов в составе семантически эквивалентных фраз из определяющих ситуацию языкового употребления.

Разработка метода численной оценки схожести ситуаций употребления предметно-ограниченного естественного языка.

Важнейший результаты (п. 5 паспорта специльности 05. 13. 17):

Теоретико-решёточная концепция ситуации языкового употребления как информационной единицы тезауруса предметной области.

Метод численной оценки семантической схожести текстов предметноограниченного естественного языка относительно ситуаций его употребления.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 5/55 Задачи исследования Основные задачи и результаты шестой главы

Основные задачи:

Разделение и сжатие баз предметных и языковых знаний с применением комплексной методики формирования и кластеризации семантических отношений, последовательно развиваемой в третьей, четвёртой и пятой главах.

Разработка архитектуры программной системы контроля знаний, реализующей предложенные в работе принципы, методы и алгоритмы.

Важнейший результаты (п. 6 паспорта специльности 05. 13. 17):

Метод и алгоритмы автоматизированного формирования смыслового эталона, а также метод компрессии текстовой базы знаний на основе выделенных эталонов.

Демо-версия программной системы контроля знаний на основе

–  –  –

Определение 1.4 Ситуация Языкового Употребления (СЯУ) описание нового социального опыта (содержания совместных действий) средствами заданного ЕЯ.

Фиксируемый СЯУ S языковой контекст представляется тройкой:

–  –  –

где O множество символов, отождествляемых с некоторыми понятиями;

T s множество форм описания S в некоторой знаковой системе;

R On, где n 1,..., |O|.

Пусть Synt сюръективная функция, определяемая синтаксисом языка;

–  –  –

Определение 1.11 Пара (A, B), где A = B и B = A, есть формальное понятие (ФП) с объёмом A и содержанием B.

При этом каждому классу СЭ соответствует некоторый класс формальных понятий в решётке, а задача накопления знаний о синонимии сводится к совокупности следующих подзадач:

формирование прецедентов синонимии для уровня абстрактной лексики.

кластеризация отношений из множества R в составе тройки (1.1).

численная оценка схожести СЯУ.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 8/55 Уровень глубинного синтаксиса и грамматики деревьев Определение Лексико-синтаксическая грамматика деревьев (далее грамматика деревьев, -грамматика) задаётся посредством четвёрки вида

–  –  –

Определение 2.1 Лексической синонимической конструкцией (ЛСК) далее именуется комплекс лексических единиц wrk WR и связей vrj VR между ними, замена которого описывается некоторым rulei.

Каждой ЛСК соответствует своё ключевое слово C0, при этом в общем случае произвольная wrk в составе ЛСК есть значение некоторой лексической функции (ЛФ) от C0.

Представим вход правила rulej как описание заменяемого поддерева.

Тогда для любого rulej результат анализа применимости к заданному дереву фиксируется списком пар:

–  –  –

причём в работе rulej выделяются два состояния: для заменяемого дерева T io1 и для заменяющего дерева T io2, T iok = W iok, V iok, где W iok и V io множества узлов и ветвей, соответственно.

–  –  –

Рассмотрим R : для rule1 R rule2 R, rule2 = rule1 : либо вход rule2 является выходом rule1, либо вход rule1 есть выход rule2.

Пусть Ni сеть Петри, построенная из примитивов, каждый из которых моделирует работу некоторого rulej R.

Тогда последовательность применения правил rulej R соответствует последовательности = (t1i, t2i,...

, tki ) срабатываний переходов:

–  –  –

Лемма 2.2 Проблема достижимости заданной разметки Mki из начальной M0i в сети Ni разрешима.

Теорема 2.1 Сеть Ni безопасна в течение всего времени функционирования моделируемой системы правил -грамматики.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 14/55 Синтагматические зависимости и ситуация языкового употребления Пусть T s множество СЭ-фраз, задающих некоторую СЯУ согласно (1.1).

При рассмотрении T si T s в её составе следует выделить:

неизменную часть, общую для всех T si T s;

изменяемую (флективную) часть.

–  –  –

Пусть J индексное множество для неизменных частей всех слов, употребленных во всех T si T s.

Определение 3.2 Упорядоченная совокупность индексов j J неизменных частей слов, входящих в T si, будет моделью линейной структуры этой фразы, Ls (T si ).

–  –  –

Определение Множество пар (j, k), сгруппированных по некоторому общему индексу k, есть элемент множества VJ вершин графа синтагм (VJ, IJ ). При этом множества E1 и E2, входящие в VJ, будут соединены ребром из IJ, если {j, k, m} J: (j, k) E1, (k, m) E2 и j = m.

–  –  –

При этом k VJ T соответствует корню дерева (3.11), если E1 VJ, в котором пары индексов сгруппированы по k, |E1 | 1, а k не содержится ни в одной паре индексов для E2 VJ : E1 = E2.

Замечание Число дочерних узлов у корня дерева (3.11) полагается не менее двух, поскольку содержательный интерес для выделения отношений в рамках СЯУ представляют ситуации с двумя и более участниками.

–  –  –

Теорема 3.2 Слово uk Pi принадлежит расщепленному предикатному значению (РПЗ), если T sj T s : Ls (T sj ) = Ls (T si ), а uk Pj, причём Pj также отвечает условию теоремы 3.

1. При этом T sk T s, где Pk Pi и отвечает теореме 3.1, а Ls (T sk ) = Ls (T sj ) и Ls (T sk ) = Ls (T si ).

–  –  –

Пусть P J множество пар, отвечающих теореме 5.1, а множество LS формируется из LS заменой индексов, вошедших в пары из P J, на некоторые j (N\J). Обозначим множество заменяемых индексов как JP, а множество индексов замены как JP, JP JP =.

Утверждение 5.1 Индексы с максимальной встречаемостью в LS соответствуют словамсуществительным, обозначающим участников ситуации (1.1).

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 21/55 Синонимия и модель линейной структры предложения Обозначим множество индексов, отвечающих утверждению 5.1, как JN.

Пусть Ls1 (T si ) LS, а Ls2 (T si ) модель линейной структуры T si, но относительно JN. Обозначим множество моделей второго вида как LJN.

Положим, LSj LS : для Ls1 (T si ) LSj все Ls2 (T si ) одинаковы и соответствуют некоторой Ls2 (T sj ) LJN, T sj T s.

Утверждение 5.2 Индексы j JN с максимальной встречаемостью в различных Ls1 (T si ) LSj могут соответствовать наречиям, прилагательным, либо опорным существительным в составе генитивных конструкций.

Множество таких индексов обозначим далее как JA.

Замечание Местоположение индекса в расширенном дереве (3.11) и выделение   флексий для слов с индексами из (J\JP ) JP \ (JN JA) {0} производится по аналогии с выделением указанной информации у слов, отвечающих теореме 3.2. При этом вместо индексов с ненулевым значением рассматриваются индексы из JN JA.

–  –  –

где g Gs основа слова, синтаксически подчинённого другому слову из некоторой T si T s в составе тройки (1.1).

Множество признаков M s включает подмножества, обозначаемые далее посредством соответствующего нижнего индекса и содержащие:

указания на основу синтаксически главного слова (индекс 1);

указания на флексию главного слова (индекс 2);

связи основа–флексия для главного слова (индекс 3);

сочетания флексий зависимого и главного слова (индекс 4). При этом после флексии главного слова через двоеточие указывается предлог (если такой имеется) для связи главного слова с зависимым;

указания на флексию зависимого слова (индекс 5).

Посредством Is Gs M s выделяются классы отношений из R в (1.1) по сходству основы главного, флексии зависимого слова, лексической и флективной сочетаемости.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 23/55 Тезаурус и анализ схожести СЯУ. Простейший случай схожести Рассмотрим представление тезауруса формальным контекстом

–  –  –

Д. В.

Михайлов (Dmitry.Mikhaylov@novsu.ru) 25/55 Схожесть ситуаций языкового употребления Случай 2 соответствия объектов gx = ge, условие простейшего случая не выполняется, но существует объект gth Gth, обладающий признаком mth1 M6 : mth1 = pb ge при обязательном выполнении следующих условий:

–  –  –

Замечание Численная оценка схожести СЯУ включает сравнение последовательностей двух и более соподчинённых слов. Случаи схожести здесь анализируются только для главных слов. Последовательности считаются заменяемыми, если возможно их построение по формальному контексту (5.2) на наборе признаков с префиксом pbs для одной и той же СЯУ.

–  –  –

Случай 4 соответствия объектов

gx = ge, но существует gth1 Gth, обладающий признаком mth1 M6 :

mth1 = pb ge, а для me (M e4 M e5 ) верно то, что

–  –  –

где gxg = gx, а пара (gxg, ge) соответствует Случаю 3 при генерации формального контекста вида (5.1) для gth1.

В то же время существует объект gth2 Gth, относительно которого пара (gx, gxg) также будет соответствовать Случаю 3.

Генерируемый при этом формальный контекст вида (5.1) для gth2 обозначим далее как Kxg, Kxg = (Gxg, M xg, Ixg).

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 28/55 Численная оценка схожести ситуаций языкового употребления.

Простейший случай соответствия объектов и их несоответствие

–  –  –

1 0.9167 7.7500 0.7500 0.0000 2 0.7917 7.0000 2.0000 0.5000 3 0.8750 7.7500 0.7500 0.7500 Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 33/55 Формирование смыслового эталона ситуации языкового употребления Пусть согласно определению 3.5 (VJ T, IJ T ) есть расширенное дерево вида (3.11) для множества СЭ-фраз, IJ T = {(j, k) : E VJ, (j, k) E}, VJ множество вершин графа синтагм, Ke = (Ge, M e, Ie) есть искомый формальный контекст эталона.

Если E VJ : (j, k) E в дереве (VJ T, IJ T ), то для основ bj и bk и флексий fj и fk элементы множеств Ge, M e и отношения Ie формируются следующим образом.

Случай 1 Индекс k соответствует родительскому узлу, j дочернему, линейная структура фразы не содержит предлог между словами с индексами j и k.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 36/55 Отбор объектов и признаков из формальных контекстов ЕЯ-фраз Производится по максимуму сжатия информации по основам и флексиям в результирующем формальном контексте.

Утверждение Признак из состава множества признаков формального контекста фразы может быть включён в множество признаков формального контекста эталона, если он входит в признаковую пятёрку {m1, m2, m3, m4, m5 }, в которой m1 = pbs b, m2 = pbf f1, m3 = b : f1, m4 = pf l f2, m5 = f2 : f1, а b есть основа некоторого слова. При этом основе b не должен соответствовать объект формального контекста, если есть другой объект этого же контекста, который обладает одновременно признаком m1 и некоторым другим признаком m = pbs b1, где b1 = b, а основе b1 не соответствует ни одного объекта этого формального контекста при том, что признак m относится более чем к одному объекту.

Замечание Последовательности из трех и более соподчиненных слов, встречающиеся более чем в 49% исходных СЭ-фраз, выделяются на этапе синтаксического разбора. Для каждой из них строится отдельный формальный контекст, идентичный по структуре формальному контексту эталона.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 39/55 Результат: ЕЯ-фразы смыслового эталона и его формальный контекст

–  –  –

Здесь:

i порядковый номер СЯУ;

n максимальное число слов во фразе;

vol (n) = n! есть традиционно используемая оценка;

vol1 и vol2 оценки с применением метода и алгоритмов выделения эталона СЯУ, предложенных в диссертации.

–  –  –

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 43/55 Согласование знаний о синонимии относительно разных ситуаций языкового употребления Пусть St основа слова (его неизменная часть);

F l его флексия;

S1 и S2 некоторые СЯУ.

Предположим, что некоторое слово W rd относительно S1 представляется как St1 F l1, а относительно S2 как St2 F l2, причём St1 = St2 Sf, где Sf содержит минимум один символ, а есть операция конкатенации символьных строк.

Тогда относительно S1 основа St1 будет заменена на St2, флексия F l1 заменяется на F l3 = Sf F l2, но только в том случае, если частоты встречаемости флексий F l3 и F l2 во всех лексико-синтаксических связях, представляемых формальным контекстом вида (5.2) для заданной предметной области, не уменьшаются при выполнении указанных замен.

Пример.

СЯУ №3, St1 = является, F l1 =, СЯУ №1, St2 = явля, F l2 = ется, Sf = ется, а относительно СЯУ №3 производится замена: F l1 на F l3 = ется.

исходные СЯУ и их эталоны оценка требуемого объёма памяти далее

–  –  –

оценки знаний, основанная на концепции ситуации употребления естественного языка как единицы формализованного описания его семантики.

Подход к нахождению системы целевых выводов в грамматике деревьев как основа выделения сверхфразовых единств в текстах на уровне глубинного синтаксиса.

Принцип формирования и кластеризации семантических отношений как основы классов семантической эквивалентности.

Метод и алгоритмы выделения смыслового эталона на множестве эквивалентных по смыслу фраз предметно-ограниченного естественного языка.

Численная оценка семантической схожести текстов предметноограниченного ЕЯ относительно ситуаций его употребления.

Метод компрессии текстовой базы знаний с применением смысловых эталонов.

Теоретическое обоснование состава компонент и их взаимосвязи для программной системы контроля знаний, реализующей концепцию СЯУ в рамках тестовых заданий открытой формы.

назад к задачам исследования выводы и дальнейшие исследования Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 52/55 Выводы и дальнейшие исследования Предложенная концепция СЯУ составляет теоретическую основу решения задач поиска систем зависимостей совместной встречаемости осмысленных фрагментов слов в контексте связного текста, что немаловажно для сокращения перебора при построении смыслового контекста в мультиагентном подходе.

Разработанный в третьей главе метод выделения синтагматических зависимостей есть один из вариантов организации направленного перебора алгоритмом семантического анализа предложений при построении семантических дескрипторов документов в процессе создания онтологии предметной области.

В данной работе все виды связей между главным и зависимым словом предполагались одинаково значимыми для оценки схожести фраз. Для применения таких оценок в реальных задачах оценки профессиональных знаний по отраслям определение схожести СЯУ необходимо переформулировать с позиций нечёткой логики. При этом для описания функций принадлежности потребуется системный анализ структуры профессиональных знаний в конкретной области.

Концепцию модели линейной структуры предложения можно сделать более гибкой, введя вероятности совместной встречаемости слов относительно текстов заданной предметной области и жанра.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 53/55 Основные публикации (всего 75 работ, 18 в изданиях ВАК) Михайлов Д. В. Теоретические основы построения открытых вопросно-ответных систем.

Семантическая эквивалентность текстов и модели их распознавания:

монография / Д. В. Михайлов, Г. М. Емельянов; НовГУ им. Ярослава Мудрого.

Великий Новгород, 2010. 286 с.

Mikhailov D. V. Recognition of Superphrase Unities in Texts while Establishing Their Semantic Equivalence / G. M. Emelyanov, D. V. Mikhailov, E. I. Zaitseva // Pattern Recognition and Image Analysis. 2003. Vol. 13, No. 3. P. 447–451.

Михайлов Д. В. Распознавание сверхфразовых единств при установлении эквивалентности смысловых образов высказываний в общей задаче моделирования языковой деятельности / Г. М. Емельянов, Д. В. Михайлов // Известия СПбГЭТУ ЛЭТИ, сер. Информатика, управление и компьютерные технологии. СПб.,

2003. Вып. 1. С. 65–73.

Михайлов Д. В. Семантическая кластеризация текстов предметных языков (морфология и синтаксис) / Д. В. Михайлов, Г. М. Емельянов // Компьютерная оптика. 2009. Т. 33, № 4. С. 473–480.

Mikhailov D. V. Semantic Clustering and Anity Measure of Subject-Oriented Language Texts / D. V. Mikhailov, G. M. Emelyanov // Pattern Recognition and Image Analysis.

2010. Vol. 20, No. 3. P. 376–385.

Mikhailov D. V. Sense’s Standards and Machine Understanding of Texts in the System for Computer-Aided Testing of Knowledge / G. M. Emelyanov, D. V. Mikhailov // Pattern Recognition and Image Analysis. 2011. Vol. 21, No. 4. P. 705–719.

Михайлов Д. В. Формирование смысловых эталонов и интерпретация результатов открытых тестов в системах контроля знаний / Д. В. Михайлов // Вестник Новгородского государственного университета имени Ярослава Мудрого, сер. Технические науки. 2011. Т. 33, № 65. С. 83–87.

Д. В. Михайлов (Dmitry.Mikhaylov@novsu.ru) 54/55 Основные публикации (материалы конференций РАН) Михайлов Д. В. Применение аппарата ограниченных сетей Петри для построения динамической модели естественного языка / Г. М. Емельянов, Е. И. Зайцева, Д. В. Михайлов // Междунар. конф. ИОИ-2002: тез. докл. Симферополь, 2002.

С. 121–122.

Mikhailov D. V. Updating of the language knowledge base in the problem of statement’s semantic images’s equivalence’s analysis / G. M. Emelyanov, D. V. Mikhailov // 7th Int.

Conf. PRIA-7-2004. Conf. Proc. / SPbETU. St. Petersburg, 2004. Vol. II, P. 462–465.

Михайлов Д. В. Кластеризация семантических знаний в задаче распознавания ситуаций смысловой эквивалентности / Д. В. Михайлов, Г. М. Емельянов // 13-я Всерос. конф. ММРО-13. М., 2007. С. 500–503.

Mikhailov D. V. Formation and clustering of Russian’s nouns’s contexts within the frameworks of splintered values / D. V. Mikhailov, G. M. Emelyanov // 9th Int. Conf.

PRIA-9-2008. Conf. Proc. / NNSU. Nizhni Novgorod, 2008. Vol. 2. P. 39–42.

Михайлов Д. В. Морфология и синтаксис в задаче семантической кластеризации / Д. В. Михайлов, Г. М. Емельянов // 14-я Всерос. конф. ММРО-14: сб. докл. М.,

2009. С. 563–566.

Михайлов Д. В. Семантическая схожесть текстов в задаче автоматизированного контроля знаний / Д. В. Михайлов, Г. М. Емельянов // 8-я Междунар. конф.

ИОИ-2010: сб. докл. М., 2010. С. 516–519.

Михайлов Д. В. Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний / Г. М. Емельянов, Д. В. Михайлов // 15-я Всерос. конф. ММРО-15: сб. докл. М., 2011. С. 581–584.

Похожие работы:

«НАЦИОНАЛЬНОЕ ОБЪЕДИНЕНИЕ СТРОИТЕЛЕЙ Стандарт организации Конструкции монолитные бетонные и железобетонные ТехничеСКие Требования К производСТву рабоТ, правила и меТоды КонТроля СТо ноСТроЙ 2.6.54-2011 издание официальное Союз предприятий строительной индустрии Свердловской области общество с ограниченной ответственностью изд...»

«40 1760 2 МЕ10 УЯИД.695234.004-04 ПС-УД Контрольно-кассовая машина КАСБИ 02К версия 02 Паспорт УЯИД.695234.004-04 ПС УЯИД.695234.004-04 ПС.doc УЯИД.695234.004-04 ПС С.1 УЯИД.695234.004-04 ПС УЯИД.695234.004-04 ПС.doc С.2 Содержание 1 Общие указания.. 4 2 Основные сведения о ма...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ "ЛЭТИ" им. В. И. УЛЬЯНОВА (ЛЕНИНА) КОМИТЕТ ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ЛЕНИНГРАДСКО...»

«НОРМЫ НАКОПЛЕНИЯ ТВЕРДЫХ БЫТОВЫХ ОТХОДОВ Чухлебов А.А., И.А. Иванова Воронежский государственный архитектурно-строительный университет Воронеж, Россия THE RATE OF ACCUMULATION OF SOLID WASTE Chukhlebov AA, I.A. Ivanov...»

«Общество с Ограниченной Ответственностью 141100, Московская обл., г.Щёлково, ул.Свирская, д.3 Web-site: www.s-complect.ru тел./факс: (495) 510-63-23, (496-56) 9-11-09 E-mail: info@s-complect.ru телефон: (495) 510-71-51 ЩК-2-АКГ щит автоматизации парового котла ДЕ или ДКВр ТЕХНИЧЕСКОЕ ОПИСАНИЕ И ИНСТРУКЦИЯ ПО ЭКСПЛУАТАЦИИ 2006 г....»

«Ярослав КОШИВ УБИЙСТВО, КОТОРОЕ ИЗМЕНИЛО УКРАИНУ МОСКВА Издательство "ПРАВА ЧЕЛОВЕКА" ББК 76.01 К 76 Издание подготовлено при поддержке National Endowment for Democracy, США Распространяется бесплатно Художник – Вячеслав Тё Кошив Ярослав К 76 Гонгадзе. Убийство, которое и...»

«ФГБОУ ВО "ОГУ имени И.С. Тургенева" Орловский региональный центр энергосбережения ЭНЕРГОИ РЕСУРСОСБЕРЕЖЕНИЕ XXI ВЕК 15 март – 30 июня 2016 г., г. Орёл ENERGY AND RESOURSES SAVING XXI CENTURY 15th March – 30th June 2016, Oryol л Орёл 2016 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ПРАВИТЕЛЬСТВО ОРЛОВСКОЙ ОБЛАСТИ АКАДЕ...»

«УДК: 159.92:37.03+152.2+155.25 © Сергеева Т.В., 2013 г. Т.В. Сергеева Национальный университет архитектуры и строительства, г. Харьков СВОЙСТВА ДИНАМИЧЕСКИХ МОДЕЛЕЙ, ФОРМИРУЕМЫХ В РАМКАХ ЭКО-ГУМАНИСТИЧЕСКОЙ ТЕХНОЛО...»

«Хутыз Абрек Махмудович канд. техн. наук, доцент, профессор Шишова Рита Гучипсовна канд. техн. наук, доцент ФГБОУ ВО "Майкопский государственный технологический университет" г. Майкоп, Республика Адыгея МЕХАНИКА РАЗРУШЕНИЯ И КРИТЕРИИ ТРЕЩИНОСТОЙКОСТИ Аннотация:...»








 
2017 www.lib.knigi-x.ru - «Бесплатная электронная библиотека - электронные матриалы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.