Наукова електронна бібліотека
періодичних видань НАН України

Автоматическое реферирование китайской правовой информации

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Ландэ, Д.
dc.contributor.author Цзыцзян Ян
dc.contributor.author Шивэй Чжу
dc.contributor.author Цзяньпин Го
dc.contributor.author Моцзи Вэй
dc.date.accessioned 2020-05-08T19:14:32Z
dc.date.available 2020-05-08T19:14:32Z
dc.date.issued 2018
dc.identifier.citation Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос. uk_UA
dc.identifier.issn 1560-9189
dc.identifier.other DOI: https://doi.org/10.35681/1560-9189.2018.20.3.158214
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/168766
dc.description.abstract Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации. uk_UA
dc.description.abstract Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації. uk_UA
dc.description.abstract A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced. uk_UA
dc.language.iso ru uk_UA
dc.publisher Інститут проблем реєстрації інформації НАН України uk_UA
dc.relation.ispartof Реєстрація, зберігання і обробка даних
dc.relation.ispartof Реєстрація, зберігання і обробка даних
dc.subject Інформаційно-аналітичні системи обробки даних uk_UA
dc.title Автоматическое реферирование китайской правовой информации uk_UA
dc.title.alternative Автоматичне реферування китайської правової інформації uk_UA
dc.title.alternative A method for public opinion-based formal description of weakly structured subject domains uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 004.44:002.513.5


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис