dc.contributor.author |
Ландэ, Д. |
|
dc.contributor.author |
Цзыцзян Ян |
|
dc.contributor.author |
Шивэй Чжу |
|
dc.contributor.author |
Цзяньпин Го |
|
dc.contributor.author |
Моцзи Вэй |
|
dc.date.accessioned |
2020-05-08T19:14:32Z |
|
dc.date.available |
2020-05-08T19:14:32Z |
|
dc.date.issued |
2018 |
|
dc.identifier.citation |
Автоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос. |
uk_UA |
dc.identifier.issn |
1560-9189 |
|
dc.identifier.other |
DOI: https://doi.org/10.35681/1560-9189.2018.20.3.158214 |
|
dc.identifier.uri |
http://dspace.nbuv.gov.ua/handle/123456789/168766 |
|
dc.description.abstract |
Работа посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации. |
uk_UA |
dc.description.abstract |
Роботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації. |
uk_UA |
dc.description.abstract |
A method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced. |
uk_UA |
dc.language.iso |
ru |
uk_UA |
dc.publisher |
Інститут проблем реєстрації інформації НАН України |
uk_UA |
dc.relation.ispartof |
Реєстрація, зберігання і обробка даних |
|
dc.relation.ispartof |
Реєстрація, зберігання і обробка даних |
|
dc.subject |
Інформаційно-аналітичні системи обробки даних |
uk_UA |
dc.title |
Автоматическое реферирование китайской правовой информации |
uk_UA |
dc.title.alternative |
Автоматичне реферування китайської правової інформації |
uk_UA |
dc.title.alternative |
A method for public opinion-based formal description of weakly structured subject domains |
uk_UA |
dc.type |
Article |
uk_UA |
dc.status |
published earlier |
uk_UA |
dc.identifier.udc |
004.44:002.513.5 |
|