Наукова електронна бібліотека
періодичних видань НАН України

Алгоритм сегментации слов на основе поиска кратчайшего пути в графе

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Ландэ, Д.В.
dc.contributor.author Березин, Б.А.
dc.contributor.author Павленко, О.Ю.
dc.date.accessioned 2020-05-07T14:06:05Z
dc.date.available 2020-05-07T14:06:05Z
dc.date.issued 2017
dc.identifier.citation Алгоритм сегментации слов на основе поиска кратчайшего пути в графе / Д.В. Ландэ, Б.А. Березин, О.Ю. Павленко // Реєстрація, зберігання і обробка даних. — 2017. — Т. 19, № 4. — С. 3–15. — Бібліогр.: 23 назв. — рос. uk_UA
dc.identifier.issn 1560-9189
dc.identifier.other :DOI: https://doi.org/10.35681/1560-9189.2017.19.4.142917
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/168664
dc.description.abstract Рассмотрены особенности алгоритмов сегментации слов из текстов, не содержащих разделителей. Представлен новый алгоритм сегментации слов на основе поиска кратчайшего пути. Приведены оценки качества сегментации. Показаны возможности использования приведенного алгоритма в задачах поиска информации в национальных до­менах сети Интернет. Реализация алгоритма сегментации слов используется для создания обобщенной модели предметной области на базе мониторинга ресурсов китайского сегмента Интернет. uk_UA
dc.description.abstract Розглянуто особливості алгоритмів сегментації слів з текстів, які не містять роздільників. Представлено новий алгоритм сегментації слів на основі пошуку найкоротшого шляху. Наведено оцінки якості сегментації. Показано можливості використання наведеного алгоритму в задачах пошуку інформації у національних доменах мережі Інтернет. Реалізацію алгоритму сегментації слів використано для створення узагальненої моделі предметної області на базі моніторингу ресурсів китайського сегменту Інтернет. uk_UA
dc.description.abstract The features of word segmentation algorithms from such texts are considered. A new algorithm for words segmenting based on a modified wave algorithm has been presented. The algorithm takes into account the features of the input data and is built in such a way that the necessary calculations are performed in a single pass. This reduces its computational complexity. A description of the word segmentation algorithm is given. An example is shown of splitting an input string in English into words, representing it in the form of a graph and finding the shortest path.To assess the quality of segmentation, the EDWS (Edit Distance of the Word Separator) method is presented. A special tool was used to assess the segmentation of Chinese words with a test corpora based on news texts. uk_UA
dc.language.iso ru uk_UA
dc.publisher Інститут проблем реєстрації інформації НАН України uk_UA
dc.relation.ispartof Реєстрація, зберігання і обробка даних
dc.subject Математичні методи обробки даних uk_UA
dc.title Алгоритм сегментации слов на основе поиска кратчайшего пути в графе uk_UA
dc.title.alternative Алгоритм сегментації слів на основі пошуку найкоротшого шляху в графі uk_UA
dc.title.alternative Algorithm for word segmentation based on the shortest path algorithm inside a graph uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 001.103:004.056


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис