Наукова електронна бібліотека
періодичних видань НАН України

Застосування мульти-роздiльникових кодiв до архiвування природномовних текстiв

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Анісімов, А.В.
dc.contributor.author Завадський, І.О.
dc.contributor.author Чудаков, Т.С.
dc.date.accessioned 2021-05-01T19:54:29Z
dc.date.available 2021-05-01T19:54:29Z
dc.date.issued 2020
dc.identifier.citation Застосування мульти-роздiльникових кодiв до архiвування природномовних текстiв / А.В. Анісімов, І.О. Завадський, Т.С. Чудаков // Cybernetics and computer engineering. — 2020. — № 4 (202). — С. 5-24. — Бібліогр.: 17 назв. — укр. uk_UA
dc.identifier.issn 2663-2578
dc.identifier.other DOI: https://doi.org/10.15407/kvt202.04.005
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/179367
dc.description.abstract Метою статті є вирішення проблеми немонотонності словника мультироздільникових кодів та дослідження доцільності використання мультироздільникового кодування на стадії попереднього оброблення природномовних текстів у процесі їхнього архівування. Результати. Введено поняття реверсного мультироздільникового коду. Побудовано монотонне кодувальне, а також декодувальне відображення з множини натуральних чисел на множину кодових слів реверсного мультироздільникового коду. Досліджено ефективність застосування реверсних мультироздільникових кодів до стискання природномовних текстів. Запропоновано механізм оптимізації використання словника у процесі архівування природномовних текстів. Проведено експерименти, результати яких свідчать, що попереднє кодування англійських та німецьких текстів реверсними мультироздільниковими кодами та застосування запропонованого методу оптимізації словника дає змогу на 1–3% покращити граничну ефективність стискання, яка досягається найкращими архіваторами в режимі максимального стиснення. uk_UA
dc.description.abstract The purpose of the paper is to solve the problem of non-monotonicity of a multidelimiter code dictionary and investigate the possibility of use the multi-delimiter encoding on the preprocessing stage of natural language texts archiving. Results. The concept of the reverse multi-delimiter code is introduced. The monotonic encoding as well as the decoding mapping from the set of natural numbers to the set of reverse multi-delimiter code codewords is built. The efficiency of applying the reverse multidelimiter codes to natural language text compression is investigated together with the method of dictionary optimization. The provided experiments show that the reverse multi-delimiter encoding of English and German texts on the preprocessing stage and applying the proposed dictionary optimization method allows us to improve the marginal compression efficiency of the most powerful archivers in the maximal compression mode by about 1–3%. uk_UA
dc.language.iso uk uk_UA
dc.publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України uk_UA
dc.relation.ispartof Cybernetics and computer engineering
dc.subject Informatics and Information Technologies uk_UA
dc.title Застосування мульти-роздiльникових кодiв до архiвування природномовних текстiв uk_UA
dc.title.alternative Application of Multi-Delimiter Codes to Natural Language Text Archiving uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 519.72


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис