Рассмотрены проблемы кодирования текстовых данных, организованных как корпус текстов естественного языка, в
частности украинского. Главным образом речь идет о принципах разметки глобальной структуры первичных данных, а
также специфик корпусного текста.
The article deals with the problems of the texts encoding, which is organizing as a natural language corpus, particularly
Ukrainian corpus. Manly we discussed the marking principles of the global structure of primary data and others corpus texts
specificities.