Розглянуто проблеми, пов’язані з обробкою великих даних з метою здобуття з них неявних знань. Проаналізовано методи машинного навчання, що можуть застосовуватися для цього, та доцільність поєднання їх елементами штучного інтелекту та технологіями Semantic Web. Розглянуто приклади застосування онтологій та семантичної Wiki-розмітки для підвищення ефективності машинного навчання.
Рассмотрены проблемы, связанные с обработкой больших данных с целью получения из них неявных знаний. Проанализированы методы машинного обучения, которые могут применяться для этого, и целесообразность объединения их элементами искусственного интеллекта и технологиями Semantic Web. Рассмотрены примеры применения онтологий и семантической Wiki-разметки для повышения эффективности машинного обучения.
The paper discusses problems related to the processing of Big Data in order to acquire implicit knowledge from them. Machine learning (ML) methods oriented on these tasks can be combined with elements of the Semantic Web technologies and Artificial Intelligence (AI), which deals with intelligent behavior, learning and adaptation in computational systems. We analyse challenges and opportunities background knowledge using to improve ML results, the role of ontologies and other resources of domain knowledge. Domain knowledge could improve the quality of ML results by using reasoning techniques to select learning models and prepare the training and test data. We propose some examples demonstrated the use of ontologies and semantic Wiki markup for improving the efficiency of machine learning are considered deal with functional posibilities of the portal version of the Great Ukrainian Encyclopedia. Ontological model of this informational resource is considered as a domain knowledge base. Groupping of examples is based on high-level ontological classes, and semantic properties and their relations are used for construction of space of attributes.