It is becoming clear with growing complication of cybersecurity threats, that one of the most important resources to combat cyberattacks is the processing of large amounts of data in the cyber environment. In order to process a huge amount of data and to make decisions, there is a need to automate the tasks of searching, selecting and interpreting Big Data to solve operational information security problems. Big data analytics is complemented by semantic technology, can improve cybersecurity, and allows you to process and interpret large amounts of information in the cyber environment. Using of semantic modeling methods in Big Data analytics is necessary for the selection and combination of heterogeneous Big Data sources, recognition of the patterns of network attacks and other cyber threats, which must occur quickly to implement countermeasures. Therefore to analyze Big Data metadata, the authors propose pre-processing of metadata at the semantic level. As analysis tools, it is proposed to create a thesaurus of the problem based on the domain ontology, which should provide a terminological basis for the integration of ontologies of different levels. To build a thesaurus of the problem, it is proposed to use the standards of open information resources, dictionaries, encyclopedias. The development of an ontology hierarchy formalizes the relationships between data elements that will be used in future for machine learning and artificial intelligence algorithms to adapt to changes in the environment, which in turn will increase the efficiency of big data analytics for the cybersecurity domain.
Із зростанням і частим ускладненням загроз кібербезпеки, стає очевидним, що одним із найважливіших ресурсів для боротьби з кібератаками є оброблення великого обсягу даних у кіберсередовищі. Для оброблення величезної кількості даних та для прийняття рішень постає потреба у автоматизації задач пошуку, відбору та інтерпретації Великих Даних для вирішення оперативних задач інформаційної безпеки. Однак традиційні технології аналітики Великих Даних мають обмежені можливості і потребують нового підходу – застосування знань для керування життєвим циклом Великих Даних. Аналітика Великих Даних доповнена семантичними технологіями, може покращити кіберзахист, та дозволяє обробляти і інтерпретувати великі обсяги інформації в кіберсередовищі. Для аналізу метаданих Великих Даних автори пропонують попередню обробку метаданих на рівні семантики. Детальний опис знань про домен інформаційної безпеки має ієрархічну структуру, яка складається з декількох рівнів. Для побудови тезаурусу задачі запропоновано використати стандарти відкритих інформаційних ресурсів, словники, енциклопедії. Розробка ієрархії онтологій формалізує взаємозв’язки між елементами даних, які в майбутньому будуть використані для машинного навчання та алгоритмів штучного інтелекту для адаптації до змін у середовищі, що у свою чергу підвищить ефективність аналітики великих даних для домену кібербезпеки.