One of the needs of music business is a quick classification of the song genre by means of widely available tools. This work focuses on improving the accuracy of the song genre determination based on its lyrics through the development of software that uses new factors, namely the rhythm of the text and its morpho-syntactic structure. In the research Bayes Classifier and Logistic Regression were used to classify song genres, a systematic approach and principles of invention theory were used to summarize and analyze the results. New features were proposed in the paper to improve the accuracy of the classification, namely the features to indicate rhythm and parts of speec h in the song.
В ХХІ столітті музика – це дуже прибутковий бізнес як для стримінгових сервісів, що пропонують музику користувачу, так і для авторів пісень, що намагаються продати свої тексти. Однією з потреб цього бізнесу є визначення жанру майбутньої або вже існуючої пісні, щоб вигідно продати її замовнику, або запропонувати зацікавленому користувачу. Практика вимагає все більшої і більшої точності, але існуючі практичні підходи не спроможні її надати, оскільки методи класифікації пісень за жанром недостатньо розвинуті на теоретичному рівні. Ця робота зосереджена на підвищенні точності визначення жанру пісні за її текстом шляхом розробки програмного забезпечення, що використовує нові фактори, а саме ритм тексту та його морфо-синтаксичну структуру. У дослідженні використовувалися класифікатор Байєса та логістична регресія для класифікації жанрів пісен, систематичний підхід та принципи теорії винахідництва для узагальнення та аналізу результатів. Програми були написані на мові програмування Python. У роботі було запропоновано нові метрики для підвищення точності класифікації, а саме метрики на позначення ритму тексту та кількості різних частин мови в пісні.