Наукова електронна бібліотека
періодичних видань НАН України

Эффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduce

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Глибовец, А.Н.
dc.contributor.author Дмитрук, Я.О.
dc.date.accessioned 2017-02-07T20:48:53Z
dc.date.available 2017-02-07T20:48:53Z
dc.date.issued 2016
dc.identifier.citation Эффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduce / А.Н. Глибовец, Я.О. Дмитрук // Управляющие системы и машины. — 2016. — № 5. — С. 84-92. — Бібліогр.: 10 назв. — рос. uk_UA
dc.identifier.issn 0130-5395
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/113403
dc.description.abstract Исследована эффективность использования различных языков для фреймворка Apache Hadoop с целью обработки больших коллекций данных на базе модели MapReduce. Акцент сделан на анализе скорости выполнения программ в Hadoop-кластере. Проведено сравнение различных проектов по экосистеме Hadoop для распределенных вычислений. Описанные эксперименты подтвердили преимущество использования Apache Spark. Установлено, что преимущество в скорости MapReduce-программ, написанных на Java- или другом JVM-языке, существенны. uk_UA
dc.description.abstract Досліджено ефективність використання різних мов програмування у фреймворку Apache Hadoop для обробки великих колекцій даних з використанням моделі MapReduce. Акцент зроблено на аналізі швидкості виконання програм у Hadoopкластері. Проведено порівняння різних проектів із екосистеми Hadoop для розподілених обчислень. Описано експерименти, які підтвердили переваги використання Apache Spark. Встановлено, що перевага у швидкості MapReduce-програм, написаних на Java- або іншій JVM-мові над іншими, є суттєвою. uk_UA
dc.description.abstract The effectiveness of the different languages for Apache Hadoop framework to process large data collections based on the MapReduce model is discussed. Apache Hadoop is used in many industrial projects all over world such as Facebook and Yahoo!. It provides the ability to process different tasks effectively and reliably on the cluster to handle the huge amounts of data. MR model allows the developers to ignore the complex architectures by cluster management, and immediately to develop a program. This work investigates the influence of the programming language on the speed of the program in the Apache Hadoop framework. The subject of comparison is the execution of programs in Java, Scala and Python that implements the solution of the simple problem: how long each word in the input collection of text documents is searched. All three programs, in spite of the language, is written in the same style, so that the comparison results are objective. For the experiments, we have chosen the image of ClouderaQuickstart VM virtual machine. The easy use of this virtual machine is that it is already established Hadoop, HDFS, and other services. Also, a cluster of three nodes is created for the study. CDH is elected as the distribution of Apache Hadoop and related projects. The desired configuration on each node is set. Each program is ran for the different size input: 8Mb, 34Mb, 61Mb, 106Mb and 203Mb. During the experiments, the best results is showed by the program that is written in the Apache Spark. In addition, it is found that the MR program in the Apache Hadoop is better to write in Java or any other JVM languages than Python. An advantage in speed is obvious. Also, experiments shows that the processing speed is larger at higher input collections. So, it is not necessary to use Hadoop to work with small data. uk_UA
dc.language.iso ru uk_UA
dc.publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України uk_UA
dc.relation.ispartof Управляющие системы и машины
dc.subject Программная инженерия и программные средства uk_UA
dc.title Эффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduce uk_UA
dc.title.alternative Ефективність застосування мов програмування в фреймворку Apache Hadoop з використанням MapReduce uk_UA
dc.title.alternative The Effectiveness of Programming Languages in the Apache Hadoop MapReduce Framework uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 681.3:658.56


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис