Библиотека Apache Hadoop производит распределенную обработку больших наборов данных. Для этого используются простые модели программирования под Hadoop. Основное назначение Hadoop – обеспечить управление процессами обработки данных на множестве серверов и их синхронизацию, но только за счет программного обеспечения, убрав управление на кластерном, аппаратном уровне.
Система IBM PureData для Hadoop разрабатывалась с учетом такого подхода в плане аппаратного и программного обеспечения, подготовленного для облачной архитектуры. Все преимущества и особенности Hadoop объединяются с поддержкой и простым администрированием, которые может предложить PureData.
Для обеспечения интеграции Hadoop и данной системы были объединены IBM InfoSphere BigInsights и серверы IBM System x; таким образом, программное обеспечение для обработки больших наборов данных интегрировано в простом с точки зрения администрирования комплексе, а обновления производятся компанией IBM для всего вычислительного комплекса. Связываться с какими-либо сторонними службами поддержки аппаратных средств и ПО Hadoop не нужно.
Если необходимо выстроить среду с высокой готовностью, интегрированную и оптимизированную под повышение производительности, то взяв бесплатно распространяемую версию Hadoop, вы столкнетесь с множеством трудностей. В системе PureData для Hadoop вся эта функциональность уже есть, она также полностью интегрирована с другими аппаратными решениями PureSystems, которые вы возможно уже используете. Это важные моменты, которые необходимо учитывать, выбирая между платным и бесплатным решением. Было много примеров внедрения, где использовались сложные инструменты с открытым кодом, требовавшие огромных навыков написания собственного дополнительного программного обеспечения для достижения требуемой функциональности. В итоге, когда разработчики переходили на другие проекты или в другие компании, возникали проблемы. Может показаться, что такое коммерческое предложение, как PureData для Hadoop, – альтернатива дорогая, но в долгосрочной перспективе вы сможете сэкономить время и деньги на обновлениях, поддержке и интеграции с уже имеющимися системами.
Источник: PureSystems blog.
ссылка на оригинал статьи http://habrahabr.ru/company/ibm/blog/205334/
Добавить комментарий