lassedesignen——Fotolia

下一个路径更新的目标是Hadoop迁移

Next Pathway的数据扫描和迁移工具现在可以分析Hadoop生态系统,并将其代码转换到基于云的数据仓库,如Snowflake和Amazon RedShift。

Next Pathway已经破译了Hadoop迁移的代码。

Next Pathway的Crawler360迁移计划和Shift迁移引擎的最新版本在周三正式发布。Crawler360现在允许客户扫描其Hadoop生态系统,并识别其中的所有遗留应用程序,以及它们的数据依赖关系。Crawler360已经覆盖了Teradata和Netezza等传统数据仓库系统,以及Informatica和Talend等ETL框架。

Shift可以将Hadoop的工作负载转移到基于云的数据仓库平台,如Snowflake、Amazon Redshift、Azure Synapse和谷歌BigQuery。将基于hadoop的代码转换为云目标的功能在过去两个月一直处于测试阶段,并在周三的更新中普遍可用。

Hadoop是核心在当今许多组织的商业智能(BI)战略中,Next Pathway首席执行官切坦·马图尔(Chetan Mathur)表示,客户一直在寻找摆脱BI的方法,转而支持基于云计算的数据仓库.然而,由于Hadoop环境的复杂性,这样的迁移需要开发人员手动地将基于Hadoop的数据湖中的代码重写到现代云架构中。

“与EDW(企业数据仓库)不同,EDW(企业数据仓库)可以提升和移动,而不仅仅是Hadoop。你需要首先聪明地计算出工作量,”马图尔说。

Mathur说,有了新的Hadoop支持,Next Pathway现在可以提供一种简化、自动化的替代方案,以替代这种劳动密集型且昂贵的手动过程。

Next Pathway在其他数据管理和迁移供应商(如Komprise和旺迪斯科不仅仅是在环境之间移动数据。它的迁移工具旨在将本地数据湖和数据仓库迁移到云上,同时保持所有数据依赖的完整性,确保遗留应用程序在进入云后仍然可以工作。

Mathur说,将Hadoop翻译成云的挑战不在于破译Hadoop使用的各种代码和查询引擎,而在于开发一种优雅地捕捉开放、非标准环境的方法。通过这次更新,Crawler360能够在多个数据竖井中搜索重复的数据。

“Netezza, Teradata,它们都很标准。但Hadoop是蛮荒的西部——没有设置护栏,人们随意地摄入数据,”Mathur说。“我们需要了解人们是如何将周围的环境拼凑在一起的。”

Mathur说,Next Pathway没有直接的竞争对手,因为希望将数据仓库提升并转移到云端的客户是通过全球系统集成商或者一点也不。许多Hadoop环境都停留在原有的基础上,公司继续在存储上投入资金,因为他们不知道有其他替代方案。马瑟说,这些就是Next Pathway想要瞄准的企业。

许多资源最密集的企业工作负载都与BI有关,这使得它们成为云迁移的首要考虑因素BI工作负载然而,由于其规模和复杂性,云计算的前景一直具有挑战性,Intellyx首席分析师、数字转型研究所(Institute for Digital Transformation)创始人查尔斯·阿劳若(Charles Araujo)表示。

这个任务非常艰巨,以至于组织在执行这些大规模迁移时犹豫不决,尤其是在Hadoop的情况下。Araujo说,市场需求是存在的,但工具不是。

Araujo说,Next Pathway的巨大市场差异在于它专注于这些BI工作负载。它的工具解决了迁移过程的整个生命周期,从初始规划到切换,并允许客户在迁移之前识别和修复环境中的冗余和低效。

“有很多被压抑的愿望移动这些如果企业能够以可管理和可扩展的方式向云端提供密集且昂贵的工作负载,Araujo说。

深入挖掘大数据存储

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu