Amazon Web Services 向所有客户提供 AWS Glue-ESG跨境

Amazon Web Services 向所有客户提供 AWS Glue

亚马逊观察
亚马逊观察
2017-08-19
点赞icon 0
查看icon 748

Amazon Web Services 向所有客户提供 AWS Glue

西雅图--今天,Amazon.com 旗下公司(纳斯达克股票代码:AMZN)推出了 AWS Glue,这是一种完全托管的提取、转换和加载 (ETL) 服务,使客户可以轻松准备数据并将其加载到 Amazon Simple Storage Service (Amazon S3)、Amazon Redshift、Amazon Relational Database Service (Amazon RDS) 以及在 Amazon Elastic Compute Cloud (Amazon EC2) 上运行的数据库中进行查询和分析。客户只需在 AWS 管理控制台中单击几下即可创建和运行 ETL 作业。客户只需将 AWS Glue 指向其存储在 AWS 上的数据,AWS Glue 就会发现相关的元数据(例如表定义)并对其进行分类,生成用于数据转换的 ETL 脚本,并将转换后的数据加载到目标数据存储中,从而预置所需的基础设施完成工作。借助 AWS Glue,数据可以在几分钟内用于分析,而且由于 AWS Glue 是无服务器的,因此客户只需为执行数据准备和加载作业时消耗的计算资源付费。要了解有关 AWS Glue 的更多信息,请访问 。

“我们从各种数据源中提取格式、模式和质量各不相同的临床试验数据、医学词汇和科学出版物,以便为我们的客户提供见解”

数据集成——从各种来源提取数据、对其进行规范化并将其加载到数据存储中——通常占实施分析项目所需时间的 75%。客户可能会花费数月时间手动编码和编辑 ETL 脚本,随着数据量的增长和新数据源的添加,这些脚本通常会变得更加复杂和容易出错。而且,运行 ETL 作业需要在作业之间经常闲置的专用硬件。 AWS Glue 消除了创建、管理和修改 ETL 作业所涉及的所有无差别繁重工作,从而显着加快了分析项目的 ETL 阶段。

在抓取客户选择的数据源后,AWS Glue 识别数据格式和架构以构建统一的数据目录,提供客户选择数据的集中视图。这使客户可以轻松地在各种数据存储中搜索和管理他们的所有数据,而无需手动移动它。当客户从数据目录中识别出数据源(例如,数据库表)和目标(例如,数据仓库)时,AWS Glue 会匹配架构并生成可定制、可重用、可移植和可共享的数据转换代码。开发人员可以安排任意数量的 ETL 作业,其余的由 AWS Glue 管理——根据客户 ETL 工作负载自动调整计算资源。通过简化创建 ETL 作业的流程,AWS Glue 允许客户构建涵盖数千个作业的可扩展且可靠的数据准备平台,并具有内置的依赖关系解析、调度、资源管理和监控功能。

“AWS 的可扩展、可靠的云存储与我们广泛的分析服务相结合,使客户能够比以往更轻松地收集、存储、分析和共享数据,”亚马逊数据库、分析和人工智能副总裁 Raju Gulabani 说网页服务。 “虽然看到今天在 AWS 上运行了多少分析令人惊讶,但许多人告诉我们,有一个方程式仍然太难了——清理和准备大量数据以供分析。我们开发 AWS Glue 以消除 ETL 所涉及的大部分无差别繁重工作。通过对客户的所有数据进行编目并自动执行 ETL 流程,AWS Glue 不仅消除了分析中的大量麻烦。它还使客户能够将他们的数据存储在他们想要的任意数量的来源中,并使用他们选择的任何 AWS 服务快速开始分析所有数据。”

NewsCorp 是一家全球性的新闻和商业信息提供商,每天向 50 多个国家/地区的数亿消费者提供内容。 “在 NewsCorp,我们正在 AWS 上构建一个世界级的数字平台,以向我们的外部客户分发内容,并促进我们所有业务的数据驱动决策。我们合并来自各种来源的数据,并将其持续加载到我们基于 Amazon S3 的数据湖中,”NewsCorp 首席数据官 Simon Smith 说。 “AWS Glue 在推断、分类和转换数据的能力方面无与伦比。借助 AWS Glue,我们的数据科学家和分析师始终可以访问我们数据湖中可用的最新数据。 AWS Glue 数据目录会自动检测新数据的可用性,推断其元数据并使其在 Amazon Athena 中随时可用,以便我们可以开始查询该数据。我们的 AWS Glue ETL 作业将各种数据格式的原始数据无缝转换为 Amazon Athena 优化的 Parquet 数据格式。最好的部分是 AWS Glue 是无服务器的。我们不必提供或管理任何资源来准备分析数据。”

21 世纪福克斯拥有全球媒体公司组合,每天以 50 种语言覆盖超过 18 亿户家庭。 “作为我们整体数据战略的一部分,我们正在 Amazon S3 上构建 PB 级数据湖,以便我们的高管可以通过统一的数据平台访问任何数据资产。我们从各种来源引入数据,从我们的 ERP 系统到点击流和移动分析,对其进行处理,并以可查询的形式提供,”21 世纪福克斯全球首席信息官 John Herbert 说。 “我们总是有兴趣尝试新产品,以减少管理数据湖的管理开销。 AWS Glue 自动发现新数据、提取相关元数据并通过中央数据目录使其可用的能力给我们留下了深刻印象,因此我们可以立即开始查询这些数据。我们期待着让 AWS Glue 成为我们数据湖的一个组件。”

myTomorrows 是一个在线平台,以临床试验和早期访问计划的形式提供信息和治疗选择。 “我们从各种数据源中提取格式、模式和质量各不相同的临床试验数据、医学词汇和科学出版物,以便为我们的客户提供洞察力,”myTomorrows 首席技术官 Robert-Jan Sips 说。 “AWS Glue 的自动架构发现和代码生成功能对于像我们这样快速发展的小型组织来说确实是游戏规则的改变者。 AWS Glue 使载入新数据集变得极其简单且经济高效,其无服务器产品使测试和运行我们的 ETL 作业变得轻而易举。我们的开发人员喜欢他们可以简单地将笔记本连接到 AWS Glue,并且无需任何加速时间即可开始工作。”

OLX 集团在 40 多个国家运营在线交易平台网络,在全球拥有超过 3 亿月度用户。 “我们将所有在线市场的数十亿每月访问和页面浏览量的点击流数据收集到 Amazon S3 上的中央数据湖中。我们一直在寻找能够使我们的数据摄取管道稳健、可靠和自动化的产品,”OLX 数据工程经理 Jakub Orlowski 说。 “我们抓住了第一次开始使用 AWS Glue 的机会,并且喜欢它的易用性、灵活性和零管理开销。 AWS Glue 自动将我们数据湖中的原始 JSON 数据转换为 Parquet 数据格式,并通过中央数据目录使其可用于搜索和查询。我们可以使用 Zeppelin 笔记本编辑 AWS Glue 生成的 ETL 代码,一旦完成,AWS Glue 就会在无服务器 Spark 平台上运行所有内容。 AWS Glue 将使我们能够将我们的数据创新和民主化努力提升到一个新的水平,并使数据生产者和消费者比以往任何时候都更加紧密。”

OST 是 APN 合作伙伴,在为连接产品构建企业云解决方案方面拥有专业知识,正在与全球最大的办公家具制造商之一 Herman Miller 合作,将物联网和大数据带入工作场所。 “我们正在与 Herman Miller 合作开发物联网平台和分析解决方案,以从支持传感器的家具中收集实时数据,在数据湖中对其进行分类,然后运行机器学习算法。办公室员工受益于即时的人体工程学调整,雇主可以衡量其空间的有效性,以实现最佳的房地产使用,”OST 高级建筑师 Alex Jantz 说。 “AWS Glue 帮助我们将 DevOps 时间缩短了一半。我们从一个自动生成的脚本开始,然后根据需要使用 Zeppelin 笔记本对其进行自定义。 AWS Glue 完全重新定义了我们对 ETL 的看法。我们只关注自定义代码,其余的由 AWS Glue 负责。”

客户可以通过 AWS 管理控制台开始使用 AWS Glue。 AWS Glue 在美国东部(弗吉尼亚北部)区域可用,并将在未来几个月扩展到其他区域。

关于亚马逊网络服务

11 年来,Amazon Web Services 一直是世界上最全面、应用最广泛的云平台。 AWS 为计算、存储、网络、数据库、分析、应用程序服务、部署、管理、开发人员、移动、物联网 (IoT)、人工智能 (AI)、安全、混合和企业应用程序提供 90 多项功能齐全的服务,来自美国、澳大利亚、巴西、加拿大、中国、德国、印度、爱尔兰、日本、韩国、新加坡和英国 16 个地理区域的 44 个可用区 (AZ)。 AWS 服务受到全球数百万活跃客户的信赖——包括增长最快的初创公司、最大的企业和领先的政府机构——为他们的基础设施提供支持、使其更加敏捷并降低成本。

关于亚马逊

亚马逊遵循四项原则:以客户为中心而非以竞争对手为中心、对发明的热情、对卓越运营的承诺以及长期思考。客户评论、一键购物、个性化推荐、Prime、亚马逊物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板电脑、Fire TV、亚马逊 Echo 和 Alexa 是亚马逊率先推出的一些产品和服务。欲了解更多信息,请访问并关注@AmazonNews。

点击咨询现在有哪些新兴平台值得关注 >>>


特别声明:以上文章内容仅代表作者本人观点,不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。

全球最大电商平台
查看更多
搜索 放大镜
韩国平台交流群
加入
韩国平台交流群
扫码进群
欧洲多平台交流群
加入
欧洲多平台交流群
扫码进群
美国卖家交流群
加入
美国卖家交流群
扫码进群
ESG跨境专属福利分享群
加入
ESG跨境专属福利分享群
扫码进群
拉美电商交流群
加入
拉美电商交流群
扫码进群
亚马逊跨境增长交流群
加入
亚马逊跨境增长交流群
扫码进群
《开店大全-全球合集》
《开店大全-主流平台篇》
《开店大全-东南亚篇》
《CD平台自注册指南》
《开店大全-俄罗斯篇》
《韩国站内推广指南》
《韩国热销品预测》
《开店大全-日韩篇》
《开店大全-拉美篇》
《开店大全-欧洲篇》
通过ESG入驻平台,您将解锁
绿色通道,更高的入驻成功率
专业1v1客户经理服务
运营实操指导
运营提效资源福利
平台官方专属优惠
联系顾问

平台顾问

平台顾问 平台顾问

微信扫一扫
马上联系在线顾问

icon icon

小程序

微信小程序

ESG跨境小程序
手机入驻更便捷

icon icon

返回顶部