Enable javascript in your browser for better experience. Need to know to enable it? Go here.
radar blip
radar blip

AWS Data Wrangler

发布于 : Apr 13, 2021
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。 了解更多
Apr 2021
Trial ? 值得一试。了解为何要构建这一能力是很重要的。企业应当在风险可控的前提下在项目中尝试应用此项技术。

AWS Data Wrangler 是一个开源库,可以将数据框连接到 AWS 数据相关的服务,从而将 Pandas 的功能扩展到 AWS。另外,该库还利用 Apache ArrowBoto3 暴露了一些 API,用于从数据湖和数据仓库中加载、转换和保存数据。AWS Data Wrangler 最大的限制是不支持大型的分布式数据流水线操作。但是,你可以使用原生的数据服务(如 Athena、Redshift 和 Timestream 等)进行大批量的数据上传和提取工作,来表示适用于数据框的复杂转换。我们在生产环境中使用过 AWS Data Wrangler。它可以使你专注于编写转换,而不必在连接AWS数据服务上花费太多时间。

下载 PDF

 

English | Español | Português | 中文

订阅技术雷达简报

 

立即订阅

查看存档并阅读往期内容