Enable javascript in your browser for better experience. Need to know to enable it? Go here.
已发布 : Apr 13, 2021
Not on the current edition
This blip is not on the current edition of the Radar. If it was on one of the last few editions it is likely that it is still relevant. If the blip is older it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar Understand more
Apr 2021
试验 ? 值得一试。了解为何要构建这一能力是很重要的。企业应当在风险可控的前提下在项目中尝试应用此项技术。

AWS Data Wrangler 是一个开源库,可以将数据框连接到 AWS 数据相关的服务,从而将 Pandas 的功能扩展到 AWS。另外,该库还利用 Apache ArrowBoto3 暴露了一些 API,用于从数据湖和数据仓库中加载、转换和保存数据。AWS Data Wrangler 最大的限制是不支持大型的分布式数据流水线操作。但是,你可以使用原生的数据服务(如 Athena、Redshift 和 Timestream 等)进行大批量的数据上传和提取工作,来表示适用于数据框的复杂转换。我们在生产环境中使用过 AWS Data Wrangler。它可以使你专注于编写转换,而不必在连接AWS数据服务上花费太多时间。

Radar

下载第25期技术雷达

English | Español | Português | 中文

Radar

获取最新技术洞见

 

立即订阅

查看存档并阅读往期内容