AWS提供免写程式的云端ETL服务Glue DataBrew
AWS
为了让资料科学家更容易进行资料分析,AWS本周宣布完全不用写程式、不用处理资料正规化,用拖拉、点击即可操作完成的云端资料ETL(extract、transform, load)服务Glue DataBrew。
2016年AWS首先推AWS Glue作为第一代ETL服务,强调提供步骤化指引,让资料分析师或资料科学家载入需要分析的资料,但是仍需要有程式撰写技能包括SQL、Python、Scala。之后AWS又推出了Glue Studio服务,它省去了写程式的麻烦,但是使用者仍然需处理资料清洗、正规化,这作业仍然需要仰赖ETL工程师,使得资料分析光是ELT作业就可能要花上数星期甚至几个月。此外,常见的工具如Excel或Jupyter Notebook等试算表则无法处理大量资料。
新的AWS Glud DataBrew则在AWS Glue基础上加以改进,使用者无需写任何程式码,透过点击、互动视觉化介面即可完成操作。它内建250种资料转换功能,像是筛选异常、标準化资料(如时间及日期)格式、产生集结、修正无效资料值等,可汇入来自AWS S3资料湖泊、Redshift资料仓储及Amazon Aurora及Amazon RDS(Relational Database Service)的资料。这项工具可提供资料清洗的建议。DataBrew还具备自然语言处理(NLP)技能来处理较複杂的转换,像是将文字变成资料栏位值(如将yearly转成「年度」)。
AWS宣称新工具可将过往几天或几个星期的工作大幅缩短。资料準备完成后,DataBrew会将结果出版到Amazon S3。资料分析师之后即可使用第三方(当然最好是AWS的)分析或机器学习服务来查询资料,或是训练机器学习模型。
AWS DataBrew是根据转换的资料量付费。这项服务已在美国、欧洲、亚太(澳洲及日本)区上线,之后会再推向其他地区。目前用户包括NTT Docomo 、英国石油(BP)及化纤厂Invista等。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
- 吃凤梨上火还是降火(cf雷神好还是黑龙好)
- 售楼小姐挣钱吗(真赚钱售楼小姐的一个月工资多少)
- 机动战士高达OOV(审判者纳德雷高达)
- 儿子结婚邀请函简短大气(儿子结婚邀请函简介介绍)
- 小鱼儿与花无缺林志颖版本(小鱼儿与花无缺林志颖版的现在怎么看不了了)
- msduo记忆棒(MSD记忆棒是什么东西啊)
- 巴西最重要的矿产资源(巴西最大的铁矿山是.","titletext":"巴西最大的铁矿山是.)
- 药水哥的直播在哪里看(药水哥在哪直播简介介绍)
- 我想要军装下的绕指柔得全部番外可不可以给我一份呢(我邮箱xinya12@sina.com)
- 爸爸见义勇为的作文(结尾处感想100字怎么写)
- 战鼓电影结局是什么(战鼓这部影片讲的是什么)
- start(king fx和shinee一起来的是哪期)
最新文章
- 个性标签写什么好8个字(个性标签8个字简介介绍)
- 贴吧和i吧有什么区别(贴吧和i吧有什么区别)
- 东北话得细小是什么意思(东北话小得得是啥意思)
- 太姥山旅游最新攻略一日游(太姥山旅游线路)
- 12月有什么好电影上映(12月上映好看的电影)
- 妒海主题曲百度云(泰剧妒海的主题曲和片尾mp3格式的谁有谢谢)
- 元奎在好莱坞拍过多少电影(指导过多少电影 都叫什么)
- 怎么关闭wps删除提示(wps屏幕提醒怎么关闭简介介绍)
- 4399弹弹堂vip折扣券(4399弹弹堂怎么刷点券啊)
- 企业天猫入驻条件及费用(天猫入驻条件及费用简介介绍)
- 尹相杰母亲是马玉涛吗(尹相杰母亲是马玉涛吗)
- 冬至应该吃什么食物(冬至应该吃什么食物)
- nokia6600复刻版本(NOKIA6630~~~)
- 新年快乐日语怎么说(新年快乐日语怎么说)
- 工作交接清单怎样写,格式是怎样的(工作交接清单怎样写格式是怎样的简介介绍)
- 为什么我的梦幻诛仙人物快捷键用不出来(求高手解答 我换了很多台机子了)
- 三星note3开不了机(三星note1手机为什么开不了机)
- 迅雷种子怎么提取(前缀是什么)
- poison(ivy 什么意思)
- 魔法卡片掉卡规则(魔法卡片中怎么没有变闪卡的卡友)
- 眼部结构简图(眼部结构简介介绍)
- 武汉外高国际部学费(武汉外高出国)
- 湖南台为什么叫马桶(湖南台为什么叫芒果台)
- 公元前10000年是什么年(公元前10000年)