天天看点

阿里云MaxCompute 2018-09月刊

2018年9月大数据计算服务 MaxCompute 又发布新功能啦!

阿里云MaxCompute 2018-09月刊

【新功能】MaxCompute窗口函数支持WINDOW_CLAUSE

参考文档

适用客户

数据开发人员在进行数据开发过程中,用到调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxCompute在该版本中支持WINDOW语句预定义窗口,避免了这一现象。

发布功能

为了避免多次调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxCompute在该版本中支持WINDOW语句预定义窗口。

【新功能】子查询支持SCALAR SUBQUERY

适用于数据开发人员,在做数据开发时,遇到SUBQUERY的输出结果为单行单列的时候,可以当做标量来使用。

MaxCompute SQL 中当SUBQUERY的输出结果为单行单列的时候,可以当做标量来使用。

【新功能】MaxCompute SQL-支持OUTER LATERAL VIEW

适用于数据开发人员,在做数据拆分的同时进行聚合的需求时,使用Outer Lateral View功能和split、explode等UDTF一起封装使用。

Lateral view通常和split、explode等UDTF一起封装使用,它能够将一行数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。

Lateral view首先为原始表的每行调用UDTF,UDTF会把一行拆分成一行或者多行,Lateral view再把结果聚合,产生一个支持别名表的虚拟表。

Lateral view outer:当table function不输出任何一行时,对应的输入行在Lateral view结果中依然保留,且所有table function输出列为null。

【新功能】MaxCompute 支持使用UDJ(User Defined Join)自定义SQL的Join操作

数据开发人员在遇到很多跨表操作的需求时,原来要依赖于内置join + 各种UDF/UDTF+复杂的SQL语句来完成,一些情况下还只能完全自定义MR来完成,这两个方式门槛高且执行效率低。MaxCompute在UDF框架中新近引入的一种新扩展机制:UDJ(User Defined Join),来实现灵活的跨表、多表自定义操作,同时减少不得不通过MR等方式对分布式系统底层细节的操作。

MaxCompute在UDF框架中新近引入的一种新扩展机制:UDJ(User Defined Join) 来实现灵活的跨表、多表自定义操作,同时减少不得不通过MR等方式对分布式系统底层细节的操作。

【新功能】MaxCompute支持使用UDT在SQL中直接引用第三方语言的类或者对象,获取其数据

适用于数据开发人员在进行数据开发过程中,为了实现一些简单的功能而用到第三方语言的类或对象时,之前只能使用UDF这个过程繁杂的方式,通过UDT则可以直接在SQL中直接调用,提升了SQL语言编译过程的易用性与语言的表达能力,进而提升数据开发人员的工作效率。

MaxCompute的UDT提供了调用第三方库的功能,不需要用特殊的DDL语法来定义类型的映射,直接在SQL中使用。

【新功能】国际站开启FullScan限制功能

追求成本控制的MaxCompu用户。

通过限制全表扫描,可以控制SQL/MR计算量,避免用户因暴力扫描导致的贵账单。

【体验优化】MaxCompute优化器(Optimizer)性能提升

MaxCompute优化器(Optimizer)基于MaxCompute-bench测试集合整体性能在生产环境可以提高约7%。

优化功能

1、Advanced Shuffle Remove:可以支持Sorted Merge Join和Sorted Aggregate的排序和分布属性被后续操作利用,从而减少Shffle操作。

2、Dynamic Parallelism: 对运行时的数据量动态估计reduce数量。

3、Auto Map Parallelism:Map split size支持列裁剪和压缩比估计。

4、Map Join小表汇集: Map Join小表将首先汇集到单节点,提升broadcast的效率。

5、多处优化性能调优:分区裁剪、代价估计算法的性能有多处调优,优化做得更快。

6、更完整的Join Grouping。

【新地域/可用区】大数据计算服务 MaxCompute 英国(伦敦)节点正式开服售卖

现在开通

大数据计算服务 MaxCompute 英国(伦敦)节点开服售卖。 可在国际站、中文站、日本站购买迪拜节点资源,在控制台按需求开通project。

好文推荐>>>

【技术干货】十三次大数据技术实践的直播回看与资料下载,你值得拥有 【技术干货】开箱即用的安全方案:MaxCompute数据安全方案介绍 【最佳实践】华北1 ECS 数据如何免费且高速同步到华北2MaxCompute 【云栖头条】阿里关涛谈大规模计算—从数字化阿里到数字化城市的进化 【产品动态】MaxCompute存储力持续升级,每年节省不止一个亿 【程序人生】专访20年技术老兵云郎:16年峰回路,每一步都是更好的沉淀

更多交流咨询欢迎加入“MaxCompute开发者交流”钉钉群,群号: 11782920,或扫描二维码入群。

阿里云MaxCompute 2018-09月刊