Hive的4种排序

2023-03-04 16:31 由 Coko_QY 发表于 #数据库

1、全局排序（Order by）

功能：全局排序，只有1个reducer（用1个Reduce Task完成全局排序，与设置的Reduce Task个数无关）

参数：ASC：升序（默认）　　DESC：降序

使用：order by放在select语句的结尾

例如：

　　--查询员工信息按工资降序排列

　　select * from emp order by sal DESC；

2、每个MapReduce内部排序（Sort by）

功能：很多情况下不需要全局排序，此时可以使用sort by。sort by为每个reducer产生一个排序文件，每个reducer内部进行排序，不对全局结果集进行排序

参数：设置reduce个数：set mapreduce.job.reduces=3;

例如：　　

　　--根据部门编号降序查看员工信息

　　select * from emp sort by deptno desc;

3、分区排序（Distribute by）

功能：类似mr中的自定义分区

使用：结合sort by使用，写在sort by语句之前

分区规则：根据分区字段的Hash码与reduce的个数进行模除后，余数相同的分到一个区

例如：

　　--先按照部门编号分区，再按照员工编号降序排序。

　　select * from emp distribute by deptno sort by empno desc;

4、Cluster by

功能：当distribute by和sorts by字段相同时，可以使用cluster by方式

使用：cluster by除了具有distribute by的功能外还兼具sort by的功能。但是排序只能是升序排序，不能指定排序规则为ASC或者DESC

例如：

　　--以下两种写法等价

　　select * from emp cluster by deptno;

　　select * from emp distribute by deptno sort by deptno;

热门相关：骑士归来第一神算：纨绔大小姐明月照大江霸皇纪天启预报

深度剖析Redis九种数据结构实现原理，建议收藏

Redis 是一个高性能的键值存储系统，支持多种数据结构。包含五种基本类型 String（字符串）、Hash（哈希）、List（列表）、Set（集合）、Zset（有序集合），和三种特殊类型 Geo（地理位置）、HyperLogLog（基数统计）、Bitmaps（位图）。 ...阅读全文

一文了解MySQL中的多版本并发控制

最近在阅读《认知觉醒》这本书，里面有句话非常打动我：通过自己的语言，用最简单的话把一件事情讲清楚，最好让外行人也能听懂。希望借助今天这篇文章，能用大白话说清楚这个相对比较底层和复杂的MVCC机制 ...阅读全文

解释一下布隆过滤器原理

锁屏面试题百日百刷，每个工作日坚持更新面试题。请看到最后就能获取你想要的,接下来的是今日的面试题： 1.解释一下布隆过滤器原理在日常生活中，包括在设计计算机软件时，我们经常要判断一个元素是否在一个集合中。比如在字处理软件中，需要检查一个英语单词是否拼写正确（也就是要判断它是否在已知的字典中）；在 ...阅读全文

sql 截取表中指定字段

函数介绍：substring() 函数用于截取字符串，可从字符串的某一位置开始，向右截取若干个字符，返回一个特定长度的字符串功能：返回字符、二进制、文本或图像表达式的一部分语法：SUBSTRING ( expression, start, length ) SQL 中的 substring 函数 ...阅读全文

详解事务模式和Lua脚本，带你吃透Redis 事务

摘要：Redis事务包含两种模式：事务模式和Lua脚本。本文分享自华为云社区《一文讲透 Redis 事务》，作者：勇哥java实战分享。准确的讲，Redis事务包含两种模式：事务模式和Lua脚本。先说结论： Redis的事务模式具备如下特点：保证隔离性；无法保证持久性；具备了一定的原子 ...阅读全文

postgresSQL Extended Query执行过程和sharding-proxy的处理

pg Extended Query PostgreSQL: Documentation: 15: 55.2. Message Flow 多个阶段，可复用 Parse → DESCRIBE statement → SYNC Parse 解析，将 sql 文本字符串，解析成 named prepare ...阅读全文

浅析云原生时代的服务架构演进

摘要：相比于传统的微服务架构，云原生和 serverless 技术更加灵活、高效，能够更好地满足用户的需求。本文分享自华为云社区《《凤凰架构》学习和思考——云原生时代的服务架构演进史》，作者：breakDawn。随着云原生的概念越来越火，服务的架构应该如何发展和演进，成为很多程序员关心的话题。大 ...阅读全文

ES_ChatGPT问答

Q1：==springboot项目，如何使用elasticsearch的api增删改查？查询中有哪些方式，如果模糊查询、排序查询、分页查询？分别阐述下这些查询方式的用法？最后举一个完整的例子== 答：在Spring Boot项目中使用Elasticsearch的API增删改查，需要引入spring ...阅读全文

GreatSQL社区月报 | 2023.03

GreatSQL社区月报 | 2023.03 GreatSQL 是一个开源的 MySQL 技术路线数据库社区，社区致力于通过开放的社区合作，构建国内自主 MySQL 版本及开源数据库技术，推动中国开源数据库及应用生态繁荣发展。为了帮助社区的小伙伴们更好地了解 GreatSQL 社区的实时进展，我们 ...阅读全文

HBase在进行模型设计时重点在什么地方？一张表中定义多少个Column Family最合适？为什么？

锁屏面试题百日百刷，每个工作日坚持更新面试题。请看到最后就能获取你想要的,接下来的是今日的面试题： 1.Hbase中的memstore是用来做什么的？ hbase为了保证随机读取的性能，所以hfile里面的rowkey是有序的。当客户端的请求在到达regionserver之后，为了保证写入rowke ...阅读全文