在项目中我们常会对数据进行去重处理,有时候会用in或者EXISTS函数。或者通过group by也是可以实现查重
不过Postgresql还有自带去重函数:distinct
下面是distinct 的实例:
1、创建表:user
CREATE TABLE `user` ( `name` varchar(30) DEFAULT NULL, `age` int(11) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `user` VALUES ('张三', 20); INSERT INTO `user` VALUES ('李四', 22); INSERT INTO `user` VALUES ('李四', 20); INSERT INTO `user` VALUES ('张三', 22); INSERT INTO `user` VALUES ('张三', 20);
查询结果:
SELECT * FROM user 张三 20 李四 22 李四 20 张三 22 张三 20
2、根据 name 查询去重后的数据:
SELECT distinct name FROM user 张三 李四
3、根据name 和 age 查询去重后的数据:
SELECT distinct name,age FROM user 张三 20 李四 22 李四 20 张三 22
4、根据name,age查询重复数据数:
SELECT distinct name,age,count(*) 数据条数 FROM user GROUP BY name,age 张三 20 2 张三 22 1 李四 20 1 李四 22 1
二、查出重复数据后,我们需要删除重复数据
删除重复数据一般几种方式,一般采用 临时表 或者根据 某个字段,例如id等,通过max或者min函数去重。
"htmlcode">
satdb=# create table test_ctid(id int,name varchar(100)); satdb=# insert into test_ctid values(1,‘a'),(1,‘a'); satdb=# insert into test_ctid values(2,‘a'),(3,‘a');
查看记录的ctid值
satdb=# select id,name,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | a | (0,3) 3 | a | (0,4) (4 rows)
对id为2的记录进行更新
satdb=# update test_ctid set name=‘b' where id=2; UPDATE 1
这里可以看到id=2的记录指向了新的元组标识符 (0,5)
satdb=# select id,name,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 3 | a | (0,4) 2 | b | (0,5) (4 rows) satdb=# select * from test_ctid where ctid='(0,1)'; id | name ----±----- 1 | a (1 row)
删除 id=3的记录后,对应的ctid(0,4)不存在了
satdb=# delete from test_ctid where id=3; DELETE 1 satdb=# select *,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | b | (0,5) (3 rows)
再插入一条记录时,看看会不会使用(0,4)这个标识符
satdb=# insert into test_ctid values(3,‘d'); INSERT 0 1 satdb=# select *,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | b | (0,5) 3 | d | (0,6)
这里新插入的记录不会使用(0,4),而是直接分配新的标识符(0,6)
总结:
1、ctid的作用与oracle rowid类似,可以唯一标识一条记录
2、记录的更新后,后生产新的ctid
3、记录删除后,新插入的记录不会使用已经删除记录的ctid
4、基于ctid可以实现记录的去重操作
5、基于ctid可以实现差异增量同步(新增、删除、更新)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
无争山庄资源网 Copyright www.whwtcm.com
暂无“Postgresql去重函数distinct的用法说明”评论...
更新日志
2024年12月23日
2024年12月23日
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]