经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » SQL语言 » 查看文章
为什么不推荐使用 select * ?是性能问题吗 ?
来源:cpp软件架构狮  时间:2019/4/18 9:23:19  对本文有异议

引言

大家在开发中,还有很多童鞋在写查询语句的时候,习惯写下面这种不规范sql

  1. select * from table

而不写成下面的这种规范方式

  1. select col1,col2,...,coln from table

我也知道,这些童鞋是图方便,毕竟再敲一堆的列名,嫌麻烦!

你们上班可以问问自己的同事

你:" xx,知道 select * 和 select 所有字段的区别么?"

同事:" 额。。额。。额。。"

留下的只有尴尬的笑容!

我也知道,很多人至今都没有搞懂 select * 和 selct 所有字段 的区别

因此,我开一文来说明一下。另外,我选的是自己最熟悉的mysql数据库,此文的结论在oralce,sqlserver上是否成立,博主没做过测试。

正文

select所有字段 性能高?

网络上流传着一种说法说是

“*” 表示通配所有字段,在SQL的机制里,需要先识别统计所有字段再进行下一步。

明确指定字段的话,会减少上述的操作,所以效率有所提升。

然而,实际上呢?效率是相差不大的!。

下面灰色字体是博客 flysnowxf.iteye.com/blog/1125032 的测试案例:

mysql 5.1.37 ,表记录数41,547,002,即4000w行

使用远程客户端取1000条数据,统计时间:

SELECT * 方式:

  1. SELECT * FROM `dmsp`.`dmsp_dimension_content` LIMIT 0, 1000;

-> 时间2.218s,网络消耗0.547s

SELECT 字段 方式:

  1. SELECT `id`, `appid`, `aop`, `t`, `uid`, `sid`, `pid`, `pname`, `bid`, `bname`, `ptype`, `sm`, `sv`, `bt`, `national`, `area`, `ov` FROM `dmsp`.`dmsp_dimension_content` LIMIT 0, 1000;

-> 取出所有字段,时间2.250s,网络消耗0.578s

多次查询(改变limit条件避免缓存),时间变化不大。

结论:两者差别几乎可忽略。所以查询所有字段(或者大多数字段)的时候,大可select * 来操作。如果某些不需要的字段数据量特别大,还是写清楚字段比较好,因为这样可以减少网络传输。

可以看出,这二者的时间差几乎可以忽略,另外还有一本书上的内容也可以佐证我的话。

《SQL CookBook》第一章 检索记录中1.1小节(原书第十五页内容如下):

1.jpg

此书也说明了,两种方式在性能上几乎是没有差距的。

那为什么还是不推荐select * ?

网络IO问题

很多文章里说什么,会带来额外的内存、磁盘、cpu的开销。对此,我有自己的观点。我觉得这不是主要原因。主要原因是带来了额外的网络开销。

在一个系统中,内存、磁盘、cpu的开销,不过是微妙级。造成系统的延迟的重头戏是网络开销。网络开销可能带来秒级的延迟。当然,如果你的应用程序和数据库是在同一台机器上的,那当我没说这句话!

select * 会查询出不需要的、额外的数据,那么这些额外的数据在网络上进行传输,必定会造成性能延迟。假设你的table中,有一个列的类型为binary。此时,你的select *操作,就会十分缓慢,并且会造成额外的网络开销。

索引问题

仔细看下面的两句sql

  1. select col1 from table;select * from table;

如果col1字段包含索引信息,那么此时,这两句的sql执行时间可能会有几十上百倍的差异。

在col1字段有索引的情况下,mysql是可以不用读data,直接使用index里面的值就返回结果的。但是一旦用了select *,就会有其他列需要读取,这时在读完index以后还需要去读data才会返回结果。这样就造成了额外的性能开销。

ps:我不想在这里扯什么覆盖索引,辅助索引的概念。其实要讲的很专业,扯一堆高大上的名词,我也可以。只是这样徒增读者的理解难度,尽量用通俗的方式来讲。

扩展性问题

有的人会觉得

使用select * ,这样在增加列的时候,不用改sql,方便!

然而实际上,你的sql是不用改了,但是对你的程序代码是有很大的影响的!

身为一名21世纪的优良程序员,我们是不能获取自己不需要的东西的!你因为一时高兴,执行了select *,如果增加或删除列,会对你的代码有着极大的影响。

反过来,如果你select 指定列,只获取自己需要的几列,表结构的修改,对你代码的影响就会小很多。相比之下,风险就没有那么大了!

另外就是,对于其他人接手你项目的人来说,看到 select 指定列的方式,可读性更强,对于他们来说更好上手!

补充:其实公司的数据表可能会被多个开发者使用,并且字段会不断扩充的。开发时尽量操作自己需要的字段。


 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号