服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > 数据库技术 > Oracle技术 > oracle错误库 > 查看文档

何时oracle使用绑定变量性能反而更差

  当我在做培训时,在解释绑定变量的好处时,大家都比较容易理解。但是,对于并不是任何时候绑定变量都是最优的。这一点很多人不是和理解。下面就讨论一下在什么时候会出现绑定变量会使性能变差。

  当我在做培训时,在解释绑定变量的好处时,大家都比较容易理解。但是,对于并不是任何时候绑定变量都是最优的。这一点很多人不是和理解。下面就讨论一下在什么时候会出现绑定变量会使性能变差。

  扫描成本和optimizer_index_cost_adj

  我们知道,在cbo模式下,oracle会计算各个访问路径的代价,采用最小代价的访问路径作为语句的执行计划。而对于索引的访问代价的计算,需要根据一个系统参数optimizer_index_cost_adj来转换为与全表扫描代价等价的一个值。这是什么意思呢?我们先稍微解释一下这个参数:optimizer_index_cost_adj。它的值是一个百分比,默认是100,取值范围是1~10000。当估算索引扫描代价时,会将索引的原始代价值乘以这个百分比,将换算后的值作为与全表扫描代价比较的值。也就是说,当这个值为100时,计算出的索引扫描代价就是它的原始代价:

cost_com = cost_org * optimizer_index_cost_adj/100

  看以下例子:

sql> create table t_peeking (a number, b char(1), c char(2000));
 
table created.
 
sql>
sql> create index t_peeking_idx1 on t_peeking(b);
 
index created.
 
 
sql> begin
  2    for i in 1..1000 loop
  3      insert into t_peeking values (i, 'a', i);
  4    end loop;
  5
  6    insert into t_peeking values (1001, 'b', 1001);
  7    insert into t_peeking values (1002, 'b', 1002);
  8    insert into t_peeking values (1003, 'c', 1003);
  9
 10    commit;
 11  end;
 12  /
 
pl/sql procedure successfully completed.

  注意,我们给索引字段b插入的值中只有3个distinct值,记录数是1003,它的集的势很高(1003/3)=334。

sql>
sql> analyze table t_peeking compute
statistics for table for all indexes for all indexed columns;
 
table analyzed.
 
sql>

  我们看下索引扫描的代价是多少:

sql> show parameter optimizer_index_cost_adj
 
name                                 type        value
------------------------------------ ----------- ------
optimizer_index_cost_adj             integer     100
 
sql> delete from plan_table;
 
0 rows deleted.
 
sql>
 
sql> explain plan for select
/*+index(a t_peeking_idx1)*/ * from t_peeking a where b = :v;
 
explained.
 
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id
  7  ;
 
query
plan_table
-----------------------------------------------------
select statement   cost=113
  table access by index rowid t_peeking
    index range scan t_peeking_idx1
 
sql>

  再看全表扫描的代价是多少:

sql> delete from plan_table;
 
3 rows deleted.
 
sql>
sql> explain plan for select
/*+full(a)*/ * from t_peeking a where b = :v;
 
explained.
 
sql>
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id
  7  ;
 
query
plan_table
----------------------------------------------------
select statement   cost=75
  table access full t_peeking
 
sql>

  这时,我们可以计算得出让优化器使用索引(无提示强制)的optimizer_index_cost_adj值应该< round(cost_fts/cost_idx*100) = round(75/113*100) = 66,而大于66则会使用全表扫描:

sql> alter system set optimizer_index_cost_adj=67;
 
system altered.
 
sql>
sql> delete from plan_table;
 
2 rows deleted.
 
sql>
sql> explain plan for select * from t_peeking a where b = :v;
 
explained.
 
sql>
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id;
 
query
plan_table
-----------------------------------------------------------------
select statement   cost=75
  table access full t_peeking
 
sql>
sql>
sql> alter system set optimizer_index_cost_adj=66;
 
system altered.
 
sql>
sql> delete from plan_table;
 
2 rows deleted.
 
sql>
sql> explain plan for select * from t_peeking a where b = :v;
 
explained.
 
sql>
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id;
 
query
plan_table
---------------------------------------------------------
select statement   cost=75
  table access by index rowid t_peeking
    index range scan t_peeking_idx1

  可以看出,在使用绑定变量时,参数optimizer_index_cost_adj对于是否选择索引会有重要的影响。这里我们暂且不讨论索引扫描的原始成本是如何计算得出的。但是有一点很重要,在使用绑定变量时,计算出的成本是平均成本。在我们上面的例子中,字段b的值只有3个:"a"、"b"、"c",其中a最多,1003行中有1000行。因此,在索引上扫描值为a记录的成本为1000/1003 * 索引全扫描成本 ≈索引全扫描成本,我们看下它的成本是多少:

sql> alter system set optimizer_index_cost_adj=100;
 
system altered.
 
sql>
sql> delete from plan_table;
 
2 rows deleted.
 
sql>
sql> explain plan for select
 /*+index(a t_peeking_idx1)*/* from t_peeking a where b = 'a';
 
explained.
 
sql>
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id;
 
query
plan_table
--------------------------------------------------------------
select statement   cost=336
  table access by index rowid t_peeking
    index range scan t_peeking_idx1

  可以看到,它的成本是336。因此索引的平均成本是(336 * 1003/1000) / 3 ≈ 113,也就是使用绑定变量使的成本。而扫描其它两个值"b"和"a"时代价就非常小。

sql> alter system set optimizer_index_cost_adj=100;
 
system altered.
 
sql>
sql> delete from plan_table;
 
3 rows deleted.
 
sql>
sql> explain plan for select
/*+index(a t_peeking_idx1)*/* from t_peeking a where b = 'b';
 
explained.
 
sql>
sql> select lpad(' ', 2*(level-1))||operation||' '||options||' '||
  2         object_name||' '||decode(id, 0, 'cost='||position) "query
  3  plan_table"
  4      from plan_table
  5      start with id = 0
  6      connect by prior id = parent_id;
 
query
plan_table
---------------------------------------------------------------
select statement   cost=2
  table access by index rowid t_peeking
    index range scan t_peeking_idx1

  因为计算的成本是平均成本(相对实际扫描某个值的成本,平均成本更接近全表扫描成本),因此在创建查询计划时,使用绑定变量将更加容易受到参数optimizer_index_cost_adj影响,特别是上面的这种情况(即索引字段的集的势非常高时)下,平均代价与实际扫描某个值代价相差非常远。这种情况下,optimizer_index_cost_adj对不使用绑定变量查询影响就非常小(因为索引代价不是比全表扫描成本大很多就是小很多),不管扫描哪个值,不使用绑定变量将更加容易选择到合理的查询计划。

  绑定变量窥视

  在了解了参数optimizer_index_cost_adj的作用后。再了解一个对查询计划,特别是使用绑定变量时会产生重大影响的特性:绑定变量窥视(bind variables peeking)。

  绑定变量窥视是9i以后的一个新特性。它使cbo优化器在计算访问代价时,将绑定变量传入的值考虑进去,从而计算出更合理的成本(否则,将会计算平均成本)。看下面例子:

sql> conn sys/sys as sysdba
connected.
sql>
sql> alter system set optimizer_index_cost_adj=60;
 
system altered.
 
sql> analyze table t_peeking compute
statistics for table for all indexes for all indexed columns;
 
table analyzed.
 
sql>
sql> set autot trace
sql>
sql> alter session set sql_trace = true;
 
session altered.
 
sql>
sql> var v char(1)
sql>
sql> exec :v := 'a';
 
pl/sql procedure successfully completed.
 
sql>
sql> select * from t_peeking a where b = :v;
 
1000 rows selected.
 
sql>
sql> alter session set sql_trace = false;
 
session altered.

  用tkprof处理生成的trace文件。因为在存在绑定变量窥视时,autotrace或者explain plan可能不会显示正确的查询计划,需要tkprof来处理sql trace。

tkprof fuyuncat_ora_5352.trc aaa.txt

  此时optimizer_index_cost_adj是60,根据上面的结论,似乎查询计划应该选择扫描索引。但是,这里给绑定变量赋了值"a",这时,优化器会“窥视”到这个值,并且在计算扫描成本时按照这个值的成本来计算。因此,得出的查询计划是全表扫描,而不是扫描索引,靠tkprof分析的结果:

select *
from
 t_peeking a where b = :v
 
 
call     count       cpu    elapsed       disk      query    current        rows
------- ------  -------- ---------- ---------- ---------- ----------  ----------
parse        1      0.00       0.00          0          0          0           0
execute      1      0.00       0.00          0          0          0           0
fetch       68      0.01       0.07          0        406          0        1000
------- ------  -------- ---------- ---------- ---------- ----------  ----------
total       70      0.01       0.08          0        406          0        1000
 
misses in library cache during parse: 1
optimizer mode: choose
parsing user id: sys
 
rows     row source operation
-------  ---------------------------------------------------
   1000  table access full t_peeking (cr=406 pr=0 pw=0 time=5052 us)

  但是,绑定变量窥视对一条语句只会使用一次。就是说,在第一次解析语句时,将绑定变量值考虑进去计算成本生成查询计划。以后在执行该语句时都采用这个查询计划,而不再考虑以后绑定变量的值是什么了。

sql> conn sys/sys as sysdba
connected.
sql>
sql>
sql> set autot trace
sql>
sql> alter session set sql_trace = true;
 
session altered.
 
sql>
sql> var v char(1)
sql>
sql> exec :v := 'b';
 
pl/sql procedure successfully completed.
 
sql>
sql> select * from t_peeking a where b = :v;
 
1000 rows selected.
 
sql>
sql> alter session set sql_trace = false;
 
session altered.

  再用tkprof分析生成的trace文件,看到尽管这里的值是"b",选择索引扫描会更优,但分析结果中查询计划还是使用全表扫描:

select *
from
 t_peeking a where b = :v
 
 
call     count       cpu    elapsed       disk      query    current        rows
------- ------  -------- ---------- ---------- ---------- ----------  ----------
parse        1      0.00       0.00          0          0          0           0
execute      1      0.00       0.00          0          0          0           0
fetch        2      0.00       0.00          0        340          0           2
------- ------  -------- ---------- ---------- ---------- ----------  ----------
total        4      0.00       0.00          0        340          0           2
 
misses in library cache during parse: 0
optimizer mode: choose
parsing user id: sys
 
rows     row source operation
-------  ---------------------------------------------------
      2  table access full t_peeking (cr=340 pr=0 pw=0 time=1005 us)

  因此,这种情况下使用绑定变量也会导致无法选择最优的查询计划。

  综上所述,我们可以得出一个结论:在对建有索引的字段(包括字段集),且字段(集)的集的势非常大时,使用绑定变量可能会导致查询计划错误,因而会使查询效率非常低。


  阅读关于 oracle数据库 绑定变量 性能更差 的全部文章

扫描关注微信公众号