Hibernate 利用缓存(一级、二级、查询)提高系统性能

      在hibernate中我们最常用的有三类缓存,分别为一级缓存、二级缓存和查询缓存,下面我们对这三个缓存在项目中的使用以及优缺点分析一下。

      缓存它的作用在于提高性能系统性能,介于应用系统与数据库之间而存在于内存或磁盘上的数据。

      首先,来看一下一级缓存它默认开启且很常用。


一级缓存


    同是一种缓存常常可以有好几个名字,这是从不同的角度考虑的结果,从缓存的生命周期角度来看一级缓存又可以叫做:sessin缓存、线程级缓存、事务级缓存。我们编程中线程、事务、session这三个概念是绑定到一起的放到了threadlocal中,同时开启同时关闭即同生共死也有人叫做request-per-session-transaction编程;
       当session关闭后缓存中的对象会丢失,也就是说两个不同的session中的缓存数据都是不一样的,缓存数据不能够跨session访问。

       

     缓存数据的数据类型

    在一级缓存中缓存的是实体对象,在使用查询方法get() 、load() 、iterate()三个方法查询时都会先查询session缓存,如果有对象则从缓存里面取出来,如果缓存中没有再去数据库里面查询。
    load()测试:测试注意一定要在同一个事务里面,当我在Spring管理的session测试时调用两次load()总是查询两次发出两条SQL语句,还以为session级缓存没有起作用,原来是因为hibernate集成spring之后事务、session都由spring管理,每次调用前后事务一级session都自动打开和关闭,自己控制不了中间过程,于是将spring去掉拿到hibernate原session,再手动开发关闭事务这样做可以保证在同一个session、同一个事务里面操作方法,确实是发了一条SQL语句,看下面代码:
    load()、get()方法:
    
    @Test
    public void testLoad()
    {
        Session session=sf.openSession();
        session.beginTransaction();
        
        Category category1=(Category)session.load(Category.class,1);
        Category category2=(Category)session.load(Category.class,1);
        System.out.println(category1);
        System.out.println(category2);
        
        session.getTransaction().commit();
        session.close();
    }


结果
Hibernate: select category0_.id as id0_0_, category0_.name as name0_0_ from Category category0_ where category0_.id=?
hibernate.Category@10efd7c
hibernate.Category@10efd7c


      结果不仅发送了一条语句而且两个对象打印出来也是一样的。
load()、get()第一次查询时会发出sql语句,从数据库表里面查询;第二次查询时会先去缓存里面查找,如果没有发生更新修改操作,那么将从缓存中读取数据,否则查询数据库。
save方法
    @Test
    public void testGet()
    {
        Session session=sf.openSession();
        session.beginTransaction();
        
        Category category1=new Category();
        category1.setName("新闻");
        
        session.save(category1);
        Category category2=(Category)session.load(Category.class,category1.getId());
        
        System.out.println(category2.getName());
        session.getTransaction().commit();
        session.close();
    }

      save也支持缓存,当执行save方法时首先往session缓存里面添加一条数据,等事务提交或者缓存刷新时才往数据库里面更新,从上面执行过程可以看出只发出了一条插入语句没有发查询语句,因为第二次是从缓存中查询出来的。

      PS:save之后执行get或者load需要知道对象的ID,此时save方法执行后虽然数据库里没有数据,但是对象的ID已经生成可以通过这个ID查询对象。

批量插入数据

       在批量插入数据的时候采取每次插入一部分数据,如下,每次插入20条数据不需要一条一条插入。

	public void testInserBatch() {
		Session session = sf.openSession();
		session.beginTransaction();
		
		for(int i=0; i<1000; i++) {
			Category c = new Category();
			c.setName("test" + i);
			session.save(c);
			if (i%20==0) {
				session.flush();
			}
		}
			
		session.getTransaction().commit();
		session.close();
	}

每次20条数据清理一下缓存,每次清理缓存调用session.flush()方法会发出20条insert语句,但是数据库里面还没有数据等所有数据都发出insert语句统一提交事务,事务同session是一个等级的因此需统一控制事务。


hibernate N+1问题

       Hibernate 中常会用到 set 等集合表示 1 对多的关系,在我们做的这个铁科院项目中,在获取实体的时候就能根据关系将关联的对象或者对象集合取出,还可以设定 cacade 进行关联更新和删除。这不得不说 hibernate 的 orm 做得很好,很贴近 oo 的使用习惯了。

      但是对数据库访问还是必须考虑性能问题的,在设定了 1 对多这种关系之后, 查询就会出现传说中的 n+1 问题。

一对多:在一方,查找得到了 n 个对象,那么又需要将 n 个对象关联的集合取出,于是本来的一条 sql 查询变成了 n+1 条;

多对一:在多方,查询得到了 m 个对象,那么也会将 m 个对象对应的 1 方的对象取出, 也变成了 m+1 ;

      解决问题的方法:

1、 使用 fetch 抓取, Hibernate 抓取策略分为单端代理和集合代理的抓取策略。

Hibernate 抓取策略 ( 单端代理的抓取策略) :

保持默认也就是如下 :

<many-to-one name="clazz"cascade="save-update" fetch="select" />

fetch="select" 就是另外发送一条 select 语句抓取当前对象关联实体或者集合设置 fetch="join"

<many-to-one name="clazz"cascade="save-update" fetch="join"/>

Hibernate 会通过 select 语句使用外连接来加载器关联实体活集合此时 lazy 会失效

Hibernate 抓取策略 ( 集合代理的抓取策略 ) :

保持默认( fetch="select" )也就是如下 :

<set name="students"inverse="true">

<key column="clazz"/>

<one-to-many class="com.june.hibernate.Student"/>

</set>

1)fetch="select" 会另外发出一条语句查询集合

2) 设置fetch="join" 采用外连接集合的 lazy 失效

3) 这只fetch="subselect" 另外发出一条 select 语句抓取前面查询到的所有的实体对象的关联集合 fetch 只对 HQL 查询产生影响其他的则不会


OpenSessionInview问题

      这个问题出现是由于load()懒加载导致的,第一次查询数据时使用了懒加载至查询出来数据的ID,当使用数据的时候还需要去数据库里面查询但是此时数据库的session已经关闭,解决此问题两种思路一种是不使用懒加载;其二是在web层开发关闭session,延长session的生命周期。


二级缓存


    二级缓存也称为进程级缓存或sessionFactory缓存,也可以叫做集群范围内的缓存,需要第三方来实现,hibernate默认的二级缓存插件为ehcache这个缓存,由于二级缓存是进程级的可能出现多线程并发问题,需要设置缓存的并发策略。

      hibernate二级缓存需要第三方插件支持,hibernate默认支持为ehcache关于配置请参考:Spring AOP +EHcache为Service层方法增加缓存


      开启二级缓存后对方法的影响

      get()/load()

      对于这两个方法没啥影响,第一次从数据库里面查询,第二次先判断缓存里面有没有数据如果没有再去数据库里面查询。


查询缓存


      查询缓存是针对普通属性结果集的缓存,不缓存实体对象,当和查询缓存关联的表发生修改的时候,查询缓存生命周期结束,里面的数据也随即被清空了。

      查询缓存的配置和使用:
List方法读写查询缓存,Iterator不使用查询缓存(查询缓存只对query.list()有效)

      查询缓存的配置,默认不开启hibernate3配置:

	  	<property name="cache.provider_class">org.hibernate.cache.NoCacheProvider</property>
	  	<property name="hibernate.cache.use_second_level_cache">false</property> 
	        <property name="hibernate.cache.use_query_cache">true</property>  

代码中,加上一句话 
query.setCacheable(true)

  

一级、二级、查询之间的关系


一级缓存总是开启状态,我们需要关注的是查询缓存和二级缓存,查询缓存可以只开启一个或者两个都打开。
开启二级缓存时,如果两个session先后执行load或者get方法,只执行一条语句第二次会从缓存中查找,先从一级缓存中查询,如果没有再去二级缓存中查找。

一级缓存同二级缓存交互

                禁止一级缓存与二级缓存交互,如下设置

session.setCacheMode(CacheMode.IGNORE);
打开一个session执行查询,它会先将查询结果保存到一级缓存,待session关闭后,一级缓存中数据清空,由于禁止了一级缓存同二级缓存数据交互,因此,一级缓存关闭后不会将结构保存到二级缓存,打开第二个session后,后再发送一条查询语句,因此二级缓存中没有数据。


查询缓存与二级缓存


开启查询,关闭二级
         如果两次执行query.list(),第一次发送查询语句会将结果对象的id保存到查询缓存中,第二次会先从查询缓存中取出ID,根据id先去一级缓存查找,再二级缓存,如果没有找到会去数据库中查找,一级缓存同session没有关系,只和表有关系。

                开启查询,开启二级缓存

两次执行query.list(),第一次发送查询语句将结果


       总结:

        缓存在一个项目中对于提高系统性能很重要,除了ehcache之外还有memcache、redis等缓存产品目前都很常用,redis具有丰富的数据类型以及单线程高效能访问效率,memcache虽然是多线程但效率还是没有redis高。

        这些缓存产品都可以实现分布式缓存,ehcache+rmi可以分布式缓存同步;memcache+redis都支持分布式,redis还提供了高可用性的解决方案:主从复制几个服务器直接爱你可以切换。

        


郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。