1、11. Hibernate 介绍Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。 Hibernate 可以应用在任何使用 JDBC 的场合,既可以在 Java 的客户端程序使用,也可以在 Servlet/JSP 的Web 应用中使用,最具革命意义的是,Hibernate 可以在应用 EJB 的 J2EE 架构中取代CMP,完成数据持久化的重任。Hibernate 的核心接口一共有 5 个,分别为:Session、 SessionFactory、Transaction、Query
2、 和 Configuration。这 5 个核心接口在任何开发中都会用到。通过这些接口,不仅可以对持久化对象进行存取,还能够进行事务控制。下面对这五个核心接口分别加以介绍。Session 接口:Session 接口负责执行被持久化对象的 CRUD 操作(CRUD 的任务是完成与数据库的交流,包含了很多常见的 SQL 语句。)。但需要注意的是 Session 对象是非线程安全的。同时,Hibernate 的 session 不同于 JSP 应用中的 HttpSession。这里当使用 session 这个术语时,其实指的是 Hibernate 中的 session,而以后会将 HttpSesio
3、n 对象称为用户session。SessionFactory 接口:SessionFactroy 接口负责初始化 Hibernate。它充当数据存储源的代理,并负责创建 Session 对象。这里用到了工厂模式。需要注意的是 SessionFactory 并不是轻量级的,因为一般情况下,一个项目通常只需要一个 SessionFactory 就够,当需要操作多个数据库时,可以为每个数据库指定一个 SessionFactory。Configuration 接口:Configuration 接口负责配置并启动 Hibernate,创建 SessionFactory对象。在 Hibernate 的启动
4、的过程中, Configuration 类的实例首先定位映射文档位置、读取配置,然后创建 SessionFactory 对象。Transaction 接口:Transaction 接口负责事务相关的操作。它是可选的,开发人员也可以设计编写自己的底层事务处理代码。Query 和 Criteria 接口:Query 和 Criteria 接口负责执行各种数据库查询。它可以使用HQL 语言或 SQL 语句两种表达方式。12. Hibernate 主键介绍AssignedAssigned 方式由程序生成主键值,并且要在 save()之前指定否则会抛出异常特点:主键的生成值完全由用户决定,与底层数据库无
5、关。用户需要维护主键值,在调用 session.save()之前要指定主键值。HiloHilo 使用高低位算法生成主键,高低位算法使用一个高位值和一个低位值,然后把算法得到的两个值拼接起来作为数据库中的唯一主键。Hilo 方式需要额外的数据库表和字段提供高位值来源。默认请况下使用的表是hibernate_unique_key,默认字段叫作 next_hi。next_hi 必须有一条记录否则会出现错误。特点:需要额外的数据库表的支持,能保证同一个数据库中主键的唯一性,但不能保证多个数据库之间主键的唯一性。Hilo 主键生成方式由 Hibernate 维护,所以 Hilo 方式与底层数据库无关,但
6、不应该手动修改 hi/lo 算法使用的表的值,否则会引起主键重复的异常。IncrementIncrement 方式对主键值采取自动增长的方式生成新的主键值,但要求底层数据库的支持 Sequence。如 Oracle,DB2 等。需要在映射文件 xxx.hbm.xml 中加入 Increment 标志符的设置。特点:由 Hibernate 本身维护,适用于所有的数据库,不适合多进程并发更新数据库,适合单一进程访问数据库。不能用于群集环境。IdentityIdentity 当时根据底层数据库,来支持自动增长,不同的数据库用不同的主键增长方式。特点:与底层数据库有关,要求数据库支持 Identity
7、,如 MySQl 中是 auto_increment, SQL Server 中是 Identity,支持的数据库有 MySql、SQL Server、DB2、Sybase 和HypersonicSQL。 Identity 无需 Hibernate 和用户的干涉,使用较为方便,但不便于在不同的数据库之间移植程序。SequenceSequence 需要底层数据库支持 Sequence 方式,例如 Oracle 数据库等特点:需要底层数据库的支持序列,支持序列的数据库有DB2、PostgreSql、Qracle、SAPDb 等在不同数据库之间移植程序,特别从支持序列的数据库移植到不支持序列的数据库
8、需要修改配置文件NativeNative 主键生成方式会根据不同的底层数据库自动选择 Identity、Sequence、Hilo 主键生成方式特点:根据不同的底层数据库采用不同的主键生成方式。由于 Hibernate 会根据底层数据库采用不同的映射方式,因此便于程序移植,项目中如果用到多个数据库时,可以使用这种方式。UUIDUUID 使用 128 位 UUID 算法生成主键,能够保证网络环境下的主键唯一性,也就能够保证在不同数据库及不同服务器下主键的唯一性。特点;能够保证数据库中的主键唯一性,生成的主键占用比较多的存贮空间Foreign GUIDForeign 用于一对一关系中。GUID 主
9、键生成方式使用了一种特殊算法,保证生成主键的唯一性,支持 SQL Server 和 MySQL13. Hibernate 源码中几个包的作用简要介绍net.sf.hibernate.* 该包的类基本上都是接口类和异常类net.sf.hibernate.cache.* JCS 的实现类net.sf.hibernate.cfg.* 配置文件读取类net.sf.hibernate.collection.* Hibernate 集合接口实现类,例如 List,Set,Bag 等等,Hibernate 之所以要自行编写集合接口实现类是为了支持 lazy loadingnet.sf.hibernate.c
10、onnection.* 几个数据库连接池的 Providernet.sf.hibernate.dialect.* 支持多种数据库特性,每个 Dialect 实现类代表一种数据库,描述了该数据库支持的数据类型和其它特点,例如是否有 AutoIncrement,是否有Sequence,是否有分页 sql 等等net.sf.hibernate.eg.* Hibernate 文档中用到的例子net.sf.hibernate.engine.* 这个包的类作用比较散net.sf.hibernate.expression.* HQL 支持的表达式net.sf.hibernate.hq.* HQL 实现net
11、.sf.hibernate.id.* ID 生成器net.sf.hibernate.impl.* 最核心的包,一些重要接口的实现类,如果Session, SessionFactory,Query 等net.sf.hibernate.jca.* JCA 支持,把 Session 包装为支持 JCA 的接口实现类net.sf.hibernate.jmx.* 我不懂 JMX,只知道 JMX 是用来编写 App Server 的管理程序的,大概是 JMX 部分接口的实现,使得 App Server 可以通过 JMX 接口管理 Hibernatenet.sf.hibernate.loader.* 也是很
12、核心的包,主要是生成 sql 语句的net.sf.hibernate.lob.* Blob 和 Clob 支持net.sf.hibernate.mapping.* hbm 文件的属性实现net.sf.hibernate.metadata.* PO 的 Meta 实现net.sf.hibernate.odmg.* ODMG 是一个 ORM 标准,这个包是 ODMG 标准的实现类net.sf.hibernate.persister.* 核心包,实现持久对象和表之间的映射net.sf.hibernate.proxy.* Proxy 和 Lazy Loading 支持net.sf.hibernate.
13、ps.* 该包是 PreparedStatment Cachenet.sf.hibernate.sql.* 生成 JDBC sql 语句的包net.sf.hibernate.test.* 测试类,你可以用 junit 来测试 Hibernatenet.sf.hibernate.tool.hbm2ddl.* 用 hbm 配置文件生成 DDLnet.sf.hibernate.transaction.* Hibernate Transaction 实现类net.sf.hibernate.type.* Hibernate 中定义的持久对象的属性的数据类型net.sf.hibernate.util.*
14、一些工具类,作用比较散net.sf.hibernate.xml.* XML 数据绑定14. 缓存管理Hibernate 中提供了两级 Cache,第一级别的缓存是 Session 级别的缓存,它是属于事务范围的缓存。这一级别的缓存由 hibernate 管理的,一般情况下无需进行干预;第二级别的缓存是 SessionFactory 级别的缓存,它是属于进程范围或群集范围的缓存。这一级别的缓存可以进行配置和更改,并且可以动态加载和卸载。 Hibernate 还为查询结果提供了一个查询缓存,它依赖于第二级缓存。1. 一级缓存和二级缓存的比较:第一级缓存 第二级缓存 存放数据的形式 相互关联的持久化
15、对象 对象的散装数据 缓存的范围 事务范围,每个事务都有单独的第一级缓存进程范围或集群范围,缓存被同一个进程或集群范围内的所有事务共享 并发访问策略由于每个事务都拥有单独的第一级缓存,不会出现并发问题,无需提供并发访问策略由于多个事务会同时访问第二级缓存中相同数据,因此必须提供适当的并发访问策略,来保证特定的事务隔离级别 数据过期策略没有提供数据过期策略。处于一级缓存中的对象永远不会过期,除非应用程序显式清空缓存或者清除特定的对象必须提供数据过期策略,如基于内存的缓存中的对象的最大数目,允许对象处于缓存中的最长时间,以及允许对象处于缓存中的最长空闲时间 物理存储介质内存内存和硬盘。对象的散装数
16、据首先存放在基于内在的缓存中,当内存中对象的数目达到数据过期策略中指定上限时,就会把其余的对象写入基于硬盘的缓存中。缓存的软件实现 在 Hibernate 的 Session 的实现中包含了缓存的实现由第三方提供,Hibernate 仅提供了缓存适配器 (CacheProvider)。用于把特定的缓存插件集成到Hibernate 中。启用缓存的方式只要应用程序通过 Session 接口来执行保存、更新、删除、加载和查询数据库数据的操作,Hibernate 就会启用第一级缓存,把数据库中的数据以对象的形式拷贝到缓存中,对于批量更新和批量删除操作,如果不希望启用第一级缓存,可以绕过 Hiberna
17、te API,直接通过 JDBC API 来执行指操作。用户可以在单个类或类的单个集合的粒度上配置第二级缓存。如果类的实例被经常读但很少被修改,就可以考虑使用第二级缓存。只有为某个类或集合配置了第二级缓存,Hibernate 在运行时才会把它的实例加入到第二级缓存中。 用户管理缓存的方式第一级缓存的物理介质为内存,由于内存容量有限,必须通过恰当的检索策略和检索方式来限制加载对象的数目。Session 的 evit()方法可以显式清空缓存中特定对象,但这种方法不值得推荐。 第二级缓存的物理介质可以是内存和硬盘,因此第二级缓存可以存放大量的数据,数据过期策略的 maxElementsInMemor
18、y 属性值可以控制内存中的对象数目。管理第二级缓存主要包括两个方面:选择需要使用第二级缓存的持久类,设置合适的并发访问策略:选择缓存适配器,设置合适的数据过期策略。2. 一级缓存的管理: 当应用程序调用 Session 的 save()、update()、savaeOrUpdate()、get()或 load(),以及调用查询接口的 list()、iterate() 或 filter()方法时,如果在 Session 缓存中还不存在相应的对象,Hibernate 就会把该对象加入到第一级缓存中。当清理缓存时,Hibernate 会根据缓存中对象的状态变化来同步更新数据库。 Session 为应
19、用程序提供了两个管理缓存的方法: evict(Object obj):从缓存中清除参数指定的持久化对象。 clear():清空缓存中所有持久化对象。3. 二级缓存的管理:3.1. Hibernate 的二级缓存策略的一般过程如下:1) 条件查询的时候,总是发出一条 select * from table_name where . (选择所有字段)这样的 SQL 语句查询数据库,一次获得所有的数据对象。2) 把获得的所有数据对象根据 ID 放入到第二级缓存中。3) 当 Hibernate 根据 ID 访问数据对象的时候,首先从 Session 一级缓存中查;查不到,如果配置了二级缓存,那么从二级
20、缓存中查;查不到,再查询数据库,把结果按照 ID 放入到缓存。4) 删除、更新、增加数据的时候,同时更新缓存。Hibernate 的二级缓存策略,是针对于 ID 查询的缓存策略,对于条件查询则毫无作用。为此,Hibernate 提供了针对条件查询的 Query Cache。3.2. 什么样的数据适合存放到第二级缓存中? 1 很少被修改的数据 2 不是很重要的数据,允许出现偶尔并发的数据 3 不会被并发访问的数据 4 参考数据,指的是供应用参考的常量数据,它的实例数目有限,它的实例会被许多其他类的实例引用,实例极少或者从来不会被修改。3.3. 不适合存放到第二级缓存的数据? 1 经常被修改的数据
21、 2 财务数据,绝对不允许出现并发 3 与其他应用共享的数据。3.4. 常用的缓存插件 Hibernater 的二级缓存是一个插件,下面是几种常用的缓存插件:EhCache:可作为进程范围的缓存,存放数据的物理介质可以是内存或硬盘,对Hibernate 的查询缓存提供了支持。OSCache:可作为进程范围的缓存,存放数据的物理介质可以是内存或硬盘,提供了丰富的缓存数据过期策略,对 Hibernate 的查询缓存提供了支持。SwarmCache :可作为群集范围内的缓存,但不支持 Hibernate 的查询缓存。JBossCache:可作为群集范围内的缓存,支持事务型并发访问策略,对 Hibernate 的查询缓存提供了支持。3.5. 配置二级缓存的主要步骤:1) 选择需要使用二级缓存的持久化类,设置它的命名缓存的并发访问策略。这是最值得认真考虑的步骤。2) 选择合适的缓存插件,然后编辑该插件的配置文件。