5.2. Hibernate 的类型
5.2.1. 实体(Entities)和值(values)
和持久化服务相比,Java 级别的对象分为两个组别:
实体entity 独立于任何持有实体引用的对象。与通常的 Java 模型相比,不再被引用的对象会被当作垃圾收集掉。实体必须被显式的保存和删除(除非保存和删除是从父实体向子实体引发的级联)。这和 ODMG 模型中关于对象通过可触及保持持久性有一些不同 — 比较起来更加接近应用程序对象通常在一个大系统中的使用方法。实体支持循环引用和交叉引用,它们也可以加上版本信息。
一个实体的持久状态包含指向其他实体和值类 型实例的引用。值可以是原始类型,集合(不是集合中的对象),组件或者特定的不可变对象。与实体不同,值(特别是集合和组件)是通过可触及性来进行持久化 和删除的。因为值对象(和原始类型数据)是随着包含他们的实体而被持久化和删除的,他们不能被独立的加上版本信息。值没有独立的标识,所以他们不能被两个 实体或者集合共享。
直到现在,我们都一直使用术语“持久类”(persistent class)来代表实体。我们仍然会这么做。然而严格说来,不是所有的用户自定义的,带有持久化状态的类都是实体。组件就是用户自定义类,却是值语义的。
java.lang.String
类型的 java 属性也是值语义的。给了这个定义以后,我们可以说所有 JDK 提供的类型(类)都是值类型的语义,而用于自定义类型可能被映射为实体类型或值类型语义。采用哪种类型的语义取决于开发人员。在领域模型中,寻找实体类的 一个好线索是共享引用指向这个类的单一实例,而组合或聚合通常被转化为值类型。
我们会在本文档中重复碰到这两个概念。
挑战在于将 java 类型系统(和开发者定义的实体和值类型)映射到 SQL/数据库类型系统。Hibernate 提供了连接两个系统之间的桥梁:对于实体类型,我们使用
<class>
,<subclass>
等等。对于值类型,我们使用 <property>
,<component>
及其他,通常跟随着 type
属性。这个属性的值是Hibernate 的映射类型的名字。Hibernate 提供了许多现成的映射(标准的 JDK 值类型)。你也可以编写自己的映射类型并实现自定义的变换策略,随后我们会看到这点。
所有的 Hibernate 内建类型,除了 collections 以外,都支持空(null)语义。
5.2.2. 基本值类型
内置的 basic mapping types 可以大致地分类为:
integer, long, short, float, double, character, byte, boolean, yes_no, true_false
这些类型都对应 Java 的原始类型或者其封装类,来符合(特定厂商的)SQL 字段类型。
boolean, yes_no
和true_false
都是 Java 中boolean
或者java.lang.Boolean
的另外说法。string
从
java.lang.String
到VARCHAR
(或者 Oracle 的VARCHAR2
)的映射。date, time, timestamp
从
java.util.Date
和其子类到 SQL 类型DATE
,TIME
和TIMESTAMP
(或等价类型)的映射。calendar, calendar_date
从
java.util.Calendar
到 SQL 类型TIMESTAMP
和DATE
(或等价类型)的映射。big_decimal, big_integer
从
java.math.BigDecimal
和java.math.BigInteger
到NUMERIC
(或者 Oracle 的NUMBER
类型)的映射。locale, timezone, currency
从
java.util.Locale
,java.util.TimeZone
和java.util.Currency
到VARCHAR
(或者 Oracle 的VARCHAR2
类型)的映射。Locale
和Currency
的实例被映射为它们的 ISO 代码。TimeZone
的实例被影射为它的ID
。class
从
java.lang.Class
到VARCHAR
(或者 Oracle 的VARCHAR2
类型)的映射。Class
被映射为它的全限定名。binary
把字节数组(byte arrays)映射为对应的 SQL 二进制类型。
text
把长 Java 字符串映射为 SQL 的
CLOB
或者TEXT
类型。serializable
把可序列化的 Java 类型映射到对应的 SQL 二进制类型。你也可以为一个并非默认为基本类型的可序列化 Java 类或者接口指定 Hibernate 类型
serializable
。clob, blob
JDBC 类
java.sql.Clob
和java.sql.Blob
的映射。某些程序可能不适合使用这个类型,因为 blob 和 clob 对象可能在一个事务之外是无法重用的。(而且, 驱动程序对这种类型的支持充满着补丁和前后矛盾。)imm_date, imm_time, imm_timestamp, imm_calendar, imm_calendar_date, imm_serializable, imm_binary
一般来说,映射类型被假定为是可变的 Java 类型,只有对不可变 Java 类型,Hibernate 会采取特定的优化措施,应用程序会把这些对象作为不可变对象处理。比如,你不应该对作为
imm_timestamp
映射的 Date 执行Date.setTime()
。要改变属性的值,并且保存这一改变,应用程序必须对这一属性重新设置一个新的(不一样的)对象。
实体及其集合的唯一标识可以是除了
binary
、 blob
和 clob
之外的任何基础类型。(联合标识也是允许的,后面会说到。)
在
org.hibernate.Hibernate
中,定义了基础类型对应的 Type
常量。比如,Hibernate.STRING
代表 string
类型。
5.2.3. 自定义值类型
开发者创建属于他们自己的值类型也是很容易的。比如说,你可能希望持久化
java.lang.BigInteger
类型的属性,持久化成为 VARCHAR
字段。Hibernate没有内置这样一种类型。自定义类型能够映射一个属性(或集合元素)到不止一个数据库表字段。比如说,你可能有这样的 Java 属性:getName()
/setName()
,这是 java.lang.String
类型的,对应的持久化到三个字段:FIRST_NAME
,INITIAL
,SURNAME
。
要实现一个自定义类型,可以实现
org.hibernate.UserType
或 org.hibernate.CompositeUserType
中的任一个,并且使用类型的 Java 全限定类名来定义属性。请查看 org.hibernate.test.DoubleStringType
这个例子,看看它是怎么做的。
<property name="twoStrings" type="org.hibernate.test.DoubleStringType">
<column name="first_string"/>
<column name="second_string"/>
</property
>
注意使用
<column>
标签来把一个属性映射到多个字段的做法。
CompositeUserType
,EnhancedUserType
,UserCollectionType
和 UserVersionType
接口为更特殊的使用方式提供支持。
你甚至可以在一个映射文件中提供参数给一个
UserType
。 为了这样做,你的 UserType
必须实现 org.hibernate.usertype.ParameterizedType
接口。为了给自定义类型提供参数,你可以在映射文件中使用 <type>
元素。
<property name="priority">
<type name="com.mycompany.usertypes.DefaultValueIntegerType">
<param name="default"
>0</param>
</type>
</property
>
现在,
UserType
可以从传入的 Properties
对象中得到 default
参数的值。
如果你非常频繁地使用某一
UserType
,可以为他定义一个简称。这可以通过使用 <typedef>
元素来实现。Typedefs 为一自定义类型赋予一个名称,并且如果此类型是参数化的,还可以包含一系列默认的参数值。
<typedef class="com.mycompany.usertypes.DefaultValueIntegerType" name="default_zero">
<param name="default"
>0</param>
</typedef
>
<property name="priority" type="default_zero"/>
也可以根据具体案例通过属性映射中的类型参数覆盖在 typedef 中提供的参数。
尽管 Hibernate 内建的丰富的类型和对组件的支持意味着你可能很少 需要使用自定义类型。不过,为那些在你的应用中经常出现的(非实体)类使用自定义类型也是一个好方法。例如,一个
MonetaryAmount
类使用 CompositeUserType
来映射是不错的选择,虽然他可以很容易地被映射成组件。这样做的动机之一是抽象。使用自定义类型,以后假若你改变表示金额的方法时,它可以保证映射文件不需要修改。