Java 包装类:你需要掌握的核心要点

自 Java 21 起,包装类在 Java 类型系统中扮演着日益复杂的角色。以下是关于虚拟线程、模式匹配等方面更新所需了解的全部信息。

你是否曾好奇 Java 如何无缝地将其基本数据类型与面向对象编程相结合?这就引入了包装类——一个重要但常被忽视的 Java 特性。这些特殊类在基本类型(如int
和double
)与对象之间架起了桥梁,使您能够在集合中存储数字、处理空值、使用泛型,甚至在现代特性(如模式匹配)中处理数据。无论您是在使用List<Integer>
还是从字符串解析Double
,Java 的包装类都使其成为可能。在本文中,我们将介绍 Java 21(当前 Java 的长期支持版本)中的包装类。我还会提供在使用包装类时的技巧、示例以及equals()
和hashCode()
中需要避免的陷阱。
在深入探讨 Java 21 中包装类的新特性之前,我们先快速回顾一下。
包装类的定义和用途
Java 包装类是最终(final
)、不可变的类,它们将基本值“包装”在对象内部。每种基本类型都有一个对应的包装类:
Boolean
Byte
Character
Short
Integer
Long
Float
Double
这些包装类有多种用途:
允许在需要对象的地方使用基本类型(例如,在集合和泛型中)。
提供用于类型转换和操作的实用方法。
支持空值(
null
),而基本类型不能。支持反射和其他面向对象的操作。
通过对象方法实现一致的数据处理。
Java 版本中包装类的演变
在整个 Java 历史中,包装类经历了显著的演变:
Java 1.0 到 Java 1.4:引入了基本的包装类,并需要手动装箱和拆箱。
Java 5:增加了自动装箱和拆箱,极大地简化了代码。
Java 8:通过新的实用方法和函数式接口兼容性增强了包装类。
Java 9:弃用了包装类构造函数,推荐使用工厂方法。
Java 16 到 17:加强了弃用警告,并为移除包装类构造函数做准备。
Java 21:改进了包装类的模式匹配,并进一步优化了其在虚拟线程中的性能。
这种演变反映了 Java 在向后兼容性和集成现代编程范式之间持续的平衡。
Java 21 类型系统中的包装类
从 Java 21 开始,包装类在 Java 类型系统中扮演着日益复杂的角色:
增强的
switch
和instanceof
模式匹配与包装类型无缝协作。与记录模式(
record patterns
)自然集成,实现更清晰的数据操作。优化了包装类型与虚拟线程系统之间的交互。
改进了 Lambda 表达式和方法引用中包装类的类型推断。
Java 21 中的包装类在承担其基本桥梁作用的同时,也融合了现代语言特性,使其成为当代 Java 开发的重要组成部分。
Java 21 中的基本数据类型和包装类
Java 为每种基本类型提供了一个包装类,为语言的基本值创建了完整的面向对象表示。以下是基本类型及其对应包装类的快速回顾,并附有创建示例:
每个包装类都扩展了Object
并实现了Comparable
和Serializable
等接口。包装类提供了超越其基本对应物的附加功能,例如能够使用equals()
方法进行比较。
包装类方法
Java 的包装类提供了一组丰富的实用方法,超越了其装箱基本类型的主要角色。这些方法提供了方便的方式来解析字符串、转换类型、执行数学运算和处理特殊值。
类型转换方法
字符串解析:
Integer.parseInt("42")
,Double.parseDouble("3.14")
跨类型转换:
intValue.byteValue()
,intValue.doubleValue()
进制转换:
Integer.parseInt("2A", 16)
,Integer.toString(42, 2)
无符号操作:
Integer.toUnsignedLong()
实用方法
最小/最大值函数:
Integer.min(a, b)
,Long.max(x, y)
比较:
Double.compare(d1, d2)
数学运算:
Integer.sum(a, b)
,Integer.divideUnsigned(a, b)
位操作:
Integer.bitCount()
,Integer.reverse()
特殊值检查:
Double.isNaN()
,Float.isFinite()
valueOf()
另一个需要了解的重要方法是valueOf()
。构造函数在 Java 9 中被弃用,并在 Java 16 中标记为待移除。不用构造函数的一种方法是改用工厂方法;例如,使用Integer.valueOf(42)
而不是new Integer(42)
。valueOf()
的优点包括:
对基本类型包装器进行内存高效的缓存(
Integer
、Short
、Long
和Byte
缓存-128 到 127;Character
缓存 0-127;Boolean
缓存 TRUE/FALSE 常量)。Float
和Double
由于其浮点值范围而不进行缓存。一些工厂方法对空输入有明确的行为定义。
模式匹配和虚拟线程的包装类更新
Java 21 中的包装类针对模式匹配和虚拟线程进行了优化。Java 中的模式匹配允许您测试对象的结构和类型,同时提取其组件。Java 21 显著增强了 switch 语句的模式匹配,特别是在包装类方面。如下例所示,增强的模式匹配在处理多态数据时能够实现更简洁和类型安全的代码:
模式匹配的主要改进包括:
空值处理(Null handling):显式的空值
case
防止了意外的NullPointerException
。守卫模式(Guard patterns):
when
子句支持复杂的条件匹配。类型细化(Type refinement): 编译器现在理解每个
case
分支内的细化类型。嵌套模式(Nested patterns): 模式匹配现在支持涉及嵌套包装对象的复杂模式。
穷举性检查(Exhaustiveness checking): 您现在可以获得编译器验证,确保覆盖了所有可能的类型。
这些特性使得包装类的处理更加类型安全和富有表现力,特别是在处理混合了基本类型和对象数据的代码中。
Java 21 的虚拟线程特性也与包装类有几个重要的交互方式。首先,在并发上下文中的装箱开销减少了,如下所示:
虚拟线程的其他更新包括:
JVM 优化了涉及包装类的线程通信,减少了虚拟线程调度和交接的开销。
线程本地缓存也得到了改进。包装类缓存(
Integer
等类型的-128 到 127)是按载体线程(carrier thread)而不是按虚拟线程维护的,防止了高并发场景下不必要的内存使用。还添加了身份保留(Identity preservation)。在单个虚拟线程内,包装类的身份被适当地维护,以用于同步和身份敏感的操作。
最后,对包装类进行了优化,以提高其在虚拟线程中的性能:
虚拟线程使用栈遍历(stack walking)进行各种操作。包装类优化了这些交互。
虚拟线程调度器队列中的包装类受益于内存效率的改进。
通过优化的拆箱操作减少了线程固定(thread pinning)的风险。
结构化并发模式与包装类值组合无缝协作。
包装类和虚拟线程之间的集成确保了包装类在 Java 21 引入的新并发编程模型中保持其有用性。这里描述的变化确保了包装类在 Java 中继续发挥作用,而不会出现在高吞吐量、虚拟线程密集型应用中可能发生的性能损失。
包装类中的 Equals 和 hashcode 实现
包装类重写了equals()
方法,以执行基于值的比较,而不是Object.equals()
使用的引用比较。在基于值的比较中,两个包装对象如果包含相同的基本值,则它们是相等的,无论它们是否是内存中不同的对象。这种比较类型具有类型特定性和空值安全性的优点:
类型特异性: 仅当两个对象都是完全相同的包装类型时,比较才返回 true。
空值安全性: 所有包装类实现都能安全地处理空值比较。
在下面的例子中,Integer.equals()
检查参数是否为Integer
并且具有相同的int
值:
需要注意几个特殊情况:
Float
和Double
: 这些包装类一致地处理像NaN
这样的特殊值。(与基本类型比较不同,在equals()
中NaN
等于NaN
。)自动装箱: 当使用
==
而不是equals()
进行比较时,由于对某些值的缓存,自动装箱可能导致意外行为。
基于哈希的集合中的包装类
包装类以实现与其基本值直接对应的hashCode()
方式,确保了在基于哈希的集合中的一致行为。这对于HashMap
、HashSet
和ConcurrentHashMap
等集合至关重要。考虑以下实现细节,然后我们将看几个例子。
Integer
、Short
和Byte
:直接将基本值作为哈希码返回。Long
:将低 32 位与高 32 位进行异或操作:((int)(value ^ (value >>> 32)))
。Float
:使用Float.floatToIntBits()
转换为原始位,以处理像NaN
这样的特殊值。Double
:转换为原始位,然后对结果位使用Long
的策略。Character
:将 Unicode 代码点作为哈希码返回。Boolean
:返回1231
表示true
,1237
表示false
(任意但一致的值)。
在基于哈希的集合中使用包装类有几个优点:
性能: 基于哈希的集合依赖分布良好的哈希码来实现 O(1)的查找性能。
一致性:
hashCode()
约定要求相等的对象产生相等的哈希码,包装类保证了这一点。特殊值处理: 正确处理边缘情况,如浮点类型中的
NaN
(两个NaN
值在哈希码中是相等的,尽管使用equals()
比较时不相等)。分布: 实现旨在最小化常见值模式的哈希冲突。
不可变性: 由于包装对象是不可变的,它们的哈希码可以在首次计算后安全地缓存,从而提高性能。
这种谨慎的实现确保了包装类能够可靠地作为基于哈希的集合中的键,这是 Java 应用程序中的常见用例。
== 与 .equals() 包装类陷阱
我见过许多由使用==而不是.equals()比较包装对象引起的错误。这是一个经典的 Java 陷阱,甚至困扰着有经验的开发人员。你可以从这里看到是什么让它如此棘手:
这种令人困惑的行为发生是因为 Java 在内部缓存了常用值的Integer
对象(通常是-128 到 127)。在这个范围内,Java 重用相同的对象,而在缓存范围之外,你会得到新的对象。
这就是为什么黄金法则很简单:在比较包装对象时,始终使用.equals()
。这个方法始终检查值相等性(value equality)而不是对象同一性(object identity):
空值拆箱陷阱
开发人员花费大量时间试图理解令人困惑的NullPointerException
的起源,如下所示:
这段看似无害的代码编译时没有警告,但在运行时崩溃。当 Java 尝试将空(null)包装器拆箱为其基本等效值时,它会尝试在空引用上调用intValue()
等方法,从而导致NullPointerException
。
这个问题特别危险,因为它静默地通过编译,错误只在执行期间出现,并且通常发生在方法参数、数据库结果和集合处理中。为了保护你的代码,你可以使用以下防御策略:
显式空值检查;例如,
int primitive = (wrapper != null) ? wrapper : 0;
Java 21 模式匹配;例如,
int value = (wrapper instanceof Integer i) ? i : 0;
提供默认值;例如,
int safe = Optional.ofNullable(wrapper).orElse(0);
在包装对象和基本类型之间转换时,尤其是在处理可能包含来自外部源或数据库查询的空值的数据时,务必小心。
包装类常量(不要重复造轮子)
每个 Java 开发人员可能都曾在某个时候写过类似“if (temperature > 100)
”的代码。但是当你需要检查一个值是否超过整数的最大容量时呢?硬编码2147483647
是滋生 bug 的温床。
相反,你可以使用带有内置常量的包装类:
最有用的常量分为两类。数值限制有助于防止溢出错误:
Integer.MAX_VALUE
和Integer.MIN_VALUE
。需要更大范围时使用
Long.MAX_VALUE
。
浮点特殊值处理边缘情况:
Double.NaN
表示“非数字”结果。需要表示
∞
时使用Double.POSITIVE_INFINITY
。
我发现这些在处理金融计算或处理科学数据(其中特殊值很常见)时特别有用。
包装类的内存和性能影响
理解包装类的内存和性能影响至关重要。首先,每个包装对象需要 16 字节的头部开销:12 字节用于对象头部,4 字节用于对象引用。我们还必须考虑实际的基本值存储(例如,Integer
为 4 字节,Long
为 8 字节等)。最后,集合中的对象引用增加了另一层内存使用,在大型集合中使用包装对象也比使用基本类型数组显著增加内存。
还有性能方面的考虑。首先,尽管有 JIT 优化,但在紧密循环中重复装箱和拆箱会影响性能。另一方面,像Integer
这样的包装类缓存常用值(默认-128 到 127),减少了对象创建。此外,现代 JVM 有时可以在包装对象不“逃逸”方法边界时完全消除其分配。Valhalla 项目旨在通过引入专门的泛型和值对象来解决这些低效问题。
考虑以下减少包装类性能和内存影响的最佳实践指南:
对性能关键代码和大型数据结构使用基本类型。
在需要对象行为时(例如,集合和可空性)利用包装类。
考虑使用像 Eclipse Collections 这样的专门库来处理大量的“包装”基本类型集合。
注意对包装对象进行身份比较(
==
)。始终使用
Object
的equals()
方法来比较包装器。在优化之前进行分析,因为 JVM 对包装器的行为在不断改进。
虽然包装类与基本类型相比会产生开销,但 Java 的持续发展在保持面向对象范式优势的同时,正在不断缩小这一差距。
包装类的一般最佳实践
理解何时使用基本类型 versus 包装类对于编写高效且可维护的 Java 代码至关重要。虽然基本类型提供更好的性能,但包装类在某些场景下提供了灵活性,例如处理空值或使用 Java 的泛型类型。通常,您可以遵循以下准则:
在以下情况下使用基本类型:
局部变量
循环计数器和索引
性能关键代码
返回值(当 null 没有意义时)
在以下情况下使用包装类:
可以为空的类字段
泛型集合(例如,
List<Integer>
)返回值(当 null 具有含义时)
泛型中的类型参数
使用反射时
结论
Java 包装类是基本类型与 Java 面向对象生态系统之间的重要桥梁。从它们在 Java 1.0 中的起源到 Java 21 中的增强,这些不可变类使基本类型能够参与集合和泛型,同时提供丰富的转换和计算实用方法。它们谨慎的实现确保了在基于哈希的集合中的一致行为,并提供了提高代码正确性的重要常量。
虽然包装类与基本类型相比会产生一些内存开销,但现代 JVM 通过缓存和 JIT 编译优化了它们的使用。最佳实践包括使用工厂方法代替已弃用的构造函数,使用.equals()
进行值比较,以及为性能关键代码选择基本类型。随着 Java 21 模式匹配改进和虚拟线程集成,包装类在保持向后兼容性的同时继续发展,巩固了它们在 Java 开发中的重要性。
版权声明: 本文为 InfoQ 作者【码语者】的原创文章。
原文链接:【http://xie.infoq.cn/article/02dc3affccd1e63dba09c5794】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论