java.net

接口
异常
java.lang.Object
  继承者 java.net.IDN

public final class IDN
     
extends Object

提供在普通 Unicode 表示形式和 ASCII 兼容性编码 (ACE) 表示形式之间进行国际化域名 (IDN) 转换的方法。国际化域名可以使用整个 Unicode 范围内的字符,而传统域名只限于 ASCII 字符。ACE 是只使用 ASCII 字符的 Unicode 字符串编码方式,能够与只识别传统域名的软件(如 Domain Name System)一起使用。

国际化域名在 RFC 3490 中定义。RFC 3490 定义了两种操作:ToASCII 和 ToUnicode。这两种操作使用 Nameprep 算法(Stringprep 的配置文件)和 Punycode 算法来回地转换域名字符串。

上述转换处理的行为可以用各种标志进行调整:

  • 如果使用 ALLOW_UNASSIGNED 标志,则要转换的域名字符串可以包含 Unicode 3.2(IDN 转换所依据的 Unicode 版本)中未分配的代码点。如果未使用该标志,那么存在这种未分配的代码点将被视为一个错误。
  • 如果使用 USE_STD3_ASCII_RULES 标志,则根据 RFC 1122RFC 1123 检查 ASCII 字符串。如果它们不符合要求,则是一个错误。
这些标志在逻辑上可以“或”运算为一个整体。

有关国际化域名支持的安全考虑至关重要。例如,英文域名可能被拼写成同形异义词,即故意用非 Latin 字母替代而错拼的词。Unicode Technical Report #36 讨论了 IDN 支持的安全问题以及可能的解决方案。在使用国际域名时应用程序负责采取足够的安全措施。

从以下版本开始:
1.6

字段摘要
static int ALLOW_UNASSIGNED
          允许处理未分配代码点的标志。
static int USE_STD3_ASCII_RULES
          根据 STD-3 ASCII 规则执行检查的标志。
 
方法摘要
static String toASCII(String input)
          根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。
static String toASCII(String input, int flag)
          根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。
static String toUnicode(String input)
          根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 ACE) 转换为 Unicode。
static String toUnicode(String input, int flag)
          根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 (ACE) 转换为 Unicode。
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

字段详细信息

ALLOW_UNASSIGNED

public static final int ALLOW_UNASSIGNED
允许处理未分配代码点的标志。

另请参见:
常量字段值

USE_STD3_ASCII_RULES

public static final int USE_STD3_ASCII_RULES
根据 STD-3 ASCII 规则执行检查的标志。

另请参见:
常量字段值
方法详细信息

toASCII

public static String toASCII(String input,
                             int flag)
根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。

ToASCII 操作可能失败。如果其任何步骤失败,则 ToASCII 失败。如果 ToASCII 操作失败,则抛出 IllegalArgumentException。在这种情况下,输入字符串不应在国际化域名中使用。

标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToASCII 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。如果点被用作标签分隔符,则此方法在输出转换字符串中将它们全部更改为 \u002E(句点)。

参数:
input - 要处理的字符串
flag - 处理标志;可以为 0 或任何可能标志的逻辑或
返回:
已转换的 String
抛出:
IllegalArgumentException - 如果输入字符串未遵守 RFC 3490 规范

toASCII

public static String toASCII(String input)
根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。

此便捷方法的工作方式类似于调用带两个参数的对应方法,如下所示:

toASCII(input, 0);

参数:
input - 要处理的字符串
返回:
已转换的 String
抛出:
IllegalArgumentException - 如果输入字符串未遵守 RFC 3490 规范

toUnicode

public static String toUnicode(String input,
                               int flag)
根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 (ACE) 转换为 Unicode。

ToUnicode 永远不会失败。出现任何错误时,返回的输入字符串保持不变。

标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToUnicode 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。

参数:
input - 要处理的字符串
flag - 处理标志;可以为 0 或任何可能标志的逻辑或
返回:
已转换的 String

toUnicode

public static String toUnicode(String input)
根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 ACE) 转换为 Unicode。

此便捷方法的工作方式类似于调用带两个参数的对应方法,如下所示:

toUnicode(input, 0);

参数:
input - 要处理的字符串
返回:
已转换的 String