java.lang.Object java.net.IDN
public final class IDN
提供在普通 Unicode 表示形式和 ASCII 兼容性编码 (ACE) 表示形式之间进行国际化域名 (IDN) 转换的方法。国际化域名可以使用整个 Unicode 范围内的字符,而传统域名只限于 ASCII 字符。ACE 是只使用 ASCII 字符的 Unicode 字符串编码方式,能够与只识别传统域名的软件(如 Domain Name System)一起使用。
国际化域名在 RFC 3490 中定义。RFC 3490 定义了两种操作:ToASCII 和 ToUnicode。这两种操作使用 Nameprep 算法(Stringprep 的配置文件)和 Punycode 算法来回地转换域名字符串。
上述转换处理的行为可以用各种标志进行调整:
有关国际化域名支持的安全考虑至关重要。例如,英文域名可能被拼写成同形异义词,即故意用非 Latin 字母替代而错拼的词。Unicode Technical Report #36 讨论了 IDN 支持的安全问题以及可能的解决方案。在使用国际域名时应用程序负责采取足够的安全措施。
字段摘要 | |
---|---|
static int |
ALLOW_UNASSIGNED 允许处理未分配代码点的标志。 |
static int |
USE_STD3_ASCII_RULES 根据 STD-3 ASCII 规则执行检查的标志。 |
方法摘要 | |
---|---|
static String |
toASCII(String input) 根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。 |
static String |
toASCII(String input, int flag) 根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。 |
static String |
toUnicode(String input) 根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 ACE) 转换为 Unicode。 |
static String |
toUnicode(String input, int flag) 根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 (ACE) 转换为 Unicode。 |
从类 java.lang.Object 继承的方法 |
---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
字段详细信息 |
---|
public static final int ALLOW_UNASSIGNED
public static final int USE_STD3_ASCII_RULES
方法详细信息 |
---|
public static String toASCII(String input, int flag)
ToASCII 操作可能失败。如果其任何步骤失败,则 ToASCII 失败。如果 ToASCII 操作失败,则抛出 IllegalArgumentException。在这种情况下,输入字符串不应在国际化域名中使用。
标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToASCII 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。如果点被用作标签分隔符,则此方法在输出转换字符串中将它们全部更改为 \u002E(句点)。
input
- 要处理的字符串
flag
- 处理标志;可以为 0 或任何可能标志的逻辑或
IllegalArgumentException
- 如果输入字符串未遵守 RFC 3490 规范
public static String toASCII(String input)
此便捷方法的工作方式类似于调用带两个参数的对应方法,如下所示:
toASCII
(input, 0);
input
- 要处理的字符串
IllegalArgumentException
- 如果输入字符串未遵守 RFC 3490 规范
public static String toUnicode(String input, int flag)
ToUnicode 永远不会失败。出现任何错误时,返回的输入字符串保持不变。
标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToUnicode 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。
input
- 要处理的字符串
flag
- 处理标志;可以为 0 或任何可能标志的逻辑或
public static String toUnicode(String input)