Skip to content

utf8_t

概述

wchar_t和char类型转换接口。

示例:

c
const char* str = "hello";
const wchar_t* wstr = L"hello";
char res_str[128];
wchar_t res_wstr[128];

tk_utf8_to_utf16(str, res_wstr, ARRAY_SIZE(res_wstr));
tk_utf8_from_utf16(wstr, res_str, ARRAY_SIZE(res_str));

函数

函数名称说明
tk_utf8_dup_utf16把ucs字符串转成UTF8字符串。
tk_utf8_from_utf16把ucs字符串转成UTF8字符串。
tk_utf8_from_utf16_ex把ucs字符串转成UTF8字符串。
tk_utf8_get_bytes_of_leading获取第一个字节为c的字符的字节数。
tk_utf8_to_utf16将char类型转换为wchar_t类型。
tk_utf8_to_utf16_ex将char类型转换为wchar_t类型。
tk_utf8_trim_invalid_char如果字符串最后一个字符串是无效的,删掉该无效字符。

tk_utf8_dup_utf16 函数

  • 函数功能:

把ucs字符串转成UTF8字符串。

由调用者释放返回的指针。

  • 函数原型:
char* tk_utf8_dup_utf16 (const wchar_t* in, int32_t size);
  • 参数说明:
参数类型说明
返回值char*返回UTF8字符串。
inconst wchar_t*输入字符串。
sizeint32_t字符串长度。

tk_utf8_from_utf16 函数

  • 函数功能:

把ucs字符串转成UTF8字符串。

  • 函数原型:
char* tk_utf8_from_utf16 (const wchar_t* in, char* out, uint32_t out_size);
  • 参数说明:
参数类型说明
返回值char*返回UTF8字符串。
inconst wchar_t*输入字符串。
outchar*输出字符串。
out_sizeuint32_t输出字符串的最大长度。

tk_utf8_from_utf16_ex 函数

  • 函数功能:

把ucs字符串转成UTF8字符串。

  • 函数原型:
char* tk_utf8_from_utf16_ex (const wchar_t* in, uint32_t in_size, char* out, uint32_t out_size);
  • 参数说明:
参数类型说明
返回值char*返回UTF8字符串。
inconst wchar_t*输入字符串。
in_sizeuint32_t输入字符串的长度。
outchar*输出字符串。
out_sizeuint32_t输出字符串的最大长度。

tk_utf8_get_bytes_of_leading 函数

  • 函数功能:

获取第一个字节为c的字符的字节数。

  • 函数原型:
uint32_t tk_utf8_get_bytes_of_leading (uint8_t c);
  • 参数说明:
参数类型说明
返回值uint32_t返回字符的字节数。
cuint8_t字符的第一个字节。

tk_utf8_to_utf16 函数

  • 函数功能:

将char类型转换为wchar_t类型。

  • 函数原型:
wchar_t* tk_utf8_to_utf16 (const char* str, wchar_t* out, uint32_t out_size);
  • 参数说明:
参数类型说明
返回值wchar_t*值。
strconst char*str。
outwchar_t*返回结果缓冲区。
out_sizeuint32_t缓冲区大小。

tk_utf8_to_utf16_ex 函数

  • 函数功能:

将char类型转换为wchar_t类型。

  • 函数原型:
wchar_t* tk_utf8_to_utf16_ex (const char* str, uint32_t size, wchar_t* out, uint32_t out_size);
  • 参数说明:
参数类型说明
返回值wchar_t*值。
strconst char*str。
sizeuint32_t缓冲区大小。
outwchar_t*返回结果缓冲区。
out_sizeuint32_t缓冲区大小。

tk_utf8_trim_invalid_char 函数

  • 函数功能:

如果字符串最后一个字符串是无效的,删掉该无效字符。

对于用strncpy/snprintf等生成字符串时,如果目标字符串内存大小不够, 可能最后一个字符被从中间截断,导致该字符是无效的,这可能会触发assert, 本函数可以用来删除最后一个无效字符。

  • 函数原型:
char* tk_utf8_trim_invalid_char (char* str);
  • 参数说明:
参数类型说明
返回值char*返回UTF8字符串。
strchar*输入字符串。