码迷,mamicode.com
首页 > 其他好文 > 详细

Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符

时间:2016-07-06 15:10:48      阅读:150      评论:0      收藏:0      [点我收藏+]

标签:

-- 计算 UTF8 字符串的长度,每一个中文算一个字符
-- @function [parent=#string] utf8len
-- @param string input 输入字符串
-- @return integer#integer  长度

计算 UTF8 字符串的长度,每一个中文算一个字符

local input = "你好World"
print(string.utf8len(input))
-- 输出 7



function string.utf8len(input)
    local len  = string.len(input)
    local left = len
    local cnt  = 0
    local arr  = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
    while left ~= 0 do
        local tmp = string.byte(input, -left)
        local i   = #arr
        while arr[i] do
            if tmp >= arr[i] then
                left = left - i
                break
            end
            i = i - 1
        end
        cnt = cnt + 1
    end
    return cnt
end

Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符

标签:

原文地址:http://blog.csdn.net/heyuchang666/article/details/51832304

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!