OSDN Git Service

a//b -> floor(a/b), since '//' does not produce integer always
[luatex-ja/luatexja.git] / src / ltj-charrange.lua
1 --
2 -- ltj-charrange.lua
3 --
4 luatexbase.provides_module({
5   name = 'luatexja.charrange',
6   date = '2022-08-19',
7   description = 'Handling the range of Japanese characters',
8 })
9 luatexja.charrange = {}
10 luatexja.load_module 'base';      local ltjb = luatexja.base
11
12 local getchar = node.direct.getchar
13 local get_attr = node.direct.get_attribute
14 local get_attr_node = node.get_attribute
15 local tex_getattr = tex.getattribute
16
17 local UNSET = -0x7FFFFFFF
18 local ATTR_RANGE = 7
19 luatexja.charrange.ATTR_RANGE = ATTR_RANGE
20 local jcr_cjk, jcr_noncjk = 0, 1
21 local floor = math.floor
22 local kcat_attr_table = {}
23 local pow_table = {}
24 local fn_table = {} -- used in is_ucs_in_japanese_char_direct
25 local nfn_table = {} -- used in is_ucs_in_japanese_char_node
26 do
27    local ka = luatexbase.attributes['ltj@kcat0']
28    for i = 0, 30 do
29       local pw = 2^i; kcat_attr_table[i], pow_table[i] = ka, pw
30       fn_table[i] = function(p) return get_attr(p, ka)&pw==0 end
31       nfn_table[i] = function(p) return get_attr_node(p, ka)&pw==0 end
32    end
33 end
34 for i = 31, 31*ATTR_RANGE-1 do
35    local ka, pw = luatexbase.attributes['ltj@kcat'..floor(i/31)], 2^(i%31)
36    kcat_attr_table[i], pow_table[i] = ka, pw
37    fn_table[i] = function(p) return (get_attr(p, ka) or 0)&pw==0 end
38    nfn_table[i] = function(p) return (get_attr_node(p, ka) or 0)&pw==0 end
39 end
40 fn_table[-1] = function() return false end -- for char --U+007F
41 nfn_table[-1] = function() return false end -- for char --U+007F
42
43 -- jcr_table_main[chr_code] = index
44 -- index : internal 0,   1, 2, ..., 216               0: 'other'
45 --         external 217, 1  2       216, 217 and (out of range): 'other'
46
47 -- initialize
48 local jcr_table_main = {}
49 local ucs_out = 0x110000
50
51 for i=0x0 ,0x7F       do jcr_table_main[i]=-1 end
52 for i=0x80 ,0xFF      do jcr_table_main[i]=1 end
53 for i=0x100,ucs_out-1 do jcr_table_main[i]=0 end
54
55 -- EXT: add characters to a range
56 function luatexja.charrange.add_char_range(b,e,ind) -- ind: external range number
57    if not ind or ind<0 or ind>31*ATTR_RANGE then -- 0 はエラーにしない(隠し)
58       ltjb.package_error('luatexja',
59                          "invalid character range number (" .. ind .. ")",
60                          "A character range number should be in the range 1.."
61                           .. 31*ATTR_RANGE .. ",\n" ..
62                          "ignored.")
63       return
64    elseif b<0x80 or e>=ucs_out then
65       ltjb.package_warning('luatexja',
66                            'bad character range ([' .. b .. ',' .. e .. ']). ' ..
67                            'I take the intersection with [0x80, 0x10ffff].')
68    elseif b>e then b, e = e, b end
69    if ind == 31*ATTR_RANGE then ind=0 end
70    for i=math.max(0x80,b),math.min(ucs_out-1,e) do
71       jcr_table_main[i]=ind
72    end
73 end
74
75 function luatexja.charrange.char_to_range(c) -- return the external range number
76    local r = jcr_table_main[ltjb.in_unicode(c, false)] or 217
77    return (r~=0) and r or 217
78 end
79
80 local function get_range_setting(i) -- i: internal range number
81    local a = tex_getattr(kcat_attr_table[i])
82    return (a==UNSET and 0 or a)&pow_table[i]
83 end
84
85 --  glyph_node p は和文文字か?
86 function luatexja.charrange.is_ucs_in_japanese_char(p)
87    return nfn_table[jcr_table_main[c or p.char]](p)
88 end
89
90 function luatexja.charrange.is_ucs_in_japanese_char_direct(p ,c)
91    return fn_table[jcr_table_main[c or getchar(p)]](p)
92 end
93
94 function luatexja.charrange.is_japanese_char_curlist(c) -- assume that c>=0x80
95    return get_range_setting(jcr_table_main[c])==0
96 end
97
98 -- EXT
99 function luatexja.charrange.toggle_char_range(g, i) -- i: external range number
100    if type(i)~='number' then
101       ltjb.package_error('luatexja',
102                          "invalid character range number (" .. tostring(i).. ")",
103                          "A character range number must be a number, ignored.")
104    elseif i==0 then return
105    else
106       local kc
107       if i>0 then kc=0 else kc=1; i=-i end; if i>=31*ATTR_RANGE then i=0 end
108       local attr, p = kcat_attr_table[i], pow_table[i]
109       local a = tex_getattr(attr); if a==UNSET then a=0 end
110       a = (a&~p)+kc*p; if a==0 and i>30 then a=UNSET end
111       tex.setattribute(g, attr, a)
112    end
113 end
114
115 luatexja.charrange.get_range_setting=get_range_setting
116
117 -- EOF