OSDN Git Service

the function `put_longword()' should be used the ANSI-C declaration for 64-bits off_t...
[lha/lha.git] / src / header.c
1 /* ------------------------------------------------------------------------ */
2 /* LHa for UNIX                                                             */
3 /*              header.c -- header manipulate functions                     */
4 /*                                                                          */
5 /*      Modified                Nobutaka Watazaki                           */
6 /*                                                                          */
7 /*  Original                                                Y.Tagawa        */
8 /*  modified                                    1991.12.16  M.Oki           */
9 /*  Ver. 1.10  Symbolic Link added              1993.10.01  N.Watazaki      */
10 /*  Ver. 1.13b Symbolic Link Bug Fix            1994.08.22  N.Watazaki      */
11 /*  Ver. 1.14  Source All chagned               1995.01.14  N.Watazaki      */
12 /*  Ver. 1.14i bug fixed                        2000.10.06  t.okamoto       */
13 /*  Ver. 1.14i Contributed UTF-8 convertion for Mac OS X                    */
14 /*                                              2002.06.29  Hiroto Sakai    */
15 /*  Ver. 1.14i autoconfiscated & rewritten      2003.02.23  Koji Arai       */
16 /* ------------------------------------------------------------------------ */
17 #include "lha.h"
18
19 #define DUMP_HEADER 1           /* for debugging */
20
21 #if !STRCHR_8BIT_CLEAN
22 /* should use 8 bit clean version */
23 #undef strchr
24 #undef strrchr
25 #define strchr  xstrchr
26 #define strrchr  xstrrchr
27 #endif
28
29 static char    *get_ptr;
30 #define GET_BYTE()      (*get_ptr++ & 0xff)
31
32 #if DUMP_HEADER
33 static char    *start_ptr;
34 #define setup_get(PTR)  (start_ptr = get_ptr = (PTR))
35 #define get_byte()      dump_get_byte()
36 #define skip_bytes(len) dump_skip_bytes(len)
37 #else
38 #define setup_get(PTR)  (get_ptr = (PTR))
39 #define get_byte()      GET_BYTE()
40 #define skip_bytes(len) (get_ptr += (len))
41 #endif
42 #define put_ptr         get_ptr
43 #define setup_put(PTR)  (put_ptr = (PTR))
44 #define put_byte(c)     (*put_ptr++ = (char)(c))
45
46 int optional_archive_kanji_code = NONE;
47 int optional_system_kanji_code = NONE;
48 char *optional_archive_delim = NULL;
49 char *optional_system_delim = NULL;
50 int optional_filename_case = NONE;
51
52 #ifdef MULTIBYTE_FILENAME
53 int default_system_kanji_code = MULTIBYTE_FILENAME;
54 #else
55 int default_system_kanji_code = NONE;
56 #endif
57
58 int
59 calc_sum(p, len)
60     void *p;
61     int len;
62 {
63     int sum = 0;
64
65     while (len--) sum += *(unsigned char*)p++;
66
67     return sum & 0xff;
68 }
69
70 #if DUMP_HEADER
71 static int
72 dump_get_byte()
73 {
74     int c;
75
76     if (verbose_listing && verbose > 1)
77         printf("%02d %2d: ", get_ptr - start_ptr, 1);
78     c = GET_BYTE();
79     if (verbose_listing && verbose > 1) {
80         if (isprint(c))
81             printf("%d(0x%02x) '%c'\n", c, c, c);
82         else
83             printf("%d(0x%02x)\n", c, c);
84     }
85     return c;
86 }
87
88 static void
89 dump_skip_bytes(len)
90     int len;
91 {
92     if (len == 0) return;
93     if (verbose_listing && verbose > 1) {
94         printf("%02d %2d: ", get_ptr - start_ptr, len);
95         while (len--)
96             printf("0x%02x ", GET_BYTE());
97         printf("... ignored\n");
98     }
99     else
100         get_ptr += len;
101 }
102 #endif
103
104 static int
105 get_word()
106 {
107     int b0, b1;
108     int w;
109
110 #if DUMP_HEADER
111     if (verbose_listing && verbose > 1)
112         printf("%02d %2d: ", get_ptr - start_ptr, 2);
113 #endif
114     b0 = GET_BYTE();
115     b1 = GET_BYTE();
116     w = (b1 << 8) + b0;
117 #if DUMP_HEADER
118     if (verbose_listing && verbose > 1)
119         printf("%d(0x%04x)\n", w, w);
120 #endif
121     return w;
122 }
123
124 static void
125 put_word(v)
126     unsigned int    v;
127 {
128     put_byte(v);
129     put_byte(v >> 8);
130 }
131
132 static long
133 get_longword()
134 {
135     long b0, b1, b2, b3;
136     long l;
137
138 #if DUMP_HEADER
139     if (verbose_listing && verbose > 1)
140         printf("%02d %2d: ", get_ptr - start_ptr, 4);
141 #endif
142     b0 = GET_BYTE();
143     b1 = GET_BYTE();
144     b2 = GET_BYTE();
145     b3 = GET_BYTE();
146     l = (b3 << 24) + (b2 << 16) + (b1 << 8) + b0;
147 #if DUMP_HEADER
148     if (verbose_listing && verbose > 1)
149         printf("%ld(0x%08lx)\n", l, l);
150 #endif
151     return l;
152 }
153
154 static void
155 put_longword(long v)
156 {
157     put_byte(v);
158     put_byte(v >> 8);
159     put_byte(v >> 16);
160     put_byte(v >> 24);
161 }
162
163 #ifdef HAVE_UINT64_T
164 static uint64_t
165 get_longlongword()
166 {
167     uint64_t b0, b1, b2, b3, b4, b5, b6, b7;
168     uint64_t l;
169
170 #if DUMP_HEADER
171     if (verbose_listing && verbose > 1)
172         printf("%02d %2d: ", get_ptr - start_ptr, 4);
173 #endif
174     b0 = GET_BYTE();
175     b1 = GET_BYTE();
176     b2 = GET_BYTE();
177     b3 = GET_BYTE();
178     b4 = GET_BYTE();
179     b5 = GET_BYTE();
180     b6 = GET_BYTE();
181     b7 = GET_BYTE();
182
183     l = (b7 << 24) + (b6 << 16) + (b5 << 8) + b4;
184     l <<= 32;
185     l |= (b3 << 24) + (b2 << 16) + (b1 << 8) + b0;
186 #if DUMP_HEADER
187     if (verbose_listing && verbose > 1)
188         printf("%lld(%#016llx)\n", l, l);
189 #endif
190     return l;
191 }
192
193 static void
194 put_longlongword(uint64_t v)
195 {
196     put_byte(v);
197     put_byte(v >> 8);
198     put_byte(v >> 16);
199     put_byte(v >> 24);
200     put_byte(v >> 32);
201     put_byte(v >> 40);
202     put_byte(v >> 48);
203     put_byte(v >> 56);
204 }
205 #endif
206
207 static int
208 get_bytes(buf, len, size)
209     char *buf;
210     int len, size;
211 {
212     int i;
213
214 #if DUMP_HEADER
215     if (verbose_listing && verbose > 1)
216         printf("%02d %2d: \"", get_ptr - start_ptr, len);
217
218     for (i = 0; i < len; i++) {
219         if (i < size) buf[i] = get_ptr[i];
220
221         if (verbose_listing && verbose > 1) {
222             if (isprint(buf[i]))
223                 printf("%c", buf[i]);
224             else
225                 printf("\\x%02x", (unsigned char)buf[i]);
226         }
227     }
228
229     if (verbose_listing && verbose > 1)
230         printf("\"\n");
231 #else
232     for (i = 0; i < len && i < size; i++)
233         buf[i] = get_ptr[i];
234 #endif
235
236     get_ptr += len;
237     return i;
238 }
239
240 static void
241 put_bytes(buf, len)
242     char *buf;
243     int len;
244 {
245     int i;
246     for (i = 0; i < len; i++)
247         put_byte(buf[i]);
248 }
249
250 /* added by Koji Arai */
251 void
252 convert_filename(name, len, size,
253                  from_code, to_code,
254                  from_delim, to_delim,
255                  case_to)
256     char *name;
257     int len;                    /* length of name */
258     int size;                   /* size of name buffer */
259     int from_code, to_code, case_to;
260     char *from_delim, *to_delim;
261
262 {
263     int i;
264 #ifdef MULTIBYTE_FILENAME
265     char tmp[FILENAME_LENGTH];
266     int to_code_save = NONE;
267
268     if (from_code == CODE_CAP) {
269         len = cap_to_sjis(tmp, name, sizeof(tmp));
270         strncpy(name, tmp, size);
271         name[size-1] = 0;
272         len = strlen(name);
273         from_code = CODE_SJIS;
274     }
275
276     if (to_code == CODE_CAP) {
277         to_code_save = CODE_CAP;
278         to_code = CODE_SJIS;
279     }
280
281     if (from_code == CODE_SJIS && to_code == CODE_UTF8) {
282         for (i = 0; i < len; i++)
283             /* FIXME: provisionally fix for the Mac OS CoreFoundation */
284             if ((unsigned char)name[i] == LHA_PATHSEP)  name[i] = '/';
285         sjis_to_utf8(tmp, name, sizeof(tmp));
286         strncpy(name, tmp, size);
287         name[size-1] = 0;
288         len = strlen(name);
289         for (i = 0; i < len; i++)
290             if (name[i] == '/')  name[i] = LHA_PATHSEP;
291         from_code = CODE_UTF8;
292     }
293     else if (from_code == CODE_UTF8 && to_code == CODE_SJIS) {
294         for (i = 0; i < len; i++)
295             /* FIXME: provisionally fix for the Mac OS CoreFoundation */
296             if ((unsigned char)name[i] == LHA_PATHSEP)  name[i] = '/';
297         utf8_to_sjis(tmp, name, sizeof(tmp));
298         strncpy(name, tmp, size);
299         name[size-1] = 0;
300         len = strlen(name);
301         for (i = 0; i < len; i++)
302             if (name[i] == '/')  name[i] = LHA_PATHSEP;
303         from_code = CODE_SJIS;
304     }
305 #endif
306
307     /* special case: if `name' has small lettter, not convert case. */
308     if (from_code == CODE_SJIS && case_to == TO_LOWER) {
309         for (i = 0; i < len; i++) {
310 #ifdef MULTIBYTE_FILENAME
311             if (SJIS_FIRST_P(name[i]) && SJIS_SECOND_P(name[i+1]))
312                 i++;
313             else
314 #endif
315             if (islower(name[i])) {
316                 case_to = NONE;
317                 break;
318             }
319         }
320     }
321
322     for (i = 0; i < len; i ++) {
323 #ifdef MULTIBYTE_FILENAME
324         if (from_code == CODE_EUC &&
325             (unsigned char)name[i] == 0x8e) {
326             if (to_code != CODE_SJIS) {
327                 i++;
328                 continue;
329             }
330
331             /* X0201 KANA */
332             memmove(name + i, name + i + 1, len - i);
333             len--;
334             continue;
335         }
336         if (from_code == CODE_SJIS && X0201_KANA_P(name[i])) {
337             if (to_code != CODE_EUC) {
338                 continue;
339             }
340
341             if (len == size - 1) /* check overflow */
342                 len--;
343             memmove(name+i+1, name+i, len-i);
344             name[i] = 0x8e;
345             i++;
346             len++;
347             continue;
348         }
349         if (from_code == CODE_EUC && (name[i] & 0x80) && (name[i+1] & 0x80)) {
350             int c1, c2;
351             if (to_code != CODE_SJIS) {
352                 i++;
353                 continue;
354             }
355
356             c1 = (unsigned char)name[i];
357             c2 = (unsigned char)name[i+1];
358             euc2sjis(&c1, &c2);
359             name[i] = c1;
360             name[i+1] = c2;
361             i++;
362             continue;
363         }
364         if (from_code == CODE_SJIS &&
365             SJIS_FIRST_P(name[i]) &&
366             SJIS_SECOND_P(name[i+1])) {
367             int c1, c2;
368
369             if (to_code != CODE_EUC) {
370                 i++;
371                 continue;
372             }
373
374             c1 = (unsigned char)name[i];
375             c2 = (unsigned char)name[i+1];
376             sjis2euc(&c1, &c2);
377             name[i] = c1;
378             name[i+1] = c2;
379             i++;
380             continue;
381         }
382 #endif /* MULTIBYTE_FILENAME */
383         {
384             char *ptr;
385
386             /* transpose from_delim to to_delim */
387
388             if ((ptr = strchr(from_delim, name[i])) != NULL) {
389                 name[i] = to_delim[ptr - from_delim];
390                 continue;
391             }
392         }
393
394         if (case_to == TO_UPPER && islower(name[i])) {
395             name[i] = toupper(name[i]);
396             continue;
397         }
398         if (case_to == TO_LOWER && isupper(name[i])) {
399             name[i] = tolower(name[i]);
400             continue;
401         }
402     }
403
404 #ifdef MULTIBYTE_FILENAME
405     if (to_code_save == CODE_CAP) {
406         len = sjis_to_cap(tmp, name, sizeof(tmp));
407         strncpy(name, tmp, size);
408         name[size-1] = 0;
409         len = strlen(name);
410     }
411 #endif /* MULTIBYTE_FILENAME */
412 }
413
414 /*
415  * Generic (MS-DOS style) time stamp format (localtime):
416  *
417  *  31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16
418  * |<---- year-1980 --->|<- month ->|<--- day ---->|
419  *
420  *  15 14 13 12 11 10  9  8  7  6  5  4  3  2  1  0
421  * |<--- hour --->|<---- minute --->|<- second/2 ->|
422  *
423  */
424
425 static time_t
426 generic_to_unix_stamp(t)
427     long t;
428 {
429     struct tm tm;
430
431 #define subbits(n, off, len) (((n) >> (off)) & ((1 << (len))-1))
432
433     tm.tm_sec  = subbits(t,  0, 5) * 2;
434     tm.tm_min  = subbits(t,  5, 6);
435     tm.tm_hour = subbits(t, 11, 5);
436     tm.tm_mday = subbits(t, 16, 5);
437     tm.tm_mon  = subbits(t, 21, 4) - 1;
438     tm.tm_year = subbits(t, 25, 7) + 80;
439     tm.tm_isdst = -1;
440
441 #if HAVE_MKTIME
442     return mktime(&tm);
443 #else
444     return timelocal(&tm);
445 #endif
446 }
447
448 static long
449 unix_to_generic_stamp(t)
450     time_t t;
451 {
452     struct tm *tm = localtime(&t);
453
454     tm->tm_year -= 80;
455     tm->tm_mon += 1;
456
457     return ((long)(tm->tm_year << 25) +
458             (tm->tm_mon  << 21) +
459             (tm->tm_mday << 16) +
460             (tm->tm_hour << 11) +
461             (tm->tm_min  << 5) +
462             (tm->tm_sec / 2));
463 }
464
465 static unsigned long
466 wintime_to_unix_stamp()
467 {
468 #if HAVE_UINT64_T
469     uint64_t t;
470     uint64_t epoch = ((uint64_t)0x019db1de << 32) + 0xd53e8000;
471                      /* 0x019db1ded53e8000ULL: 1970-01-01 00:00:00 (UTC) */
472
473     t = (unsigned long)get_longword();
474     t |= (uint64_t)(unsigned long)get_longword() << 32;
475     t = (t - epoch) / 10000000;
476     return t;
477 #else
478     int i, borrow;
479     unsigned long t, q, x;
480     unsigned long wintime[8];
481     unsigned long epoch[8] = {0x01,0x9d,0xb1,0xde, 0xd5,0x3e,0x80,0x00};
482                                 /* 1970-01-01 00:00:00 (UTC) */
483     /* wintime -= epoch */
484     borrow = 0;
485     for (i = 7; i >= 0; i--) {
486         wintime[i] = (unsigned)get_byte() - epoch[i] - borrow;
487         borrow = (wintime[i] > 0xff) ? 1 : 0;
488         wintime[i] &= 0xff;
489     }
490
491     /* q = wintime / 10000000 */
492     t = q = 0;
493     x = 10000000;               /* x: 24bit */
494     for (i = 0; i < 8; i++) {
495         t = (t << 8) + wintime[i]; /* 24bit + 8bit. t must be 32bit variable */
496         q <<= 8;                   /* q must be 32bit (time_t) */
497         q += t / x;
498         t %= x;     /* 24bit */
499     }
500     return q;
501 #endif
502 }
503
504 /*
505  * extended header
506  *
507  *             size  field name
508  *  --------------------------------
509  *  base header:         :
510  *           2 or 4  next-header size  [*1]
511  *  --------------------------------------
512  *  ext header:   1  ext-type            ^
513  *                ?  contents            | [*1] next-header size
514  *           2 or 4  next-header size    v
515  *  --------------------------------------
516  *
517  *  on level 1, 2 header:
518  *    size field is 2 bytes
519  *  on level 3 header:
520  *    size field is 4 bytes
521  */
522
523 static ssize_t
524 get_extended_header(fp, hdr, header_size, hcrc)
525     FILE *fp;
526     LzHeader *hdr;
527     size_t header_size;
528     unsigned int *hcrc;
529 {
530     char data[LZHEADER_STORAGE];
531     int name_length;
532     char dirname[FILENAME_LENGTH];
533     int dir_length = 0;
534     int i;
535     ssize_t whole_size = header_size;
536     int ext_type;
537     int n = 1 + hdr->size_field_length; /* `ext-type' + `next-header size' */
538
539     if (hdr->header_level == 0)
540         return 0;
541
542     name_length = strlen(hdr->name);
543
544     while (header_size) {
545 #if DUMP_HEADER
546         if (verbose_listing && verbose > 1)
547             printf("---\n");
548 #endif
549         setup_get(data);
550         if (sizeof(data) < header_size) {
551             error("header size (%ld) too large.", header_size);
552             exit(1);
553         }
554
555         if (fread(data, header_size, 1, fp) == 0) {
556             error("Invalid header (LHa file ?)");
557             return -1;
558         }
559
560         ext_type = get_byte();
561         switch (ext_type) {
562         case 0:
563 #if DUMP_HEADER
564             if (verbose_listing && verbose > 1) printf("     < header crc >\n");
565 #endif
566             /* header crc (CRC-16) */
567             hdr->header_crc = get_word();
568             /* clear buffer for CRC calculation. */
569             data[1] = data[2] = 0;
570             skip_bytes(header_size - n - 2);
571             break;
572         case 1:
573 #if DUMP_HEADER
574             if (verbose_listing && verbose > 1) printf("     < filename >\n");
575 #endif
576             /* filename */
577             name_length =
578                 get_bytes(hdr->name, header_size-n, sizeof(hdr->name)-1);
579             hdr->name[name_length] = 0;
580             break;
581         case 2:
582 #if DUMP_HEADER
583             if (verbose_listing && verbose > 1) printf("     < directory >\n");
584 #endif
585             /* directory */
586             dir_length = get_bytes(dirname, header_size-n, sizeof(dirname)-1);
587             dirname[dir_length] = 0;
588             break;
589         case 0x40:
590 #if DUMP_HEADER
591             if (verbose_listing && verbose > 1) printf("     < MS-DOS attribute >\n");
592 #endif
593             /* MS-DOS attribute */
594             hdr->attribute = get_word();
595             break;
596         case 0x41:
597 #if DUMP_HEADER
598             if (verbose_listing && verbose > 1) printf("     < Windows time stamp (FILETIME) >\n");
599 #endif
600             /* Windows time stamp (FILETIME structure) */
601             /* it is time in 100 nano seconds since 1601-01-01 00:00:00 */
602
603             skip_bytes(8); /* create time is ignored */
604
605             /* set last modified time */
606             if (hdr->header_level >= 2)
607                 skip_bytes(8);  /* time_t has been already set */
608             else
609                 hdr->unix_last_modified_stamp = wintime_to_unix_stamp();
610
611             skip_bytes(8); /* last access time is ignored */
612
613             break;
614         case 0x42:
615 #if DUMP_HEADER
616             if (verbose_listing && verbose > 1) printf("     < 64bits file size header >\n");
617 #endif
618 #ifdef HAVE_UINT64_T
619             /* 64bits file size header (UNLHA32 extension) */
620             hdr->packed_size = get_longlongword();
621             hdr->original_size = get_longlongword();
622 #else
623             skip_bytes(8);
624             skip_bytes(8);
625 #endif
626
627             break;
628         case 0x50:
629 #if DUMP_HEADER
630             if (verbose_listing && verbose > 1) printf("     < UNIX permission >\n");
631 #endif
632             /* UNIX permission */
633             hdr->unix_mode = get_word();
634             break;
635         case 0x51:
636 #if DUMP_HEADER
637             if (verbose_listing && verbose > 1) printf("     < UNIX gid and uid >\n");
638 #endif
639             /* UNIX gid and uid */
640             hdr->unix_gid = get_word();
641             hdr->unix_uid = get_word();
642             break;
643         case 0x52:
644 #if DUMP_HEADER
645             if (verbose_listing && verbose > 1) printf("     < UNIX group name >\n");
646 #endif
647             /* UNIX group name */
648             i = get_bytes(hdr->group, header_size-n, sizeof(hdr->group)-1);
649             hdr->group[i] = '\0';
650             break;
651         case 0x53:
652 #if DUMP_HEADER
653             if (verbose_listing && verbose > 1) printf("     < UNIX user name >\n");
654 #endif
655             /* UNIX user name */
656             i = get_bytes(hdr->user, header_size-n, sizeof(hdr->user)-1);
657             hdr->user[i] = '\0';
658             break;
659         case 0x54:
660 #if DUMP_HEADER
661             if (verbose_listing && verbose > 1) printf("     < UNIX last modifed time (time_t) >\n");
662 #endif
663             /* UNIX last modified time */
664             hdr->unix_last_modified_stamp = (time_t) get_longword();
665             break;
666         default:
667             /* other headers */
668             /* 0x39: multi-disk header
669                0x3f: uncompressed comment
670                0x42: 64bit large file size
671                0x48-0x4f(?): reserved for authenticity verification
672                0x7d: encapsulation
673                0x7e: extended attribute - platform information
674                0x7f: extended attribute - permission, owner-id and timestamp
675                      (level 3 on OS/2)
676                0xc4: compressed comment (dict size: 4096)
677                0xc5: compressed comment (dict size: 8192)
678                0xc6: compressed comment (dict size: 16384)
679                0xc7: compressed comment (dict size: 32768)
680                0xc8: compressed comment (dict size: 65536)
681                0xd0-0xdf(?): operating systemm specific information
682                0xfc: encapsulation (another opinion)
683                0xfe: extended attribute - platform information(another opinion)
684                0xff: extended attribute - permission, owner-id and timestamp
685                      (level 3 on UNLHA32) */
686             if (verbose)
687                 warning("unknown extended header 0x%02x", ext_type);
688             skip_bytes(header_size - n);
689             break;
690         }
691
692         if (hcrc)
693             *hcrc = calccrc(*hcrc, data, header_size);
694
695         if (hdr->size_field_length == 2)
696             whole_size += header_size = get_word();
697         else
698             whole_size += header_size = get_longword();
699     }
700
701     /* concatenate dirname and filename */
702     if (dir_length) {
703         if (name_length + dir_length >= sizeof(hdr->name)) {
704             warning("the length of pathname \"%s%s\" is too long.",
705                     dirname, hdr->name);
706             name_length = sizeof(hdr->name) - dir_length - 1;
707             hdr->name[name_length] = 0;
708         }
709         strcat(dirname, hdr->name); /* ok */
710         strcpy(hdr->name, dirname); /* ok */
711         name_length += dir_length;
712     }
713
714     return whole_size;
715 }
716
717 #define I_HEADER_SIZE           0               /* level 0,1,2   */
718 #define I_HEADER_CHECKSUM       1               /* level 0,1     */
719 #define I_METHOD                2               /* level 0,1,2,3 */
720 #define I_PACKED_SIZE           7               /* level 0,1,2,3 */
721 #define I_ATTRIBUTE             19              /* level 0,1,2,3 */
722 #define I_HEADER_LEVEL          20              /* level 0,1,2,3 */
723
724 #define COMMON_HEADER_SIZE      21      /* size of common part */
725
726 #define I_GENERIC_HEADER_SIZE 24 /* + name_length */
727 #define I_LEVEL0_HEADER_SIZE  36 /* + name_length (unix extended) */
728 #define I_LEVEL1_HEADER_SIZE  27 /* + name_length */
729 #define I_LEVEL2_HEADER_SIZE  26 /* + padding */
730 #define I_LEVEL3_HEADER_SIZE  32
731
732 /*
733  * level 0 header
734  *
735  *
736  * offset  size  field name
737  * ----------------------------------
738  *     0      1  header size    [*1]
739  *     1      1  header sum
740  *            ---------------------------------------
741  *     2      5  method ID                         ^
742  *     7      4  packed size    [*2]               |
743  *    11      4  original size                     |
744  *    15      2  time                              |
745  *    17      2  date                              |
746  *    19      1  attribute                         | [*1] header size (X+Y+22)
747  *    20      1  level (0x00 fixed)                |
748  *    21      1  name length                       |
749  *    22      X  pathname                          |
750  * X +22      2  file crc (CRC-16)                 |
751  * X +24      Y  ext-header(old style)             v
752  * -------------------------------------------------
753  * X+Y+24        data                              ^
754  *                 :                               | [*2] packed size
755  *                 :                               v
756  * -------------------------------------------------
757  *
758  * ext-header(old style)
759  *     0      1  ext-type ('U')
760  *     1      1  minor version
761  *     2      4  UNIX time
762  *     6      2  mode
763  *     8      2  uid
764  *    10      2  gid
765  *
766  * attribute (MS-DOS)
767  *    bit1  read only
768  *    bit2  hidden
769  *    bit3  system
770  *    bit4  volume label
771  *    bit5  directory
772  *    bit6  archive bit (need to backup)
773  *
774  */
775 static int
776 get_header_level0(fp, hdr, data)
777     FILE *fp;
778     LzHeader *hdr;
779     char *data;
780 {
781     size_t header_size;
782     ssize_t extend_size;
783     int checksum;
784     int name_length;
785     int i;
786
787     hdr->size_field_length = 2; /* in bytes */
788     hdr->header_size = header_size = get_byte();
789     checksum = get_byte();
790
791     if (fread(data + COMMON_HEADER_SIZE,
792               header_size + 2 - COMMON_HEADER_SIZE, 1, fp) == 0) {
793         error("Invalid header (LHarc file ?)");
794         return FALSE;   /* finish */
795     }
796
797     if (calc_sum(data + I_METHOD, header_size) != checksum) {
798         error("Checksum error (LHarc file?)");
799         return FALSE;
800     }
801
802     get_bytes(hdr->method, 5, sizeof(hdr->method));
803     hdr->packed_size = (unsigned long)get_longword();
804     hdr->original_size = (unsigned long)get_longword();
805     hdr->unix_last_modified_stamp = generic_to_unix_stamp(get_longword());
806     hdr->attribute = get_byte(); /* MS-DOS attribute */
807     hdr->header_level = get_byte();
808     name_length = get_byte();
809     i = get_bytes(hdr->name, name_length, sizeof(hdr->name)-1);
810     hdr->name[i] = '\0';
811
812     /* defaults for other type */
813     hdr->unix_mode = UNIX_FILE_REGULAR | UNIX_RW_RW_RW;
814     hdr->unix_gid = 0;
815     hdr->unix_uid = 0;
816
817     extend_size = header_size+2 - name_length - 24;
818
819     if (extend_size < 0) {
820         if (extend_size == -2) {
821             /* CRC field is not given */
822             hdr->extend_type = EXTEND_GENERIC;
823             hdr->has_crc = FALSE;
824
825             return TRUE;
826         }
827
828         error("Unkonwn header (lha file?)");
829         exit(1);
830     }
831
832     hdr->has_crc = TRUE;
833     hdr->crc = get_word();
834
835     if (extend_size == 0)
836         return TRUE;
837
838     hdr->extend_type = get_byte();
839     extend_size--;
840
841     if (hdr->extend_type == EXTEND_UNIX) {
842         if (extend_size >= 11) {
843             hdr->minor_version = get_byte();
844             hdr->unix_last_modified_stamp = (time_t) get_longword();
845             hdr->unix_mode = get_word();
846             hdr->unix_uid = get_word();
847             hdr->unix_gid = get_word();
848             extend_size -= 11;
849         } else {
850             hdr->extend_type = EXTEND_GENERIC;
851         }
852     }
853     if (extend_size > 0)
854         skip_bytes(extend_size);
855
856     hdr->header_size += 2;
857     return TRUE;
858 }
859
860 /*
861  * level 1 header
862  *
863  *
864  * offset   size  field name
865  * -----------------------------------
866  *     0       1  header size   [*1]
867  *     1       1  header sum
868  *             -------------------------------------
869  *     2       5  method ID                        ^
870  *     7       4  skip size     [*2]               |
871  *    11       4  original size                    |
872  *    15       2  time                             |
873  *    17       2  date                             |
874  *    19       1  attribute (0x20 fixed)           | [*1] header size (X+Y+25)
875  *    20       1  level (0x01 fixed)               |
876  *    21       1  name length                      |
877  *    22       X  filename                         |
878  * X+ 22       2  file crc (CRC-16)                |
879  * X+ 24       1  OS ID                            |
880  * X +25       Y  ???                              |
881  * X+Y+25      2  next-header size                 v
882  * -------------------------------------------------
883  * X+Y+27      Z  ext-header                       ^
884  *                 :                               |
885  * -----------------------------------             | [*2] skip size
886  * X+Y+Z+27       data                             |
887  *                 :                               v
888  * -------------------------------------------------
889  *
890  */
891 static int
892 get_header_level1(fp, hdr, data)
893     FILE *fp;
894     LzHeader *hdr;
895     char *data;
896 {
897     size_t header_size;
898     ssize_t extend_size;
899     int checksum;
900     int name_length;
901     int i, dummy;
902
903     hdr->size_field_length = 2; /* in bytes */
904     hdr->header_size = header_size = get_byte();
905     checksum = get_byte();
906
907     if (fread(data + COMMON_HEADER_SIZE,
908               header_size + 2 - COMMON_HEADER_SIZE, 1, fp) == 0) {
909         error("Invalid header (LHarc file ?)");
910         return FALSE;   /* finish */
911     }
912
913     if (calc_sum(data + I_METHOD, header_size) != checksum) {
914         error("Checksum error (LHarc file?)");
915         return FALSE;
916     }
917
918     get_bytes(hdr->method, 5, sizeof(hdr->method));
919     hdr->packed_size = (unsigned long)get_longword(); /* skip size */
920     hdr->original_size = (unsigned long)get_longword();
921     hdr->unix_last_modified_stamp = generic_to_unix_stamp(get_longword());
922     hdr->attribute = get_byte(); /* 0x20 fixed */
923     hdr->header_level = get_byte();
924
925     name_length = get_byte();
926     i = get_bytes(hdr->name, name_length, sizeof(hdr->name)-1);
927     hdr->name[i] = '\0';
928
929     /* defaults for other type */
930     hdr->unix_mode = UNIX_FILE_REGULAR | UNIX_RW_RW_RW;
931     hdr->unix_gid = 0;
932     hdr->unix_uid = 0;
933
934     hdr->has_crc = TRUE;
935     hdr->crc = get_word();
936     hdr->extend_type = get_byte();
937
938     dummy = header_size+2 - name_length - I_LEVEL1_HEADER_SIZE;
939     if (dummy > 0)
940         skip_bytes(dummy); /* skip old style extend header */
941
942     extend_size = get_word();
943     extend_size = get_extended_header(fp, hdr, extend_size, 0);
944     if (extend_size == -1)
945         return FALSE;
946
947     /* On level 1 header, size fields should be adjusted. */
948     /* the `packed_size' field contains the extended header size. */
949     /* the `header_size' field does not. */
950     hdr->packed_size -= extend_size;
951     hdr->header_size += extend_size + 2;
952
953     return TRUE;
954 }
955
956 /*
957  * level 2 header
958  *
959  *
960  * offset   size  field name
961  * --------------------------------------------------
962  *     0       2  total header size [*1]           ^
963  *             -----------------------             |
964  *     2       5  method ID                        |
965  *     7       4  packed size       [*2]           |
966  *    11       4  original size                    |
967  *    15       4  time                             |
968  *    19       1  RESERVED (0x20 fixed)            | [*1] total header size
969  *    20       1  level (0x02 fixed)               |      (X+26+(1))
970  *    21       2  file crc (CRC-16)                |
971  *    23       1  OS ID                            |
972  *    24       2  next-header size                 |
973  * -----------------------------------             |
974  *    26       X  ext-header                       |
975  *                 :                               |
976  * -----------------------------------             |
977  * X +26      (1) padding                          v
978  * -------------------------------------------------
979  * X +26+(1)      data                             ^
980  *                 :                               | [*2] packed size
981  *                 :                               v
982  * -------------------------------------------------
983  *
984  */
985 static int
986 get_header_level2(fp, hdr, data)
987     FILE *fp;
988     LzHeader *hdr;
989     char *data;
990 {
991     size_t header_size;
992     ssize_t extend_size;
993     int padding;
994     unsigned int hcrc;
995
996     hdr->size_field_length = 2; /* in bytes */
997     hdr->header_size = header_size = get_word();
998
999     if (fread(data + COMMON_HEADER_SIZE,
1000               I_LEVEL2_HEADER_SIZE - COMMON_HEADER_SIZE, 1, fp) == 0) {
1001         error("Invalid header (LHarc file ?)");
1002         return FALSE;   /* finish */
1003     }
1004
1005     get_bytes(hdr->method, 5, sizeof(hdr->method));
1006     hdr->packed_size = (unsigned long)get_longword();
1007     hdr->original_size = (unsigned long)get_longword();
1008     hdr->unix_last_modified_stamp = get_longword();
1009     hdr->attribute = get_byte(); /* reserved */
1010     hdr->header_level = get_byte();
1011
1012     /* defaults for other type */
1013     hdr->unix_mode = UNIX_FILE_REGULAR | UNIX_RW_RW_RW;
1014     hdr->unix_gid = 0;
1015     hdr->unix_uid = 0;
1016
1017     hdr->has_crc = TRUE;
1018     hdr->crc = get_word();
1019     hdr->extend_type = get_byte();
1020     extend_size = get_word();
1021
1022     INITIALIZE_CRC(hcrc);
1023     hcrc = calccrc(hcrc, data, get_ptr - data);
1024
1025     extend_size = get_extended_header(fp, hdr, extend_size, &hcrc);
1026     if (extend_size == -1)
1027         return FALSE;
1028
1029     padding = header_size - I_LEVEL2_HEADER_SIZE - extend_size;
1030     while (padding--)           /* padding should be 0 or 1 */
1031         hcrc = UPDATE_CRC(hcrc, fgetc(fp));
1032
1033     if (hdr->header_crc != hcrc)
1034         error("header CRC error");
1035
1036     return TRUE;
1037 }
1038
1039 /*
1040  * level 3 header
1041  *
1042  *
1043  * offset   size  field name
1044  * --------------------------------------------------
1045  *     0       2  size field length (4 fixed)      ^
1046  *     2       5  method ID                        |
1047  *     7       4  packed size       [*2]           |
1048  *    11       4  original size                    |
1049  *    15       4  time                             |
1050  *    19       1  RESERVED (0x20 fixed)            | [*1] total header size
1051  *    20       1  level (0x03 fixed)               |      (X+32)
1052  *    21       2  file crc (CRC-16)                |
1053  *    23       1  OS ID                            |
1054  *    24       4  total header size [*1]           |
1055  *    28       4  next-header size                 |
1056  * -----------------------------------             |
1057  *    32       X  ext-header                       |
1058  *                 :                               v
1059  * -------------------------------------------------
1060  * X +32          data                             ^
1061  *                 :                               | [*2] packed size
1062  *                 :                               v
1063  * -------------------------------------------------
1064  *
1065  */
1066 static int
1067 get_header_level3(fp, hdr, data)
1068     FILE *fp;
1069     LzHeader *hdr;
1070     char *data;
1071 {
1072     size_t header_size;
1073     ssize_t extend_size;
1074     int padding;
1075     unsigned int hcrc;
1076
1077     hdr->size_field_length = get_word();
1078
1079     if (fread(data + COMMON_HEADER_SIZE,
1080               I_LEVEL3_HEADER_SIZE - COMMON_HEADER_SIZE, 1, fp) == 0) {
1081         error("Invalid header (LHarc file ?)");
1082         return FALSE;   /* finish */
1083     }
1084
1085     get_bytes(hdr->method, 5, sizeof(hdr->method));
1086     hdr->packed_size = (unsigned long)get_longword();
1087     hdr->original_size = (unsigned long)get_longword();
1088     hdr->unix_last_modified_stamp = get_longword();
1089     hdr->attribute = get_byte(); /* reserved */
1090     hdr->header_level = get_byte();
1091
1092     /* defaults for other type */
1093     hdr->unix_mode = UNIX_FILE_REGULAR | UNIX_RW_RW_RW;
1094     hdr->unix_gid = 0;
1095     hdr->unix_uid = 0;
1096
1097     hdr->has_crc = TRUE;
1098     hdr->crc = get_word();
1099     hdr->extend_type = get_byte();
1100     hdr->header_size = header_size = get_longword();
1101     extend_size = get_longword();
1102
1103     INITIALIZE_CRC(hcrc);
1104     hcrc = calccrc(hcrc, data, get_ptr - data);
1105
1106     extend_size = get_extended_header(fp, hdr, extend_size, &hcrc);
1107     if (extend_size == -1)
1108         return FALSE;
1109
1110     padding = header_size - I_LEVEL3_HEADER_SIZE - extend_size;
1111     while (padding--)           /* padding should be 0 */
1112         hcrc = UPDATE_CRC(hcrc, fgetc(fp));
1113
1114     if (hdr->header_crc != hcrc)
1115         error("header CRC error");
1116
1117     return TRUE;
1118 }
1119
1120 boolean
1121 get_header(fp, hdr)
1122     FILE *fp;
1123     LzHeader *hdr;
1124 {
1125     char data[LZHEADER_STORAGE];
1126
1127     int archive_kanji_code = CODE_SJIS;
1128     int system_kanji_code = default_system_kanji_code;
1129     char *archive_delim = "\377\\"; /* `\' is for level 0 header and
1130                                        broken archive. */
1131     char *system_delim = "//";
1132     int filename_case = NONE;
1133     int end_mark;
1134
1135     memset(hdr, 0, sizeof(LzHeader));
1136
1137     setup_get(data);
1138
1139     if ((end_mark = getc(fp)) == EOF || end_mark == 0) {
1140         return FALSE;           /* finish */
1141     }
1142     data[0] = end_mark;
1143
1144     if (fread(data + 1, COMMON_HEADER_SIZE - 1, 1, fp) == 0) {
1145         error("Invalid header (LHarc file ?)");
1146         return FALSE;           /* finish */
1147     }
1148
1149     switch (data[I_HEADER_LEVEL]) {
1150     case 0:
1151         if (get_header_level0(fp, hdr, data) == FALSE)
1152             return FALSE;
1153         break;
1154     case 1:
1155         if (get_header_level1(fp, hdr, data) == FALSE)
1156             return FALSE;
1157         break;
1158     case 2:
1159         if (get_header_level2(fp, hdr, data) == FALSE)
1160             return FALSE;
1161         break;
1162     case 3:
1163         if (get_header_level3(fp, hdr, data) == FALSE)
1164             return FALSE;
1165         break;
1166     default:
1167         error("Unknown level header (level %d)", data[I_HEADER_LEVEL]);
1168         return FALSE;
1169     }
1170
1171     /* filename conversion */
1172     switch (hdr->extend_type) {
1173     case EXTEND_MSDOS:
1174         filename_case = convertcase ? TO_LOWER : NONE;
1175         break;
1176     case EXTEND_HUMAN:
1177     case EXTEND_OS68K:
1178     case EXTEND_XOSK:
1179     case EXTEND_UNIX:
1180     case EXTEND_JAVA:
1181         filename_case = NONE;
1182         break;
1183
1184     case EXTEND_MACOS:
1185         archive_delim = "\377/:\\";
1186                           /* `\' is for level 0 header and broken archive. */
1187         system_delim = "/://";
1188         filename_case = NONE;
1189         break;
1190
1191     default:
1192         filename_case = convertcase ? TO_LOWER : NONE;
1193         break;
1194     }
1195
1196     if (optional_archive_kanji_code)
1197         archive_kanji_code = optional_archive_kanji_code;
1198     if (optional_system_kanji_code)
1199         system_kanji_code = optional_system_kanji_code;
1200     if (optional_archive_delim)
1201         archive_delim = optional_archive_delim;
1202     if (optional_system_delim)
1203         system_delim = optional_system_delim;
1204     if (optional_filename_case)
1205         filename_case = optional_filename_case;
1206
1207     /* kanji code and delimiter conversion */
1208     convert_filename(hdr->name, strlen(hdr->name), sizeof(hdr->name),
1209                      archive_kanji_code,
1210                      system_kanji_code,
1211                      archive_delim, system_delim, filename_case);
1212
1213     if ((hdr->unix_mode & UNIX_FILE_SYMLINK) == UNIX_FILE_SYMLINK) {
1214         char *p;
1215         /* split symbolic link */
1216         p = strchr(hdr->name, '|');
1217         if (p) {
1218             /* hdr->name is symbolic link name */
1219             /* hdr->realname is real name */
1220             *p = 0;
1221             strcpy(hdr->realname, p+1); /* ok */
1222         }
1223         else
1224             error("unknown symlink name \"%s\"", hdr->name);
1225     }
1226
1227     return TRUE;
1228 }
1229
1230 /* skip SFX header */
1231 int
1232 seek_lha_header(fp)
1233     FILE *fp;
1234 {
1235     unsigned char   buffer[64 * 1024]; /* max seek size */
1236     unsigned char  *p;
1237     int             n;
1238
1239     n = fread(buffer, 1, sizeof(buffer), fp);
1240
1241     for (p = buffer; p < buffer + n; p++) {
1242         if (! (p[I_METHOD]=='-' && p[I_METHOD+1]=='l' && p[I_METHOD+4]=='-'))
1243             continue;
1244         /* found "-l??-" keyword (as METHOD type string) */
1245
1246         /* level 0 or 1 header */
1247         if ((p[I_HEADER_LEVEL] == 0 || p[I_HEADER_LEVEL] == 1)
1248             && p[I_HEADER_SIZE] > 20
1249             && p[I_HEADER_CHECKSUM] == calc_sum(p+2, p[I_HEADER_SIZE])) {
1250             if (fseeko(fp, (p - buffer) - n, SEEK_CUR) == -1)
1251                 fatal_error("cannot seek header");
1252             return 0;
1253         }
1254
1255         /* level 2 header */
1256         if (p[I_HEADER_LEVEL] == 2
1257             && p[I_HEADER_SIZE] >= 24
1258             && p[I_ATTRIBUTE] == 0x20) {
1259             if (fseeko(fp, (p - buffer) - n, SEEK_CUR) == -1)
1260                 fatal_error("cannot seek header");
1261             return 0;
1262         }
1263     }
1264
1265     if (fseeko(fp, -n, SEEK_CUR) == -1)
1266         fatal_error("cannot seek header");
1267     return -1;
1268 }
1269
1270
1271 /* remove leading `xxxx/..' */
1272 static char *
1273 remove_leading_dots(char *path)
1274 {
1275     char *first = path;
1276     char *ptr = 0;
1277
1278     if (strcmp(first, "..") == 0) {
1279         warning("Removing leading `..' from member name.");
1280         return first+1;         /* change to "." */
1281     }
1282
1283     if (strstr(first, "..") == 0)
1284         return first;
1285
1286     while (path && *path) {
1287
1288         if (strcmp(path, "..") == 0)
1289             ptr = path = path+2;
1290         else if (strncmp(path, "../", 3) == 0)
1291             ptr = path = path+3;
1292         else
1293             path = strchr(path, '/');
1294
1295         if (path && *path == '/') {
1296             path++;
1297         }
1298     }
1299
1300     if (ptr) {
1301         warning("Removing leading `%.*s' from member name.", ptr-first, first);
1302         return ptr;
1303     }
1304
1305     return first;
1306 }
1307
1308 static int
1309 copy_path_element(char *dst, const char *src, int size)
1310 {
1311     int i;
1312
1313     if (size < 1) return 0;
1314
1315     for (i = 0; i < size; i++) {
1316         dst[i] = src[i];
1317         if (dst[i] == '\0')
1318             return i;
1319         if (dst[i] == '/') {
1320             dst[++i] = 0;
1321             return i;
1322         }
1323     }
1324
1325     dst[--i] = 0;
1326
1327     return i;
1328 }
1329
1330 /* remove leading "xxx/../" and "./" */
1331 static int
1332 remove_dots(char *newpath, char *path, size_t size)
1333 {
1334     int len;
1335     char *p = newpath;
1336
1337     path = remove_leading_dots(path);
1338
1339     while (*path) {
1340         if (path[0] == '.' && path[1] == '/')
1341             path += 2;
1342         else {
1343             int len;
1344             len = copy_path_element(newpath, path, size);
1345
1346             path += len;
1347             newpath += len;
1348             size -= len;
1349             if (size <= 1)
1350                 break;
1351         }
1352     }
1353
1354     /* When newpath is empty, set "." */
1355     if (newpath == p) {
1356         strcpy(newpath, ".");
1357         newpath++;
1358     }
1359
1360     return newpath - p;         /* string length */
1361 }
1362
1363 void
1364 init_header(name, v_stat, hdr)
1365     char           *name;
1366     struct stat    *v_stat;
1367     LzHeader       *hdr;
1368 {
1369     int             len;
1370
1371     memset(hdr, 0, sizeof(LzHeader));
1372
1373     /* the `method' member is rewrote by the encoding function.
1374        but need set for empty files */
1375     memcpy(hdr->method, LZHUFF0_METHOD, METHOD_TYPE_STORAGE);
1376
1377     hdr->packed_size = 0;
1378     hdr->original_size = v_stat->st_size;
1379     hdr->attribute = GENERIC_ATTRIBUTE;
1380     hdr->header_level = header_level;
1381
1382     len = remove_dots(hdr->name, name, sizeof(hdr->name));
1383
1384     hdr->crc = 0x0000;
1385     hdr->extend_type = EXTEND_UNIX;
1386     hdr->unix_last_modified_stamp = v_stat->st_mtime;
1387     /* since 00:00:00 JAN.1.1970 */
1388 #ifdef NOT_COMPATIBLE_MODE
1389     /* Please need your modification in this space. */
1390 #ifdef __DJGPP__
1391     hdr->unix_mode = 0;
1392     if (S_ISREG(v_stat->st_mode))
1393             hdr->unix_mode = hdr->unix_mode | UNIX_FILE_REGULAR;
1394     if (S_ISDIR(v_stat->st_mode))
1395             hdr->unix_mode = hdr->unix_mode | UNIX_FILE_DIRECTORY;
1396     if (S_ISLNK(v_stat->st_mode))
1397             hdr->unix_mode = hdr->unix_mode | UNIX_FILE_SYMLINK;
1398     if (v_stat->st_mode & S_IRUSR) 
1399             hdr->unix_mode = hdr->unix_mode | UNIX_OWNER_READ_PERM;
1400     if (v_stat->st_mode & S_IRGRP) 
1401             hdr->unix_mode = hdr->unix_mode | UNIX_GROUP_READ_PERM;
1402     if (v_stat->st_mode & S_IROTH) 
1403             hdr->unix_mode = hdr->unix_mode | UNIX_OTHER_READ_PERM;
1404     if (v_stat->st_mode & S_IWUSR) 
1405             hdr->unix_mode = hdr->unix_mode | UNIX_OWNER_WRITE_PERM;
1406     if (v_stat->st_mode & S_IWGRP) 
1407             hdr->unix_mode = hdr->unix_mode | UNIX_GROUP_WRITE_PERM;
1408     if (v_stat->st_mode & S_IWOTH) 
1409             hdr->unix_mode = hdr->unix_mode | UNIX_OTHER_WRITE_PERM;
1410     if (v_stat->st_mode & S_IXUSR) 
1411             hdr->unix_mode = hdr->unix_mode | UNIX_OWNER_EXEC_PERM;
1412     if (v_stat->st_mode & S_IXGRP) 
1413             hdr->unix_mode = hdr->unix_mode | UNIX_GROUP_EXEC_PERM;
1414     if (v_stat->st_mode & S_IXOTH) 
1415             hdr->unix_mode = hdr->unix_mode | UNIX_OTHER_EXEC_PERM;
1416     if (v_stat->st_mode & S_ISUID) 
1417             hdr->unix_mode = hdr->unix_mode | UNIX_SETUID;
1418     if (v_stat->st_mode & S_ISGID) 
1419             hdr->unix_mode = hdr->unix_mode | UNIX_SETGID;
1420 #endif /* __DJGPP__ */
1421 #else
1422     hdr->unix_mode = v_stat->st_mode;
1423 #endif
1424
1425     hdr->unix_uid = v_stat->st_uid;
1426     hdr->unix_gid = v_stat->st_gid;
1427
1428 #if INCLUDE_OWNER_NAME_IN_HEADER
1429 #if HAVE_GETPWUID
1430     {
1431         struct passwd *ent = getpwuid(hdr->unix_uid);
1432
1433         if (ent) {
1434             strncpy(hdr->user, ent->pw_name, sizeof(hdr->user));
1435             if (hdr->user[sizeof(hdr->user)-1])
1436                 hdr->user[sizeof(hdr->user)-1] = 0;
1437         }
1438     }
1439 #endif
1440 #if HAVE_GETGRGID
1441     {
1442         struct group *ent = getgrgid(hdr->unix_gid);
1443
1444         if (ent) {
1445             strncpy(hdr->group, ent->gr_name, sizeof(hdr->group));
1446             if (hdr->group[sizeof(hdr->group)-1])
1447                 hdr->group[sizeof(hdr->group)-1] = 0;
1448         }
1449     }
1450 #endif
1451 #endif /* INCLUDE_OWNER_NAME_IN_HEADER */
1452     if (is_directory(v_stat)) {
1453         memcpy(hdr->method, LZHDIRS_METHOD, METHOD_TYPE_STORAGE);
1454         hdr->attribute = GENERIC_DIRECTORY_ATTRIBUTE;
1455         hdr->original_size = 0;
1456         if (len > 0 && hdr->name[len - 1] != '/') {
1457             if (len < sizeof(hdr->name)-1)
1458                 strcpy(&hdr->name[len++], "/"); /* ok */
1459             else
1460                 warning("the length of dirname \"%s\" is too long.",
1461                         hdr->name);
1462         }
1463     }
1464
1465 #ifdef S_IFLNK
1466     if (is_symlink(v_stat)) {
1467         memcpy(hdr->method, LZHDIRS_METHOD, METHOD_TYPE_STORAGE);
1468         hdr->attribute = GENERIC_DIRECTORY_ATTRIBUTE;
1469         hdr->original_size = 0;
1470         readlink(name, hdr->realname, sizeof(hdr->realname));
1471     }
1472 #endif
1473 }
1474
1475 static void
1476 write_unix_info(hdr)
1477     LzHeader *hdr;
1478 {
1479     /* UNIX specific informations */
1480
1481     put_word(5);            /* size */
1482     put_byte(0x50);         /* permission */
1483     put_word(hdr->unix_mode);
1484
1485     put_word(7);            /* size */
1486     put_byte(0x51);         /* gid and uid */
1487     put_word(hdr->unix_gid);
1488     put_word(hdr->unix_uid);
1489
1490     if (hdr->group[0]) {
1491         int len = strlen(hdr->group);
1492         put_word(len + 3);  /* size */
1493         put_byte(0x52);     /* group name */
1494         put_bytes(hdr->group, len);
1495     }
1496
1497     if (hdr->user[0]) {
1498         int len = strlen(hdr->user);
1499         put_word(len + 3);  /* size */
1500         put_byte(0x53);     /* user name */
1501         put_bytes(hdr->user, len);
1502     }
1503
1504     if (hdr->header_level == 1) {
1505         put_word(7);        /* size */
1506         put_byte(0x54);     /* time stamp */
1507         put_longword(hdr->unix_last_modified_stamp);
1508     }
1509 }
1510
1511 static size_t
1512 write_header_level0(data, hdr, pathname)
1513     LzHeader *hdr;
1514     char *data, *pathname;
1515 {
1516     int limit;
1517     int name_length;
1518     size_t header_size;
1519
1520     setup_put(data);
1521     memset(data, 0, LZHEADER_STORAGE);
1522
1523     put_byte(0x00);             /* header size */
1524     put_byte(0x00);             /* check sum */
1525     put_bytes(hdr->method, 5);
1526     put_longword(hdr->packed_size);
1527     put_longword(hdr->original_size);
1528     put_longword(unix_to_generic_stamp(hdr->unix_last_modified_stamp));
1529     put_byte(hdr->attribute);
1530     put_byte(hdr->header_level); /* level 0 */
1531
1532     /* write pathname (level 0 header contains the directory part) */
1533     name_length = strlen(pathname);
1534     if (generic_format)
1535         limit = 255 - I_GENERIC_HEADER_SIZE + 2;
1536     else
1537         limit = 255 - I_LEVEL0_HEADER_SIZE + 2;
1538
1539     if (name_length > limit) {
1540         warning("the length of pathname \"%s\" is too long.", pathname);
1541         name_length = limit;
1542     }
1543     put_byte(name_length);
1544     put_bytes(pathname, name_length);
1545     put_word(hdr->crc);
1546
1547     if (generic_format) {
1548         header_size = I_GENERIC_HEADER_SIZE + name_length - 2;
1549         data[I_HEADER_SIZE] = header_size;
1550         data[I_HEADER_CHECKSUM] = calc_sum(data + I_METHOD, header_size);
1551     } else {
1552         /* write old-style extend header */
1553         put_byte(EXTEND_UNIX);
1554         put_byte(CURRENT_UNIX_MINOR_VERSION);
1555         put_longword(hdr->unix_last_modified_stamp);
1556         put_word(hdr->unix_mode);
1557         put_word(hdr->unix_uid);
1558         put_word(hdr->unix_gid);
1559
1560         /* size of extended header is 12 */
1561         header_size = I_LEVEL0_HEADER_SIZE + name_length - 2;
1562         data[I_HEADER_SIZE] = header_size;
1563         data[I_HEADER_CHECKSUM] = calc_sum(data + I_METHOD, header_size);
1564     }
1565
1566     return header_size + 2;
1567 }
1568
1569 static size_t
1570 write_header_level1(data, hdr, pathname)
1571     LzHeader *hdr;
1572     char *data, *pathname;
1573 {
1574     int name_length, dir_length, limit;
1575     char *basename, *dirname;
1576     size_t header_size;
1577     char *extend_header_top;
1578     size_t extend_header_size;
1579
1580     basename = strrchr(pathname, LHA_PATHSEP);
1581     if (basename) {
1582         basename++;
1583         name_length = strlen(basename);
1584         dirname = pathname;
1585         dir_length = basename - dirname;
1586     }
1587     else {
1588         basename = pathname;
1589         name_length = strlen(basename);
1590         dirname = "";
1591         dir_length = 0;
1592     }
1593
1594     setup_put(data);
1595     memset(data, 0, LZHEADER_STORAGE);
1596
1597     put_byte(0x00);             /* header size */
1598     put_byte(0x00);             /* check sum */
1599     put_bytes(hdr->method, 5);
1600     put_longword(hdr->packed_size);
1601     put_longword(hdr->original_size);
1602     put_longword(unix_to_generic_stamp(hdr->unix_last_modified_stamp));
1603     put_byte(0x20);
1604     put_byte(hdr->header_level); /* level 1 */
1605
1606     /* level 1 header: write filename (basename only) */
1607     limit = 255 - I_LEVEL1_HEADER_SIZE + 2;
1608     if (name_length > limit) {
1609         put_byte(0);            /* name length */
1610     }
1611     else {
1612         put_byte(name_length);
1613         put_bytes(basename, name_length);
1614     }
1615
1616     put_word(hdr->crc);
1617
1618     if (generic_format)
1619         put_byte(0x00);
1620     else
1621         put_byte(EXTEND_UNIX);
1622
1623     /* write extend header from here. */
1624
1625     extend_header_top = put_ptr+2; /* +2 for the field `next header size' */
1626     header_size = extend_header_top - data - 2;
1627
1628     /* write filename and dirname */
1629
1630     if (name_length > limit) {
1631         put_word(name_length + 3); /* size */
1632         put_byte(0x01);         /* filename */
1633         put_bytes(basename, name_length);
1634     }
1635
1636     if (dir_length > 0) {
1637         put_word(dir_length + 3); /* size */
1638         put_byte(0x02);         /* dirname */
1639         put_bytes(dirname, dir_length);
1640     }
1641
1642     if (!generic_format)
1643         write_unix_info(hdr);
1644
1645     put_word(0x0000);           /* next header size */
1646
1647     extend_header_size = put_ptr - extend_header_top;
1648     /* On level 1 header, the packed size field is contains the ext-header */
1649     hdr->packed_size += put_ptr - extend_header_top;
1650
1651     /* put `skip size' */
1652     setup_put(data + I_PACKED_SIZE);
1653     put_longword(hdr->packed_size);
1654
1655     data[I_HEADER_SIZE] = header_size;
1656     data[I_HEADER_CHECKSUM] = calc_sum(data + I_METHOD, header_size);
1657
1658     return header_size + extend_header_size + 2;
1659 }
1660
1661 static size_t
1662 write_header_level2(data, hdr, pathname)
1663     LzHeader *hdr;
1664     char *data, *pathname;
1665 {
1666     int name_length, dir_length;
1667     char *basename, *dirname;
1668     size_t header_size;
1669     char *extend_header_top;
1670     char *headercrc_ptr;
1671     unsigned int hcrc;
1672
1673     basename = strrchr(pathname, LHA_PATHSEP);
1674     if (basename) {
1675         basename++;
1676         name_length = strlen(basename);
1677         dirname = pathname;
1678         dir_length = basename - dirname;
1679     }
1680     else {
1681         basename = pathname;
1682         name_length = strlen(basename);
1683         dirname = "";
1684         dir_length = 0;
1685     }
1686
1687     setup_put(data);
1688     memset(data, 0, LZHEADER_STORAGE);
1689
1690     put_word(0x0000);           /* header size */
1691     put_bytes(hdr->method, 5);
1692     put_longword(hdr->packed_size);
1693     put_longword(hdr->original_size);
1694     put_longword(hdr->unix_last_modified_stamp);
1695     put_byte(0x20);
1696     put_byte(hdr->header_level); /* level 2 */
1697
1698     put_word(hdr->crc);
1699
1700     if (generic_format)
1701         put_byte(0x00);
1702     else
1703         put_byte(EXTEND_UNIX);
1704
1705     /* write extend header from here. */
1706
1707     extend_header_top = put_ptr+2; /* +2 for the field `next header size' */
1708
1709     /* write common header */
1710     put_word(5);
1711     put_byte(0x00);
1712     headercrc_ptr = put_ptr;
1713     put_word(0x0000);           /* header CRC */
1714
1715     /* write filename and dirname */
1716     /* must have this header, even if the name_length is 0. */
1717     put_word(name_length + 3);  /* size */
1718     put_byte(0x01);             /* filename */
1719     put_bytes(basename, name_length);
1720
1721     if (dir_length > 0) {
1722         put_word(dir_length + 3); /* size */
1723         put_byte(0x02);         /* dirname */
1724         put_bytes(dirname, dir_length);
1725     }
1726
1727     if (!generic_format)
1728         write_unix_info(hdr);
1729
1730     put_word(0x0000);           /* next header size */
1731
1732     header_size = put_ptr - data;
1733     if ((header_size & 0xff) == 0) {
1734         /* cannot put zero at the first byte on level 2 header. */
1735         /* adjust header size. */
1736         put_byte(0);            /* padding */
1737         header_size++;
1738     }
1739
1740     /* put header size */
1741     setup_put(data + I_HEADER_SIZE);
1742     put_word(header_size);
1743
1744     /* put header CRC in extended header */
1745     INITIALIZE_CRC(hcrc);
1746     hcrc = calccrc(hcrc, data, (unsigned int) header_size);
1747     setup_put(headercrc_ptr);
1748     put_word(hcrc);
1749
1750     return header_size;
1751 }
1752
1753 void
1754 write_header(fp, hdr)
1755     FILE           *fp;
1756     LzHeader       *hdr;
1757 {
1758     size_t header_size;
1759     char data[LZHEADER_STORAGE];
1760
1761     int archive_kanji_code = CODE_SJIS;
1762     int system_kanji_code = default_system_kanji_code;
1763     char *archive_delim = "\377";
1764     char *system_delim = "/";
1765     int filename_case = NONE;
1766     char pathname[FILENAME_LENGTH];
1767
1768     if (optional_archive_kanji_code)
1769         archive_kanji_code = optional_archive_kanji_code;
1770     if (optional_system_kanji_code)
1771         system_kanji_code = optional_system_kanji_code;
1772
1773     if (generic_format && convertcase)
1774         filename_case = TO_UPPER;
1775
1776     if (hdr->header_level == 0) {
1777         archive_delim = "\\";
1778     }
1779
1780     if ((hdr->unix_mode & UNIX_FILE_SYMLINK) == UNIX_FILE_SYMLINK) {
1781         char *p;
1782         p = strchr(hdr->name, '|');
1783         if (p) {
1784             error("symlink name \"%s\" contains '|' char. change it into '_'",
1785                   hdr->name);
1786             *p = '_';
1787         }
1788         if (xsnprintf(pathname, sizeof(pathname),
1789                       "%s|%s", hdr->name, hdr->realname) == -1)
1790             error("file name is too long (%s -> %s)", hdr->name, hdr->realname);
1791     }
1792     else {
1793         strncpy(pathname, hdr->name, sizeof(pathname));
1794         pathname[sizeof(pathname)-1] = 0;
1795     }
1796
1797     convert_filename(pathname, strlen(pathname), sizeof(pathname),
1798                      system_kanji_code,
1799                      archive_kanji_code,
1800                      system_delim, archive_delim, filename_case);
1801
1802     switch (hdr->header_level) {
1803     case 0:
1804         header_size = write_header_level0(data, hdr, pathname);
1805         break;
1806     case 1:
1807         header_size = write_header_level1(data, hdr, pathname);
1808         break;
1809     case 2:
1810         header_size = write_header_level2(data, hdr, pathname);
1811         break;
1812     default:
1813         error("Unknown level header (level %d)", hdr->header_level);
1814         exit(1);
1815     }
1816
1817     if (fwrite(data, header_size, 1, fp) == 0)
1818         fatal_error("Cannot write to temporary file");
1819 }
1820
1821 #if MULTIBYTE_FILENAME
1822
1823 #if defined(__APPLE__)  /* Added by Hiroto Sakai */
1824
1825 #include <CoreFoundation/CFString.h>
1826 #include <CoreFoundation/CFStringEncodingExt.h>
1827
1828 /* this is not need for Mac OS X v 10.2 later */
1829 enum {
1830   kCFStringEncodingAllowLossyConversion = 1,
1831   kCFStringEncodingBasicDirectionLeftToRight = (1 << 1),
1832   kCFStringEncodingBasicDirectionRightToLeft = (1 << 2),
1833   kCFStringEncodingSubstituteCombinings = (1 << 3),
1834   kCFStringEncodingComposeCombinings = (1 << 4),
1835   kCFStringEncodingIgnoreCombinings = (1 << 5),
1836   kCFStringEncodingUseCanonical = (1 << 6),
1837   kCFStringEncodingUseHFSPlusCanonical = (1 << 7),
1838   kCFStringEncodingPrependBOM = (1 << 8),
1839   kCFStringEncodingDisableCorporateArea = (1 << 9),
1840   kCFStringEncodingASCIICompatibleConversion = (1 << 10),
1841 };
1842
1843 static int
1844 ConvertEncodingToUTF8(const char* inCStr,
1845                       char* outUTF8Buffer,
1846                       int outUTF8BufferLength,
1847                       unsigned long scriptEncoding,
1848                       unsigned long flags)
1849 {
1850     unsigned long unicodeChars;
1851     unsigned long srcCharsUsed;
1852     unsigned long usedByteLen = 0;
1853     UniChar uniStr[512];
1854     unsigned long cfResult;
1855
1856     cfResult = CFStringEncodingBytesToUnicode(scriptEncoding,
1857                                               flags,
1858                                               (char *)inCStr,
1859                                               strlen(inCStr),
1860                                               &srcCharsUsed,
1861                                               uniStr,
1862                                               512,
1863                                               &unicodeChars);
1864     if (cfResult == 0) {
1865         cfResult = CFStringEncodingUnicodeToBytes(kCFStringEncodingUTF8,
1866                                                   flags,
1867                                                   uniStr,
1868                                                   unicodeChars,
1869                                                   &srcCharsUsed,
1870                                                   (char*)outUTF8Buffer,
1871                                                   outUTF8BufferLength - 1,
1872                                                   &usedByteLen);
1873         outUTF8Buffer[usedByteLen] = '\0';
1874     }
1875
1876     return cfResult;
1877 }
1878
1879 static int
1880 ConvertUTF8ToEncoding(const char* inUTF8Buf,
1881                       int inUTF8BufLength,
1882                       char* outCStrBuffer,
1883                       int outCStrBufferLength,
1884                       unsigned long scriptEncoding,
1885                       unsigned long flags)
1886 {
1887     unsigned long unicodeChars;
1888     unsigned long srcCharsUsed;
1889     unsigned long usedByteLen = 0;
1890     UniChar uniStr[256];
1891     unsigned long cfResult;
1892
1893     cfResult = CFStringEncodingBytesToUnicode(kCFStringEncodingUTF8,
1894                                               flags,
1895                                               (char*)inUTF8Buf,
1896                                               inUTF8BufLength,
1897                                               &srcCharsUsed,
1898                                               uniStr,
1899                                               255,
1900                                               &unicodeChars);
1901     if (cfResult == 0) {
1902         cfResult = CFStringEncodingUnicodeToBytes(scriptEncoding,
1903                                                   flags,
1904                                                   uniStr,
1905                                                   unicodeChars,
1906                                                   &srcCharsUsed,
1907                                                   (char*)outCStrBuffer,
1908                                                   outCStrBufferLength - 1,
1909                                                   &usedByteLen);
1910         outCStrBuffer[usedByteLen] = '\0';
1911     }
1912
1913     return cfResult;
1914 }
1915
1916 #elif HAVE_ICONV
1917 #include <iconv.h>
1918
1919 static int
1920 ConvertEncodingByIconv(const char *src, char *dst, int dstsize,
1921                        const char *srcEnc, const char *dstEnc)
1922 {
1923     iconv_t ic;
1924     static char szTmpBuf[2048];
1925     char *src_p;
1926     char *dst_p;
1927     size_t sLen;
1928     size_t iLen;
1929
1930     dst_p = &szTmpBuf[0];
1931     iLen = (size_t)sizeof(szTmpBuf)-1;
1932     src_p = (char *)src;
1933     sLen = (size_t)strlen(src);
1934     memset(szTmpBuf, 0, sizeof(szTmpBuf));
1935     memset(dst, 0, dstsize);
1936
1937     ic = iconv_open(dstEnc, srcEnc);
1938     if (ic == (iconv_t)-1) {
1939         error("iconv_open() failure: %s", strerror(errno));
1940         return -1;
1941     }
1942
1943     if (iconv(ic, &src_p, &sLen, &dst_p, &iLen) == (size_t)-1) {
1944         error("iconv() failure: %s", strerror(errno));
1945         iconv_close(ic);
1946         return -1;
1947     }
1948
1949     strncpy(dst, szTmpBuf, dstsize);
1950
1951     iconv_close(ic);
1952
1953     return 0;
1954 }
1955 #endif /* defined(__APPLE__) */
1956
1957 char *
1958 sjis_to_utf8(char *dst, const char *src, size_t dstsize)
1959 {
1960 #if defined(__APPLE__)
1961   dst[0] = '\0';
1962   if (ConvertEncodingToUTF8(src, dst, dstsize,
1963                             kCFStringEncodingDOSJapanese,
1964                             kCFStringEncodingUseHFSPlusCanonical) == 0)
1965       return dst;
1966 #elif HAVE_ICONV
1967   if (ConvertEncodingByIconv(src, dst, dstsize, "SJIS", "UTF-8") != -1)
1968       return dst;
1969 #else
1970   error("not support utf-8 conversion");
1971 #endif
1972
1973   if (dstsize < 1) return dst;
1974   dst[dstsize-1] = 0;
1975   return strncpy(dst, src, dstsize-1);
1976 }
1977
1978 char *
1979 utf8_to_sjis(char *dst, const char *src, size_t dstsize)
1980 {
1981 #if defined(__APPLE__)
1982   int srclen;
1983
1984   dst[0] = '\0';
1985   srclen = strlen(src);
1986   if (ConvertUTF8ToEncoding(src, srclen, dst, dstsize,
1987                             kCFStringEncodingDOSJapanese,
1988                             kCFStringEncodingUseHFSPlusCanonical) == 0)
1989       return dst;
1990 #elif HAVE_ICONV
1991   if (ConvertEncodingByIconv(src, dst, dstsize, "UTF-8", "SJIS") != -1)
1992       return dst;
1993 #else
1994   error("not support utf-8 conversion");
1995 #endif
1996
1997   if (dstsize < 1) return dst;
1998   dst[dstsize-1] = 0;
1999   return strncpy(dst, src, dstsize-1);
2000 }
2001
2002 /*
2003  * SJIS <-> EUC ÊÑ´¹´Ø¿ô
2004  * ¡ÖÆüËܸì¾ðÊó½èÍý¡×   ¥½¥Õ¥È¥Ð¥ó¥¯(³ô)
2005  *  ¤è¤êÈ´¿è(by Koji Arai)
2006  */
2007 void
2008 euc2sjis(int *p1, int *p2)
2009 {
2010     unsigned char c1 = *p1 & 0x7f;
2011     unsigned char c2 = *p2 & 0x7f;
2012     int rowoff = c1 < 0x5f ? 0x70 : 0xb0;
2013     int celoff = c1 % 2 ? (c2 > 0x5f ? 0x20 : 0x1f) : 0x7e;
2014     *p1 = ((c1 + 1) >> 1) + rowoff;
2015     *p2 += celoff - 0x80;
2016 }
2017
2018 void
2019 sjis2euc(int *p1, int *p2)
2020 {
2021     unsigned char c1 = *p1;
2022     unsigned char c2 = *p2;
2023     int adjust = c2 < 0x9f;
2024     int rowoff = c1 < 0xa0 ? 0x70 : 0xb0;
2025     int celoff = adjust ? (c2 > 0x7f ? 0x20 : 0x1f) : 0x7e;
2026     *p1 = ((c1 - rowoff) << 1) - adjust;
2027     *p2 -= celoff;
2028
2029     *p1 |= 0x80;
2030     *p2 |= 0x80;
2031 }
2032
2033 static int
2034 hex2int(int c)
2035 {
2036     switch (c) {
2037     case '0': case '1': case '2': case '3': case '4':
2038     case '5': case '6': case '7': case '8': case '9':
2039         return c - '0';
2040
2041     case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
2042         return c - 'a' + 10;
2043
2044     case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
2045         return c - 'A' + 10;
2046     default:
2047         return -1;
2048     }
2049 }
2050
2051 static int
2052 int2hex(int c)
2053 {
2054     switch (c) {
2055     case 0: case 1: case 2: case 3: case 4:
2056     case 5: case 6: case 7: case 8: case 9:
2057         return c + '0';
2058
2059     case 10: case 11: case 12: case 13: case 14: case 15:
2060         return c + 'a' - 10;
2061
2062     default:
2063         return -1;
2064     }
2065 }
2066
2067 int
2068 cap_to_sjis(char *dst, const char *src, size_t dstsize)
2069 {
2070     int i, j;
2071     size_t len = strlen(src);
2072     int a, b;
2073
2074     for (i = j = 0; i < len && i < dstsize; i++) {
2075         if (src[i] != ':') {
2076             dst[j++] = src[i];
2077             continue;
2078         }
2079
2080         i++;
2081         a = hex2int((unsigned char)src[i]);
2082         b = hex2int((unsigned char)src[i+1]);
2083
2084         if (a == -1 || b == -1) {
2085             /* leave as it */
2086             dst[j++] = ':';
2087             strncpy(dst+j, src+i, dstsize-j);
2088             dst[dstsize-1] = 0;
2089             return strlen(dst);
2090         }
2091
2092         i++;
2093
2094         dst[j++] = a * 16 + b;
2095     }
2096     dst[j] = 0;
2097     return j;
2098 }
2099
2100 int
2101 sjis_to_cap(char *dst, const char *src, size_t dstsize)
2102 {
2103     int i, j;
2104     size_t len = strlen(src);
2105     int a, b;
2106
2107     for (i = j = 0; i < len && i < dstsize; i++) {
2108         if (src[i] == ':') {
2109             strncpy(dst+j, ":3a", dstsize-j);
2110             dst[dstsize-1] = 0;
2111             j = strlen(dst);
2112             continue;
2113         }
2114         if (isprint(src[i])) {
2115             dst[j++] = src[i];
2116             continue;
2117         }
2118
2119         if (j + 3 >= dstsize) {
2120             dst[j] = 0;
2121             return j;
2122         }
2123
2124         a = int2hex((unsigned char)src[i] / 16);
2125         b = int2hex((unsigned char)src[i] % 16);
2126
2127         dst[j++] = ':';
2128         dst[j++] = a;
2129         dst[j++] = b;
2130     }
2131     dst[j] = 0;
2132     return j;
2133 }
2134 #endif /* MULTIBYTE_FILENAME */