From: Olyutorskii <olyutorskii@users.osdn.me>
Date: Tue, 24 May 2011 04:32:42 +0000 (+0900)
Subject: ゼロチョップモード追加
X-Git-Tag: fromMercurial~70
X-Git-Url: http://git.osdn.net/view?p=mikutoga%2FTogaGem.git;a=commitdiff_plain;h=d50ab7b6950537c1b0c282bda4d18fa3b8c311fb

ゼロチョップモード追加
---

diff --git a/src/main/java/jp/sourceforge/mikutoga/parser/TextDecoder.java b/src/main/java/jp/sourceforge/mikutoga/parser/TextDecoder.java
index 08f3821..0b8994e 100644
--- a/src/main/java/jp/sourceforge/mikutoga/parser/TextDecoder.java
+++ b/src/main/java/jp/sourceforge/mikutoga/parser/TextDecoder.java
@@ -17,6 +17,14 @@ import java.nio.charset.CodingErrorAction;
 
 /**
  * æå­ãã³ã¼ãã¼ã
+ * <p>ãããããé·ããæ¢ç¥ã§ãããã¤ãåãMMDå¥åã½ã¼ã¹ããèª­ã¿åãã
+ * ãã³ã¼ãã£ã³ã°çµæãè¿ãã
+ * <p>ãã³ã¼ãå¯¾è±¡ã®ãã¤ãåãå¨ã¦ã¡ã¢ãªä¸ã«å±éãããã®ã§ã
+ * å·¨å¤§ãªãã­ã¹ãã®ãã³ã¼ãã«ã¯ä¸é©å½ã
+ * <p>å¥åãã¤ãå¤0x00ä»¥éããã³ã¼ãã£ã³ã°ã®å¯¾è±¡ããå¤ã
+ * ãã¼ã­ãã§ããã¢ã¼ãããåããã
+ * ããã©ã«ãã§ã¯ã¼ã­ãã§ããã¢ã¼ãã¯ãªãã
+ * ã¼ã­ãã§ããã¢ã¼ãã¯UTF16ãªã©ã®ãã³ã¼ãã£ã³ã°æã«ä½¿ã£ã¦ãæå³ãç¡ãã
  */
 public class TextDecoder {
 
@@ -29,6 +37,8 @@ public class TextDecoder {
 
     private final CharsetDecoder decoder;
 
+    private boolean chopZero = false;
+
     private byte[] byteArray;
     private ByteBuffer byteBuffer;  // byteArrayã®å¥ãã¥ã¼
     private CharBuffer charBuffer;
@@ -48,7 +58,7 @@ public class TextDecoder {
      * ã³ã³ã¹ãã©ã¯ã¿ã
      * @param decoder ãã³ã¼ã
      */
-    protected TextDecoder(CharsetDecoder decoder){
+    public TextDecoder(CharsetDecoder decoder){
         super();
         this.decoder = decoder;
         this.decoder.onMalformedInput(CodingErrorAction.REPORT);
@@ -82,10 +92,50 @@ public class TextDecoder {
     }
 
     /**
+     * ã¼ã­ãã§ããã¢ã¼ããè¨­å®ããã
+     * ã¼ã­ãã§ããã¢ã¼ãããªã³ã«ããã¨ã
+     * å¥åãã¤ãå¤0x00ä»¥éã¯ãã³ã¼ãå¯¾è±¡å¤ã¨ãªãã
+     * @param chop trueãªãã¼ã­ãã§ããã¢ã¼ããªã³
+     */
+    public void setZeroChopMode(boolean chop){
+        this.chopZero = chop;
+        return;
+    }
+
+    /**
+     * ã¼ã­ãã§ããã¢ã¼ããå¦ãå¤å®ããã
+     * @return ã¼ã­ãã§ããã¢ã¼ããªãtrue
+     */
+    public boolean isZeroChopMode(){
+        return this.chopZero;
+    }
+
+    /**
+     * å¥åãã¤ãåã®ãã¤ãå¤'0'åºç¾ä»¥éããã§ããããã
+     * ã¼ã­ãã§ããã¢ã¼ãã§ãªããã°ä½ãããªãã
+     */
+    protected void chopZeroTermed(){
+        if( ! this.chopZero ) return;
+
+        int limit = this.byteBuffer.limit();
+
+        for(int idx = 0; idx < limit; idx++){
+            byte bVal = this.byteArray[idx];
+            if(bVal == 0x00){
+                this.byteBuffer.limit(idx);
+                break;
+            }
+        }
+
+        return;
+    }
+
+    /**
      * ãã¤ãåãèª­ã¿è¾¼ã¿æå­åã¸ãã³ã¼ãã£ã³ã°ããã
      * @param source å¥åã½ã¼ã¹
      * @param byteSize èª­ã¿è¾¼ã¿ãã¤ããµã¤ãº
-     * @return æå­ã¸ã®ãã³ã¼ãçµæã
+     * @return åé¨ã«ä¿æããããã³ã¼ãçµæã
+     * æ¬¡åå¼ã³åºãã¾ã§ã«çµæã®é©åãªã³ãã¼ããªãããªããã°ãªããªãã
      * @throws MmdEofException æå³ããªããã¡ã¤ã«æ«ç«¯
      * @throws MmdFormatException çç¾ãããã¤ãã·ã¼ã±ã³ã¹
      * ãããã¯æªå®ç¾©æå­
@@ -97,6 +147,7 @@ public class TextDecoder {
 
         source.parseByteArray(this.byteArray, 0, byteSize);
         this.byteBuffer.rewind().limit(byteSize);
+        chopZeroTermed();
 
         this.charBuffer.clear();
 
@@ -104,8 +155,13 @@ public class TextDecoder {
         CoderResult decResult =
                 this.decoder.decode(this.byteBuffer, this.charBuffer, true);
         if(decResult.isError()){
-            throw new MmdFormatException("illegal character encoding",
-                                         source.getPosition() );
+            if(decResult.isUnmappable()){
+                throw new MmdFormatException("unmapped character",
+                                             source.getPosition() );
+            }else{
+                throw new MmdFormatException("illegal character encoding",
+                                             source.getPosition() );
+            }
         }else if(decResult.isOverflow()){
             assert false;
         }
diff --git a/src/test/java/jp/sourceforge/mikutoga/parser/TextDecoderTest.java b/src/test/java/jp/sourceforge/mikutoga/parser/TextDecoderTest.java
index 4ad63d2..da4709a 100644
--- a/src/test/java/jp/sourceforge/mikutoga/parser/TextDecoderTest.java
+++ b/src/test/java/jp/sourceforge/mikutoga/parser/TextDecoderTest.java
@@ -103,11 +103,32 @@ public class TextDecoderTest {
     }
 
     /**
+     * Test of setChopMode, getChopMode method, of class TextDecoder.
+     */
+    @Test
+    public void testChopMode() throws Exception {
+        System.out.println("chopMode");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_WIN31J);
+        assertFalse(decoder.isZeroChopMode());
+
+        decoder.setZeroChopMode(true);
+        assertTrue(decoder.isZeroChopMode());
+
+        decoder.setZeroChopMode(false);
+        assertFalse(decoder.isZeroChopMode());
+
+        return;
+    }
+
+    /**
      * Test of parseString method, of class TextDecoder.
      */
     @Test
-    public void testParseString() throws Exception {
-        System.out.println("parseString");
+    public void testParseStringChop() throws Exception {
+        System.out.println("parseString(Chop)");
 
         TextDecoder decoder;
         byte[] bdata;
@@ -116,37 +137,135 @@ public class TextDecoderTest {
         CharBuffer cb;
 
         decoder = new TextDecoder(CS_WIN31J);
+        decoder.setZeroChopMode(true);
 
-        bdata = byteArray("41:42");
-        istream = new ByteArrayInputStream(bdata);
-        source = new MmdSource(istream);
-        cb =decoder.parseString(source, 2);
-        assertEquals("AB", cb.toString());
+        assertDecoded("41:42:00", "AB", decoder);
+        assertDecoded("41:00:42", "A", decoder);
+        assertDecoded("00:41:42", "", decoder);
+        assertDecoded("41:00:88", "A", decoder);
 
+        bdata = byteArray("41:00:42:43");
         istream = new ByteArrayInputStream(bdata);
         source = new MmdSource(istream);
-        cb =decoder.parseString(source, 1);
+        cb =decoder.parseString(source, 3);
         assertEquals("A", cb.toString());
+        cb =decoder.parseString(source, 1);
+        assertEquals("C", cb.toString());
 
-        bdata = byteArray("88:9F");
-        istream = new ByteArrayInputStream(bdata);
-        source = new MmdSource(istream);
-        cb =decoder.parseString(source, 2);
-        assertEquals("äº", cb.toString());
+        return;
+    }
+
+    /**
+     * Test of parseString method, of class TextDecoder.
+     */
+    @Test
+    public void testParseStringWin31J() throws Exception {
+        System.out.println("parseString(Win31J)");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_WIN31J);
+
+        assertDecoded("41:42", "AB", decoder);
+        assertDecoded("41:42", "A", decoder, 1);
+        assertDecoded("88:9F", "äº", decoder);
+        assertDecoded("88:9F:88:A0", "äºå", decoder);
+        assertDecoded("88:9F:41:88:A0", "äºAå", decoder);
+        assertDecoded("00", "\u0000", decoder);
+
+        assertFormatError("88:9F:88:A0", decoder, 3);
+
+
+        byte[] bdata;
+        InputStream istream;
+        MmdSource source;
+        CharBuffer cb;
 
         bdata = byteArray("88:9F:88:A0");
         istream = new ByteArrayInputStream(bdata);
         source = new MmdSource(istream);
-        cb =decoder.parseString(source, 4);
-        assertEquals("äºå", cb.toString());
+        try{
+            cb =decoder.parseString(source, 5);
+            fail();
+        }catch(MmdEofException e){
+            // OK
+        }
+
+        return;
+    }
+
+    /**
+     * Test of parseString method, of class TextDecoder.
+     */
+    @Test
+    public void testParseStringUTF8() throws Exception {
+        System.out.println("parseString(UTF8)");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_UTF8);
 
-        bdata = byteArray("88:9F:41:88:A0");
+        assertDecoded("41:42", "AB", decoder);
+        assertDecoded("41:42", "A", decoder, 1);
+        assertDecoded("E4:BA:9C", "äº", decoder);
+        assertDecoded("E4:BA:9C:E5:94:96", "äºå", decoder);
+        assertDecoded("E4:BA:9C:41:E5:94:96", "äºAå", decoder);
+        assertDecoded("00", "\u0000", decoder);
+        assertDecoded("EF:BF:BF", "\uffff", decoder);
+
+        assertFormatError("E4:BA:9C:E5:94:96", decoder, 5);
+
+
+        byte[] bdata;
+        InputStream istream;
+        MmdSource source;
+        CharBuffer cb;
+
+        bdata = byteArray("E4:BA:9C:E5:94:96");
         istream = new ByteArrayInputStream(bdata);
         source = new MmdSource(istream);
-        cb =decoder.parseString(source, 5);
-        assertEquals("äºAå", cb.toString());
+        try{
+            cb =decoder.parseString(source, 7);
+            fail();
+        }catch(MmdEofException e){
+            // OK
+        }
 
-        bdata = byteArray("88:9F:88:A0");
+        return;
+    }
+
+    /**
+     * Test of parseString method, of class TextDecoder.
+     */
+    @Test
+    public void testParseStringUTF16LE() throws Exception {
+        System.out.println("parseString(UTF16LE)");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_UTF16LE);
+
+        assertDecoded("41:00:42:00", "AB", decoder);
+        assertDecoded("41:00:42:00", "A", decoder, 2);
+        assertDecoded("9C:4E", "äº", decoder);
+        assertDecoded("9C:4E:16:55", "äºå", decoder);
+        assertDecoded("9C:4E:41:00:16:55", "äºAå", decoder);
+        assertDecoded("00:00", "\u0000", decoder);
+        assertDecoded("FF:FF", "\uffff", decoder);
+
+        assertDecoded("60:08", "\u0860", decoder);
+
+        assertDecoded("FF:FE:9C:4E", "\ufeffäº", decoder);
+        // not BOM, ZERO WIDTH NO-BREAK SPACE
+
+        assertFormatError("9C:4E:16:55", decoder, 3);
+
+
+        byte[] bdata;
+        InputStream istream;
+        MmdSource source;
+        CharBuffer cb;
+        bdata = byteArray("9C:4E:16:55");
         istream = new ByteArrayInputStream(bdata);
         source = new MmdSource(istream);
         try{
@@ -156,11 +275,104 @@ public class TextDecoderTest {
             // OK
         }
 
-        bdata = byteArray("88:9F:88:A0");
+        return;
+    }
+
+    /**
+     * Test of Yen(U+00A5) & Backslash(U+005C) encoding, of class TextDecoder.
+     */
+    @Test
+    public void testYenAndBackslash() throws Exception {
+        System.out.println("Yen & Backslash");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_WIN31J);
+        assertDecoded("5C", "\u005c\u005c", decoder);
+
+        decoder = new TextDecoder(CS_UTF8);
+        assertDecoded("5C", "\u005c\u005c", decoder);
+        assertDecoded("C2:A5", "\u00a5", decoder);
+
+        decoder = new TextDecoder(CS_UTF16LE);
+        assertDecoded("5C:00", "\u005c\u005c", decoder);
+        assertDecoded("A5:00", "\u00a5", decoder);
+
+        return;
+    }
+
+    /**
+     * Test of unmapped char, of class TextDecoder.
+     */
+    @Test
+    public void testUnmapChar() throws Exception {
+        System.out.println("unmap char");
+
+        TextDecoder decoder;
+
+        decoder = new TextDecoder(CS_WIN31J);
+        assertFormatError("FF:FF", decoder, 2);
+
+
+        // Unicode2.0ã®æç¹ã§U+0860ã¯æªå®ç¾©æå­
+
+        decoder = new TextDecoder(CS_UTF8);
+        assertFormatError("FF:FF:FF", decoder, 3);
+        assertDecoded("E0:A1:A0", "\u0860", decoder);
+
+        decoder = new TextDecoder(CS_UTF16LE);
+        assertDecoded("60:08", "\u0860", decoder);
+
+        return;
+    }
+
+    public void assertDecoded(String bin, String desired,
+                                TextDecoder decoder)
+            throws Exception{
+        byte[] bdata = byteArray(bin);
+        assertDecoded(bin, desired, decoder, bdata.length);
+        return;
+    }
+
+    public void assertDecoded(String bin, String desired,
+                                TextDecoder decoder, int len)
+            throws Exception{
+        byte[] bdata;
+        InputStream istream;
+        MmdSource source;
+        CharBuffer cb;
+
+        bdata = byteArray(bin);
+        istream = new ByteArrayInputStream(bdata);
+        source = new MmdSource(istream);
+
+        assertDecoded(source, desired, decoder, len);
+
+        return;
+    }
+
+    public void assertDecoded(MmdSource source, String desired,
+                                TextDecoder decoder, int len)
+            throws Exception{
+        CharBuffer cb;
+        cb =decoder.parseString(source, len);
+        assertEquals(desired, cb.toString());
+        return;
+    }
+
+    public void assertFormatError(String bin,
+                                    TextDecoder decoder, int len)
+            throws Exception{
+        byte[] bdata;
+        InputStream istream;
+        MmdSource source;
+
+        bdata = byteArray(bin);
         istream = new ByteArrayInputStream(bdata);
         source = new MmdSource(istream);
+
         try{
-            cb =decoder.parseString(source, 3);
+            decoder.parseString(source, len);
             fail();
         }catch(MmdFormatException e){
             // OK