1. 시작하며 업무 도중 UTF-8 BOM 이슈가 있어 문자열 인코딩 에 이어 BOM 에 대해 공부하고자 한다. 2. 바이트 순서 표시 (BOM) 이란 바이트 순서 표시(Byte Order Mark, BOM)는 유니코드 문자 U+FEFF로, 매직 넘버로서 문서의 가장 앞에 추가하여 텍스트를 읽는 프로그램에 여러 정보를 전달할 수 있다. UTF-16, UTF-32 의 경우 BOM을 사용한다. BOM을 반드시 사용할 필요는 없으며, 사용할 경우 문서의 가장 앞에 등장해야 한다. 일반 에디터에서는 보이지 않고 헥사 에디터를 사용해야 보인다. 3. BOM 사용법 BOM은 문자열 가장 맨 앞 2바이트에 0xFEFF(유니코드로 U+FEFF)로 표기하여 사용한다. 0xFE와 0xFF 중 어떤 문자가 먼저 오는지에 따..
1. 시작하며 회사에서 일하다가 급작스럽게 UTF-8 BOM 이슈를 맞닥뜨리게 되어 문자열 인코딩에 대해 공부하고자 한다. 아래 내용은 학교에서 알려주지 않는 17가지 실무 개발 기술 1장을 내용을 요약한 것이다. 2. 문자열 인코딩(character encoding)이란 문자열 인코딩이란 컴퓨터가 문자를 이해할 수 있도록 일정한 규칙에 따라 2진수로 변환하는 방식이다. ex) 이 때의 규칙이란 ASCII, UTF-8, UTF-16, UTF-32 등이다. 문자 집합(charset)이란 사용할 수 있는 문자들의 집합이다. ex) 유니코드, ISO-8859, ASCII 엄격하게 구분하면 문자열 인코딩은 문자를 코드로 표한하는 방식이고 문자 집합은 사용할 수 있는 문자 집합이다. 그러나 흔히 문자 집합과 문자..