105. 한글과 조선글 컴퓨터 입력코드

 

뚱보강사 칼럼

105. 한글과 조선글 컴퓨터 입력코드

 

노처녀 미스 홍이 지난밤 꿈 이야기를 한다. "나, 어제 밤에 내 입안에다 손가락을 넣는 꿈을 꾸었는데, 이상하게도 손가락에 손톱이 없는 거야." 그러자 그 말을 엿들은 노총각이 묻는다. "손가락을 입에 넣은 것은 확실해?" "... ..."

 

남북한 사이에 한글입력코드 통일작업이 시급하다. 남북한 간 컴퓨터 한글 입력코드의 배열순서가 상당히 다른데 이는 앞으로 통일 후 남북한 간의 컴퓨터통신에 상당한 혼란을 가져올 수 있다. 남북 간 언어의 이질화 현상은 생각보다도 더 심각한 상황이고, 이는 컴퓨터에서 한글을 구현하는 방식에서도 똑같다.

남한은 자음 배열의 순서가 홑자음 ‘ㄱ’ 다음에 쌍자음인 ‘ㄲ’이 오지만, 북한은 모든 홑자음이 끝난 다음에 ‘ㄲ’ ‘ㄸ’ ‘ㅆ’ ‘ㅉ’과 같은 쌍자음이 온다.

 

즉 북한에서는 홑자음 마지막인 ‘ㅎ’ 다음에 쌍자음이 시작된다. 따라서 북한의 한글 입력코드는 ‘꿈’이 ‘학’ 뒤에 ‘똥’은 오줌 뒤에 오기 때문에 남한과 북한의 컴퓨터 한글입력코드가 다를 수밖에 없다. 통일이 됐을 때의 혼란을 막기 위해서라도 이에 대한 대책이 시급히 마련돼야 한다.

 

한국어정보학회 주최로 지난 1996년 중국 연변에서 열린 ‘Korean 국제학술대회’ 때부터 북한측 실무자와 함께 남북한 한글코드 통일작업을 진행해 왔다. 그러나 차이점이 많아 공동 노력한다는 데는 인식을 같이 했으나 구체적인 대안을 만들어 내지는 못한 상태다. 한국어정보학회는 인간의 글자로서는 가장 많은 소리를 가장 비슷하게 표기할 수 있는 한글의 장점을 컴퓨터에서도 이어가기 위한 노력으로 국문학 분야에서 김충회, 서정수, 홍윤표 교수 등이 중심이 되고, 컴퓨터 출판 분야에서는 이기성, 한규면, 유경희, 진용옥 교수 등이 중심이 되어서 1990년에 설립한 학술 단체다.

 

1996년 8월 남과 북의 한글(조선글) 코드 합의안은 다음과 같았다. 1) 현재 각기 사용하고 있는 2 바이트 완성형과 2 바이트 조합형 부호계는 그대로 둔다. 2) ISO 2022를 따르면서 우리글을 제대로 지원할 수 있는 1 바이트 조합형 부호계를 만들고 우리글 정보 교환용으로 쓰기로 한다. 3) 각 측의 부호계 변환 프로그램은 각기 만들어 쓰기로 한다. 4) 우리글을 좀더 폭넓게 지원할 수 있는 부호계를 지속적으로 공동 연구해 나가기로 한다. 5) 합의된 우리 글자 배열 순서에 따라 ISO 10646-1을 재배열하는 문제와 공동 명칭 문제는 구체적으로 연구 검토하여 제기한다.

 

한국의 2350개 음절만 표현되는 KSC-5601-87 완성형 한글 코드와 1만 1172개 음절이 표현되는 KSC-5601-92 조합형 한글 코드가 바로 2 바이트 완성형과 2 바이트 조합형 부호계에 해당한다. 북한에서는 ‘국규 9566-93’에서 2 바이트 완성형 한글 코드용 완성자를 2개의 수준으로 지정하고 있다. 북한의 1수준은 2420자로 한국의 KSc-5601-87의 2350자보다 70자가 더 많다. 2수준은 1743자로 1수준과 합하여 모두 4163자의 완성자를 지정하고 있다. 그러나 북한의 개인용컴퓨터의 운영체제에서 사용하는 한글 코드는 2바이트 조합형 방식을 택하여 한글 음절 1만 1172자를 전부다 표현해낼 수 있다. 북한의 창덕 워드프로세서도 조합형 한글 코드를 사용한다.

 

9년 뒤 2005년 8월 남과 북, 조선족, 미국교포가 참가한 가운데 중국 하얼빈에서 열린 ‘다국어정보처리 국제학술대회’에서는 남북간 약간의 진일보한 합의가 이루어졌다. 남북한 모두 현대 한글 1만1천172자와 옛 한글까지 모두 표현할 수 있는 코드를 동일하게 표준으로 잡자는 것이다.

 

자음배열이 다를 뿐만 아니라 한글 모음배열에서도 남한과 북한이 서로 다르다. 남한이 ‘ ㅏ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅗ ㅘ ㅙ ㅚ ㅛ ㅜ ㅝ ㅞ ㅟ ㅠ ㅡ ㅢ ㅣ’ 순서인데 반해 북한과 중국은 ‘ ㅏ ㅑ ㅓ ㅕ ㅗ ㅛ ㅜ ㅠ ㅡ ㅣ ㅐ ㅒ ㅔ ㅖ ㅚ ㅟ ㅢ ㅘ ㅝ ㅙ ㅞ’의 순서다. 예를 들면 ‘우유1, 양2, 앵두3’의 3개 단어 배열이 한국의 국어 사전은 ‘앵두3, 양2, 우유1’의 순서로 가나다 배열이 되나, 북한과 중국 사전에서는 ‘양2, 우유1, 앵두3’의 순서로 배열된다.

 

남북한 간의 언어의 이질적인 현상이 심각한 데도 이 문제에 대해 정부는 물론 학자들조차 관심을 많이 기울이지 않는 것이 참기 힘든 일이다. 현대생활은 컴퓨터문서 사용이 일반화된 만큼 자음/모음 배열과 두음법칙, 컴퓨터 자판 부분의 통일이 무엇보다 선행돼야 할 것이다. 당시 컴퓨터 관련, 국어정보학 관련, 출판학 관련 학자들은 리발/이발, 롱구/농구 등 관련학계에서 상이점의 타협이 우선 필요한 ‘통일대사전’ 편찬 작업은 전문가인 국어/국문학자들에게 위임했다.

 

또한 2008년 8월 북경올림픽에서부터 스포츠 중계 용어는 문지기/골키퍼, 구석차기/코너킥, 던지기/드로인, 반칙/파울 등 순수 우리말 용어를 사용하기로 합의하고 귀국했다. 그러나 정치적 여건에 의해 남과 북 학자들의 만남이 중단되고, 북경올림픽의 스포츠 중계는 골키퍼, 코너킥, 드로인, 파울 등으로 중계되고 말았다.

 

한글을 컴퓨터에 입력하는 부호(입력코드) 규격은 1987년에 공업진흥청이 한글 음절 2350자만 표현되는 KS5601-87 규격을 발표하여, 현대 맞춤법에 맞는 1만 1172개의 한글 음절 중 20%인 2350자만 사용 가능하고 8822자는 못쓰게 만들었다. 이에 민간 차원의 ‘컴퓨터에서 한글 살리기 운동’이 5년간 계속(1987년~1992년)되었고 1992년에 공업진흥청에서 한글 음절 글자 1만 1172개가 모두 표현되는 KS5601-92 규격을 추가로 발표하였다(ISO/IEC 2022 Information technology — Character code).

 

2012년 현재 ISO-10646 규격(유니코드 규격)에 의해 한글 음절 1만 1172개를 모두 사용할 수 있으나 일부 IT 기업과 일부 컴퓨터 업체는 아직도 2350자만 사용할 수 있는 규격을 따르고 있다(International Standard ISO/IEC 10646, Information technology —

Universal multiple - octet coded character set). 통신동호회 엠팔, 전자출판연구회, 컴퓨터 전문가, 국어국문학자, 출판/인쇄 학자, 출판계, 인쇄계, 국어정보학자 등 민간의 한글 구명운동으로 1만 1172자를 살려내었으나 미국 애플 회사의 매킨토시 컴퓨터나 일부 폰트 제작업체와 행정전산망은 2350자만 표현이 가능한 규격을 사용한다.

 

정부에서는 수년 전부터 행정전산망 등 정부 부처에서 한글 음절 1만 1172자를 다 사용할 수 있는 유니코드 규격을 따르겠다고 발표는 하고 있으나 막상 현장에서는 아직도 2350자만 표현이 가능한 규격을 따르고 있는 정부 부서가 많다.

 

[참고] <타이포그래피와 한글디자인>, 이기성, 한국학술정보(주)

[참고] 이기성, ‘콘텐츠와 디지털 출판’, 글로벌사이버대학교 강의 노트

[참고] 허정화, ‘남북 한글 입력코드 통일하자’, 디지털타임스 2007/10/9

[참고] 이지은 기자, 주간동아, 2005/11/1. People&People ‘컴퓨터 한글 입력코드 통일 작업’

.

가각가ㄲ.JPG


 


화살표TOP