본문 바로가기
  • 이 바람과 먼지의 세상, 그 길 위에 서서
이 풍진 세상에 /가겨 찻집

[574돌 한글날] 한글 ‘11,172’ 자

by 낮달2018 2020. 10. 9.
728x90

조합형 한글에서 구현할 수 있는 글자 11,172자

지금은 옛이야기가 된 셈이지만, 한때는 완성형이니 조합형이니 하는 ‘한글 코드’ 얘기가 심심찮았다. 컴퓨터의 한글 코드를 이르는 말이지만, 정작 그 뜻을 제대로 새기는 이는 많지 않은 듯하다. ‘한글 코드’란 쉽게 말하면 컴퓨터를 통한 ‘한글 구현 방식’이다. 한글 코드는 조합형, 완성형, 확장 완성형, 유니코드(Unicode) 등으로 나뉜다.

 

완성형, 조합형 논란도 옛이야기

 

컴퓨터의 메커니즘은 0과 1로 작동한다. 따라서 문자를 표시하기 위해서는 문자마다 일련의 숫자를 할당하여 구분해야 하는데 이를 ‘문자 코드’라 한다. 조합형은 모든 자모(ㄱ, ㄴ, ㅏ, ㅗ…….)에다 숫자를 할당하여 이를 불러와 한글을 구현하는 방식이다. 반면에 완성형은 이미 만들어진 글자(가, 각, 간, 갇, 갈…….)에다 숫자를 할당해서 이를 불러오는 방식이라고 할 수 있다. [관련 글 : 조합형 코드, 한글 이야기(2)]

 

컴퓨터에서 한글을 입력할 때 사용자가 자판을 두드리는 것은 조합형, 완성형의 차이가 따로 없다. 조합형이든 완성형이든 ‘강’을 표현하기 위해서 자판의 ‘ㄱ’, ‘ㅏ’, ‘ㅇ’을 누르는 것은 다르지 않다. 그러나 글자가 구현되는 방식은 질적으로 다르다. 조합형이 누른 자모로 짜 맞춘 ‘강’을 나타내는 데 반해, 완성형은 이미 만들어져 있는 ‘강’이란 글자를 불러와 표현하는 것이다.

 

1995년 윈도 95가 확장 완성형 코드를 채택하기 전까지는 컴퓨터나 완성형을 채택한 휴대폰 등에서는 한글로 ‘똠방각하’를 쓸 수 없었다. ‘똠’이라는 글자가 완성형 2350자 안에 없었기 때문이다.

 

포털 다음(daum)에서 2008년 한글날 이벤트로 공개한 무료 글꼴(폰트)인 ‘다음체’가 일부 한글, ‘똠방각하’나 ‘먄해(미안해)’ 따위를 쓸 수 없었던 것은 이 글꼴이 완성형으로 제작된 폰트였기 때문이다.

 

완성형은 처음 컴퓨터로 한글을 표기할 때 사용 빈도가 높은 2,350개의 문자만을 코드에 반영했다. ‘똠방각하’와 ‘아햏햏’, ‘뷁’ 따위를 쓸 수 없었던 까닭이 여기에 있었다. 이를 보완하기 위해 ‘확장 완성형’을 거쳐 유니코드가 개발되었다. 현재 우리는 ‘유니코드’(Unicode : 컴퓨터에서 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 문자 코드 규약)를 통해 조합형에서 구현할 수 있는 11,172자를 모두 쓸 수 있게 되었다.

 

조합형 한글에서 구현할 수 있는 글자 11172자

 

한편, 조합형은 말 그대로 한글의 자음과 모음을 각각 조합하여(맞추어서) 한글을 표현하는 방식이다. 이는 두말할 것도 없이 한글의 구성 원리를 따르는 방식이다. 한글은 '가능한 모든 소리를 적을 수 있는', 가장 뛰어난 문자인데 그것을 가능케 해 주는 한글 입력방식이 조합형이다. 조합형 한글에서 초성, 중성, 종성의 조합(組合)으로 실현할 수 있는 글자는 모두 11,172자이다.

 

조합형 한글에서 실현할 수 있는 글자가 11,172자라는 건 이론상으로 그렇다는 것이지, 11,172자가 모두 쓰이는 것은 아니다. 고어나 없어진 자모(字母)인 ‘아래아(ㆍ)’, ‘반치음(ㅿ)’ 등을 빼고 현대 한국어를 기준으로 글자를 조합하는 방법은 다음과 같다.

 

우리말에서 초성(첫소리)은 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ 등 기본 자음 14자에다 ㄲ, ㄸ, ㅃ, ㅆ, ㅉ 등 된소리 5자를 포함하면 모두 19자다. 가운뎃소리(중성)는 단모음 10개(ㅏ, ㅓ, ㅗ, ㅜ, , ㅡ, ㅣ, ㅐ, ㅔ, ㅚ, ㅟ) 복모음 11개(ㅑ, ㅕ, ㅛ, ㅠ, ㅒ, ㅖ, ㅘ, ㅙ, ㅝ, ㅞ, ㅢ) 등 21개다. 이 자모의 합이 우리말 음운 40개다.

 

종성(끝소리)는 기본 자음 14개에다 된소리 2개(ㄲ과 ㅆ, 나머지 ㄸ, ㅃ, ㅉ은 받침으로 쓰지 않음), 그리고 복자음 11개(ㄳ, ㄵ, ㄶ, ㄺ, ㄻ, ㄼ, ㄽ, ㄾ, ㄿ, ㅀ, ㅄ) 등 모두 27개다.

형성할 수 있는 글자 수
(1) 초성 + 중성 : 19 × 21 = 399
(2) 초성 + 중성 + 종성 : 19 × 21 × 27 = 10,773
(3) 399 + 10,773 = 11,172

 

앞서 밝혔듯 이는 이론상의 숫자일 뿐, 이러한 글자가 모두가 실제 쓰인다고 볼 수는 없다. ‘뷁’이나 ‘햏’ 같은 글자가 쓰일 일은 없기 때문이다. 복자음 받침이 쓰이는 글자도 제한되어 있어 ‘앉’은 쓰이지만 ‘읹·갅…’ 등은 쓰이지 않는다.

 

오늘은 574돌 한글날, 코로나19 관계로 행사도 줄고, 사람들은 휴일을 즐기기도 쉽지 않다. 잠깐 확인해 보니 포털에서는 다음, 네이트, 줌 등에서 로마자 로고 대신 ‘한글날’ 관련 이미지를 썼다. 구글도 검색창 위에 지아이에프(gif) 로고를 썼다.

 

네이버는 로고 대신, “사용자와 함께 만드는 최초 글꼴, ‘마루 부리’ 시험판 배포”를 안내하고 있다. 어쨌든 공개글꼴 배포로 한글날을 기념하는 네이버의 노력도 평가할 만하다. 올해는 떨어지는 주기가 아니라서 그런지, 일간지 중에서 한글날 표시를 한 곳은 따로 보이지 않는다.

아침에 국기를 달았다. 국경일마다 아파트 관리실에서 국기 게양을 당부하는 방송이 있었는데, 언제부턴가 없어진 듯하다. 쉬는 날 아침에 방송으로 휴식을 방해하지 않으려는 것일까, 아니면 안내 방송이 민원으로 막힌 것일까.

 

<오마이뉴스>는 한글날 특집으로 우리말 사용 실태를 머리기사로 올렸다. ‘언택트’, ‘더블데믹’, ‘추캉스’ 등 콩글리시와 신조어를 남발하는 종편에 관해 다루는 민주언론시민연합의 기사다. 아닌 게 아니라, 요즘 방송에선 로마자가 별 저항 없이 쓰이는 추세다.

 

특히 ‘곧 이어’ 같은 다음 방영 프로그램을 안내할 때 쓰는 자막을 괄호도 없이 ‘NEXT’로 쓰는 방송이 한둘이 아니다. 설령 99%의 시청자가 그걸 아무렇지 않게 받아들인다고 하더라도 그게 불편하거나 해득하기 어려운 1%가 있는 한, 방송의 로마자 쓰기는 삼가야 할 일이다.

 

 

2020. 10. 9. 574돌 한글날에 낮달

댓글