독립 백주년을 맞은 핀란드의 우랄·알타이어학 연구사 한글과 한국어

핀란드가 독립 백주년을 맞았다. 핀란드는 1917년 12월 6일 러시아로부터 독립을 선언했다.

스웨덴 왕국에게 지배를 받던 핀란드는 1809년 스웨덴을 상대로 한 전쟁에서 승리한 러시아의 손에 넘어갔다. 하지만 기존 러시아 제국의 일부로 병합되지 않고 러시아 황제가 대공으로서 다스리는 자치 대공국이 되었다. 그래서 농노제와 전제 정치에 신음하는 기존 러시아 제국과는 차별된 영토로서 19세기 내내 러시아 본토보다 상당한 수준의 자치를 누렸다.

하지만 국민주의의 대두와 러시아 동화 정책에 대한 반발로 독립의 요구가 거세지던 참에 1917년 러시아 혁명으로 러시아 황제 니콜라이 2세가 물러나고 임시 정부가 들어선데 이어 11월에는 볼셰비키 혁명으로 임시 정부까지 무너지자 핀란드는 대공이 사라진 이상 더이상 러시아의 지배를 받을 법적 근거가 없다며 독립을 선언했다.

핀란드 원로원 의장 페르 에빈드 스빈후부드(Pehr Evind Svinhufvud, 1861년~1944년)가 독립 선언서를 낭독했으며 볼셰비키 지도자 블라디미르 레닌을 만나러 러시아 상트페테르부르크에 찾아갔다. 당시 러시아 제국에게 지배를 받던 여러 민족이 일제히 독립을 선언한 가운데 핀란드까지 붙들어둘 여력이 없었던 레닌은 마지못해 핀란드 독립을 승인했다.

잘 알려지지 않았지만 백 년 전에야 독립을 얻어낸 북유럽의 소국 핀란드는 우랄·알타이어학의 종주국으로서 한국어 계통 연구와도 깊이 관련된 역사가 있다.

핀란드어로 쓰인 핀란드의 독립 선언서. 스웨덴어로도 작성되었다.

독립 선언서를 시작하는 Suomen Kansalle '수오멘 칸살레'는 '핀란드 국민에게'를 뜻한다. '핀란드'는 핀란드어로 Suomi '수오미'라고 하고 kansa '칸사'는 '국민'이라는 뜻이다(Finland '핀란드'는 스웨덴어 이름이다). 속격 어미 -n '~의', 향격 어미 -lle '~위에'가 각각 붙은 것인데 Suomi의 속격형은 Suomen '수오멘'으로 어근이 약간 변한다. 핀란드어의 격어미는 한국어의 조사 비슷한 역할을 한다고 볼 수 있다. 하지만 어근과 어미의 경계가 언제나 뚜렷하지는 않아서 라틴어처럼 격변화 형태를 배워야 하는 경우가 많다. 그러니 핀란드어는 한국어와 같은 교착어와 라틴어와 같은 굴절어의 중간 유형이라고 볼 수 있다.

우랄 어족

오늘날 유럽에서 쓰이는 언어는 대부분 인도·유럽어족에 속한다. 터키어, 타타르어를 비롯한 튀르크 제어와 바스크 지방에서 쓰이는 바스크어, 캅카스 산맥 근처에서 쓰이는 여러 소수 언어를 제외하면 유럽의 나머지 비인도·유럽어는 우랄어족에 속한다. 오늘날 국가공용어로 쓰이는 핀란드어와 에스토니아어, 헝가리어가 우랄어족에 포함된다. 핀란드만을 사이에 둔 이웃 핀란드와 에스토니아는 언어도 비슷해서 친근 관계라는 것을 쉽게 알 수 있다. 예를 들어 핀란드어로 1, 2, 3, 4, 5는 yksi '윅시', kaksi '칵시', kolme '콜메', neljä '넬리애', viisi '비시'인데 에스토니아어로는 üks '윅스', kaks '칵스', kolm '콜름', neli '넬리', viis '비스'이다. 서로 알아들을 수 있을만큼 비슷한 것은 아니지만 독일어와 네덜란드어의 차이처럼 조금만 훈련하면 쉽게 배울 수 있는 정도이며 냉전 시대에는 에스토니아에서 핀란드 텔레비전 방송을 통해 핀란드어를 배워서 에스토니아어 화자 가운데는 핀란드어를 알아듣는 이가 많다.

그런데 헝가리어는 겉으로는 핀란드어와 에스토니아어와 별로 비슷해 보이지 않는다. 예를 들어 헝가리어로 1, 2, 3, 4, 5는 egy '에지', kettő/két '케퇴/케트', három '하롬', négy '네지', öt '외트'이다. 하지만 언어학자들은 헝가리어도 핀란드어와 에스토니아어와 친족 관계라는 것을 밝혀냈다. 1을 뜻하는 헝가리어 egy는 핀란드어 yksi나 에스토니아어 üks와는 어원이 다르지만 적어도 2, 3, 4, 5를 뜻하는 말은 세 언어 모두 뿌리가 같다. 어떻게 viisi/viis가 öt와 뿌리가 같다고 할 수 있는 것일까?

헝가리어와 핀란드어, 에스토니아어만 남아있다면 이들의 친족 관계는 밝히기 어려웠을 것이다. 하지만 러시아에서 쓰이는 여러 소수 언어를 통해 그 연결 고리를 추적할 수 있다. 예를 들어 마리어로는 5를 вич vič '비치'라고 하며 코미어로는 вит vit '비트', 한티어로는 вет wet '웨트'라고 하니 viisi/viis와 öt 사이에 보이는 간극을 메울 수 있다.

우랄 제어 수사 비교

2 3 4 5
핀란드어 kaksi '칵시' kolme '콜메' neljä '넬리애' viisi '비시'
에스토니아어 kaks '칵스' kolm '콜름' neli '넬리' viis '비스'
마리어 кок kok '코크' кум kum '쿰' ныл nəl '널' вич vič '비치'
코미어 кык kyk '키크' куим kuim '쿠임' нёль njol’ '뇰' вит vit '비트'
한티어 кӑт kăt '카트' хәԓум xəḷum '헐룸' нил nil '닐' вет wet '웨트'
헝가리어 kettő/két '케퇴/케트' három '하롬' négy '네지' öt '외트'

핀란드어와 헝가리어가 같은 뿌리에서 나왔다는 주장은 17세기 후반에 처음 등장했다. 그 후 학자들은 꾸준한 연구를 통해 스칸디나비아 북부에서 쓰이는 사미어를 비롯하여 당시 러시아 제국에서 쓰인 여러 소수 언어가 이들과 친족 관계라는 것을 밝혀냈다. 19세기에 산스크리트어와 페르시아어, 그리스어, 라틴어가 뿌리가 같다는 것이 밝혀지면서 인도·유럽어족 연구가 각광을 받기 시작할 즈음에 우랄어족은 이미 상당한 연구가 되어있었던 것이다.

우랄어족 분포도(Wikimedia: Nug/Chumwa, CC BY-SA 3.0)

핀란드어와 한국어가 우랄·알타이어족에 속한다고 알고 있는 사람이 많다. 핀란드어는 우랄어족에 속한다. 하지만 1960년대부터 알타이어족이 단일 계통이라는 그전까지의 학설에 의문이 제기되어 오늘날 언어학계에서는 알타이어족을 더이상 확립된 어족으로 취급하지 않는다. 대신 알타이어족에 속하는 어파로 취급되었던 것들이 어족으로 승격되어 튀르크어족·몽골어족·퉁구스어족이라고 불린다. 이처럼 알타이 가설마저 지지를 잃은 오늘날 우랄어족과 알타이어족이 친족 관계라는 우랄·알타이 가설은 언어학계에서 완전히 폐기되었다. 그러니 핀란드어와 한국어는 친족 관계가 아니다.

마티아스 카스트렌

알타이어족이라는 용어와 우랄·알타이 가설은 핀란드의 언어학자 마티아스 카스트렌(Matthias Castrén, 1813년~1852년)이 도입했다. 카스트렌은 알타이어족에 튀르크 제어와 몽골 제어, 퉁구스 제어 뿐만이 아니라 오늘날 기준으로는 우랄어족에 포함되는 핀·우그리아 제어와 사모예드 제어도 포함시켰다.

마티아스 카스트렌

카스트렌은 헬싱키 대학에서 신학 공부를 목적으로 고대 그리스어와 히브리어를 배우다가 핀란드어에 관심을 가지게 되었다. 그는 핀란드어의 뿌리를 찾아 아직 문자가 없는 여러 종족의 언어를 기록하고 연구하기 위해 라플란드와 카렐리아, 시베리아를 돌아다녔다. 1841년에는 핀란드의 언어학자 엘리아스 뢴로트(Elias Lönnrot, 1802년~1884년)와 함께 언어 연구를 위해 우랄 산맥 너머까지 답사를 떠났다. 뢴로트는 주로 카렐리아 지역에서 수집한 시를 바탕으로 핀란드의 국민 서사시라고 불리는 《칼레발라(Kalevala)》를 편찬한 장본인으로 카스트렌은 뢴로트와 같이 여행을 떠나기 전에 《칼레발라》를 핀란드어에서 스웨덴어로 번역하여 출판하기도 했다.

카스트렌은 단순한 유형 비교를 떠나 어휘와 어형 비교를 통해 핀·우그리아 제어와 사모예드 제어, 튀르크 제어, 몽골 제어, 퉁구스 제어(만주·퉁구스어)를 묶어 알타이어족이라고 불렀다. 20세기 초에 핀·우그리아 제어와 사모예드 제어를 묶어 우랄어족으로 부르게 되면서 카스트렌이 말한 알타이어족은 우랄·알타이어족이라고 부르게 되었다.

구스타프 욘 람스테트

핀란드의 언어학자 구스타프 욘 람스테트(Gustaf John Ramstedt, 1873년~1950년)는 학부 시절에 알타이어족에 관심을 가지게 되어 아시아 전역을 누비며 몽골어, 칼미크어, 타타르어 등을 연구했다. 핀란드가 독립한 뒤 1919년부터 1929년까지 일본에 초대 핀란드 공사로 파견되어 일본어를 배웠으며 1924년부터는 수애 유진걸(水涯 柳震杰, 1918년~1950년 납북) 선생으로부터 한국어를 배웠다. 이후에 그는 한국어 연구에 전념하여 1928년에는 〈한국어에 관한 관견(Remarks on the Korean Language)〉라는 논문을 발표하였고 1939년에는 《한국어 문법(A Korean Grammar)》을, 1949년에는 《한국어 어원 연구(Studies in Korean Etymology)》를 펴냈다. 당시 영어로 된 거의 유일한 한국어 문법서였던 《한국어 문법》은 6·25 전쟁 때 유엔군이 한국어를 배우기 위해 활용하기도 했다.

구스타프 욘 람스테트

람스테트는 한국어가 알타이어족에 속하거나 적어도 친족 관계라는 것을 밝히려 노력했다. 다른 학자들은 일본어도 알타이어족에 포함시키려 했으나 람스테트는 일본어가 그다지 알타이어족과 가까운 관계는 아니라고 생각한 듯하다. 《한국어 어원 연구》에서는 한국어와 몽골어, 만주어, 튀르크어 어휘를 비교하며 알타이어 비교 언어학의 토대를 마련했다. 유럽 학자로는 최초로 한국어의 계통을 과학적으로 접근한 람스테트의 연구는 국어학자 이숭녕(李崇寧, 1908년~1994년)을 통해 국내에 소개되어 국내 학계에 큰 영향을 끼쳤다. 그래서 한국에서는 오랫동안 한국어가 알타이어족에 속한다는 것이 정설로 굳게 자리잡았던 것이다.

그동안 교과서에도 한국어가 우랄·알타이어족에 속한다고 알려졌던 것은 북유럽의 소국 핀란드가 배출한 두 거인 카스트렌과 람스테트의 연구 때문인 것이다.

우랄·알타이 가설의 몰락

이른바 우랄·알타이 언어 사이에 유형적으로 유사한 점이 많다는 것은 오래 전부터 알려져왔다. 대체로 접미사 위주의 굴절어이며 모음조화 현상을 보인다. 어순은 대개 주어-목적어-동사(SOV)를 따른다. 문법성(文法性)이 없으며 영어 have에 해당되는 동사가 따로 없다.

하지만 표면적 유사성만으로는 친족 관계를 밝힐 수 없다. 두 언어가 같은 계통이라는 것을 증명하기 위해서는 유형적인 유사성이나 외견상 비슷한 낱말을 제시하는 것에서 그치지 않고 규칙적인 음운 대응을 찾아내어 두 언어의 공통 조어를 재구할 수 있어야 한다. 이것이 비교언어학의 기초가 되는 비교방법(comparative method)이다.

카스트렌과 람스테트는 이처럼 비교방법을 사용하여 우랄·알타이 가설과 알타이어·한국어 동계설을 증명하려고 했다. 뒤를 이은 언어학자들도 이들처럼 알타이 제어를 비교하며 공통 조어를 재구하려 노력했고 뿌리가 같은 낱말을 찾으려 애썼다. 하지만 이른바 알타이 제어 사이에는 기초 어휘마저 심하게 차이가 나서 좀처럼 실마리가 보이지 않았다. 국어학자들도 한국어와 알타이 제어 사이의 관계를 연구하기 위해 힘을 기울였지만 람스테트가 연구한 범위를 벗어나기 어려웠다.

알타이어족에 속한다고 하는 여러 언어의 분포도;
  튀르크어족,   몽골어족,   퉁구스어족,   일본어족,   한국어족,   아이누어족
(Wikimedia: Fobos92, CC BY-SA 3.0)

1960년대부터 언어학자들은 기존의 연구 결과를 비판적으로 접근하면서 알타이 가설과 알타이어·한국어 동계설에 의문을 제기하기 시작했다. 그동안 알타이 제어에서 동근어로 제시되었던 것은 차용어 또는 우연히 표면적으로 비슷한 낱말이며 같은 계통이라는 주장은 뒷받침할 수 없다는 것이었다.

또 람스테트의 《한국어 어원 연구》도 비판을 피하지 못했다. 한자어를 고유어로 잘못 안 것과 같은 기초적인 오류가 발견되었다. 스웨덴의 한국어학자 스타판 로센(Staffan Rosén, 1944년생)은 1979년 람스테트와 그의 제자인 러시아의 알타이어학자 니콜라이(혹은 니콜라스) 포페(Николай/Николас Поппе Nicholas Poppe, 1897년~1991년)가 제시한 한국어 어원 82개 가운데 21개만이 한국어 정보가 오류가 없었고 40여 개는 어형이나 뜻풀이가 크게 잘못되었다는 연구 결과를 발표했다.

계속된 논란 끝에 주요 언어학자들이 알타이 가설을 포기하기 시작했다. 그리하여 오늘날 언어학계에서 알타이어족은 입증되지 않은 가설로 취급된다. 핀란드 알타이어학자 유하 얀후넨(Juha Janhunen, 1952년생)은 대표적인 알타이 가설 비판론자이다. 그는 알타이 제어의 유형적 유사성은 유라시아에서 서로 교류하면서 생겨난 것으로 설명한다. 실제 지리적으로 인접한 계통이 다른 언어 사이에 공통된 특징이 나타나는 현상은 폭넓게 관찰된다. 알타이어족을 부정하는 알타이어학자라고 하면 이상하게 들릴 수 있지만 같은 계통이 아니더라도 수 천 년 동안 서로 이웃하면서 많은 특징을 공유하게 된 여러 언어를 같이 연구한다는 것이다. 얀후넨은 튀르크어와 몽골어, 퉁구스어, 한국어, 일본어의 조상이 모두 오래 전 만주 남부와 한반도 북부 어딘가에서 쓰였던 서로 이웃하는 언어였고 후에 각기 유라시아 전역으로 퍼진 것이라고 주장한다.

아직도 알타이 가설이 사실인지 연구하는 일부 학자들은 알타이어족이 다른 어족에 비해 동근 어휘가 많지 않다는 것을 인정하면서 차용어가 아닌 실제 동근어 목록을 작성하려 힘을 기울이고 있다. 우랄어족까지 끌어들여 우랄·알타이어족이 성립한다는 주장은 주류 언어학계에서 아예 사라졌다. 하지만 그렇다고 해서 핀란드에서 알타이 제어에 대한 관심이 사라진 것은 아니다.

우랄·알타이어학의 종주국

근대 국민 국가로서의 핀란드 정체성이 형성된 데는 다른 유럽 언어와는 전혀 다른 핀란드어가 큰 기여를 했다. 핀란드는 오랫동안 유럽의 변방이었다. 그러다가 13세기 이후 스웨덴의 지배를 통해 비로소 기독교와 문자를 전해받았다. 오랫동안 스웨덴어가 지배층이 쓰는 고급 언어였으며 문자 언어로서는 스웨덴어와 함게 라틴어가 쓰였다. 19세기에 활약한 카스트렌도 우랄어에 대한 연구를 라틴어로 저술할 정도였다. 요즘도 핀란드에서는 라틴어로 뉴스를 정기적으로 들려주는 라디오 방송국이 있다.

유하 얀후넨(Juha Janhunen)을 빼고 여기서 언급한 핀란드인, 즉 페르 에빈드 스빈후부드(Pehr Evind Svinhufvud), 마티아스 카스트렌(Matthias Castrén), 엘리아스 뢴로트(Elias Lönnrot), 구스타프 욘 람스테트(Gustaf John Ramstedt)는 모두 이름이 핀란드어식이 아닌 스웨덴어식이다. 오늘날에도 핀란드 인구 5% 정도가 스웨덴어를 모어로 쓰며 핀란드어와 스웨덴어가 둘 다 공용어로 쓰인다.

19세기에 핀란드 지식인들은 낭만주의와 국민주의 사조의 영향으로 그때까지 하찮은 농민 언어로 여겨지던 핀란드어에 관심을 가지기 시작했다. 이들은 대부분 스웨덴어를 모어로 쓰는 지배 계층에서 나왔지만 핀란드어를 배우고 핀란드어를 집 안팎에서 사용하려 노력했다. 많은 이들은 이름을 핀란드어식으로 바꾸기까지 했다. 이들의 노력으로 핀란드어는 스웨덴어와 동등한 공용어 지위를 얻었다.

핀란드어를 배운 이들에게는 핀란드어가 인도·유럽어족 게르만어파에 속하는 스웨덴어와 전혀 다르다는 것은 너무나도 자명했다. 그래서 핀란드어의 뿌리에 대해 관심이 높았다. 그런데 이웃하는 러시아 제국 곳곳에서 핀란드어와 비슷한 언어가 쓰인다는 것이 알려지자 이들을 연구하기 위해 카스트렌 같은 이들이 나선 것이다. 핀란드어가 단지 핀란드 대공국에서 쓰이는 초라한 언어가 아니라 유라시아에 널리 퍼진 어족에 속한다는 것은 매혹적인 발견이었을 것이다.

헬싱키 대학 주 건물

오늘날 한국어와 핀란드어가 같은 계통이라는 가설은 우랄·알타이 가설과 함께 폐기되었지만 이런 유산으로 인해 핀란드는 우랄어학과 알타이어학의 종주국으로 남아있다. 람스테트는 헬싱키 대학에서 1917년 최초로 '알타이어학' 수석교수가 되었고 1933년에는 최초로 한국어 과목을 개설하였다. 중앙아시아 한인을 연구한 고 고송무(1947년~1993년) 교수는 헬싱키 대학에서 우랄어를 전공한 후 한국학부를 맡기도 했다. 핀란드어와 한국어는 친족 관계가 아니라도 이처럼 깊은 역사적인 인연이 있는 것이다.

카자흐어를 적는 문자를 키릴 문자에서 로마자로 바꾼다

카자흐스탄의 누르술탄 나자르바예프 대통령은 지난 금요일인 10월 26일 카자흐어를 적는 문자를 현재의 키릴 문자에서 로마자로 바꾸도록 하는 내용을 담은 법령을 포고했다(러시아어 원문, 관련 영어 기사). 이 법령에서는 2025년까지 점진적으로 로마자로 교체하는 것을 목표로 이를 감독할 위원회를 구성하도록 했으며 새롭게 쓸 카자흐어 로마자를 다음 대조표와 같이 확정했다.
카자흐어 로마자 전환을 지시한 법령 569호에 첨부된 대조표

소련의 구성 공화국이던 카자흐스탄은 1991년 독립을 선포했다. 독립국가연합을 창설하고 소련 해체를 확정지은 알마아타 협정도 얼마 후 당시 카자흐스탄 수도이던 알마티(옛 이름 알마아타)에서 체결되었다.

카자흐스탄 헌법은 국가 언어(state language)를 카자흐어로 지정하는 동시에 국가 기관과 지방 자치 단체에서는 러시아어를 카자흐어와 함께 동등한 자격으로 쓸 수 있도록 하고 있다. 즉 헌법상으로는 카자흐어가 공용어, 러시아어가 준공용어라고 할 수 있다. 그런데 뒤에서 자세히 알아보겠지만 실제로는 러시아어가 제1공용어 행세를 한다.

카자흐어는 현재 러시아어처럼 키릴 문자로 적는다. 하지만 튀르크어족에 속하는 카자흐어와 인도·유럽어족 슬라브어파에 속하는 러시아어는 계통이 전혀 다를 뿐만 아니라 쓰는 소리도 차이가 많이 난다. 그래서 현행 카자흐어 키릴 문자는 카자흐어에서 쓰는 소리를 모두 나타낼 수 있도록 러시아어 키릴 문자에서는 쓰지 않는 Ә/ә, Ғ/ғ, Қ/қ, Ң/ң, Ө/ө, Ұ/ұ, Ү/ү, Һ/һ, І/і 등 아홉 글자를 추가로 쓴다(이 가운데 І/і는 1918년 철자 개혁 이전에는 러시아어에서도 썼던 글자로 오늘날에도 우크라이나어와 벨라루스어에서는 계속 쓰고 있다). 아울러 러시아어 키릴 문자 가운데 В/в, Ё/ё, Ф/ф, Х/х, Ц/ц, Ч/ч, Щ/щ, Ъ/ъ, Ь/ь, Э/э는 카자흐어 토박이말에서는 쓰지 않고 주로 러시아어에서 들어온 말에 쓰인다. 카자흐어 키릴 문자에 추가된 문자인 Һ/һ 역시 토박이말에서는 쓰지 않고 주로 아랍어와 페르시아어에서 들어온 말에 쓰인다.

튀르크어 문자의 초기 역사

카자흐어처럼 튀르크어족에 속하는 언어로는 터키에서 쓰는 터키어가 대표적이고 중국의 신장위구르자치구에서 쓰는 위구르어도 들 수 있다. 하지만 오늘날 주요 튀르크어 대부분은 옛 러시아 제국과 소련의 지배를 받던 나라에서 쓰인다. 카자흐어를 비롯해 아제르바이잔의 아제르바이잔어와 투르크메니스탄의 투르크멘어, 우즈베키스탄의 우즈베크어, 키르기스스탄의 키르기스어는 모두 튀르크어족에 속하며 각 나라의 공용어로 쓰인다(중앙아시아의 나머지 한 나라인 타지키스탄의 타지크어는 튀르크어가 아니라 페르시아어의 일종이다). 또 러시아 연방의 구성 공화국인 타타르스탄에서 러시아어와 함께 공용어로 쓰이는 타타르어, 현재 러시아가 지배하고 있는 우크라이나의 크림 자치공화국에서 우크라이나어와 러시아어와 함께 공용어로 쓰이는 크림타타르어도 튀르크어족에 속한다.

전해지는 가장 오래된 튀르크어 기록은 8세기경 등장한 돌궐어 비문이다. 돌궐 문자는 당시 중앙아시아 실크로드의 주요 교통어였던 인도·유럽어족 이란어파 언어인 소그드어를 적는 문자에서 따왔다. 돌궐을 멸망시킨 회골(위구르 제국)의 언어를 적기 위해 9세기에서 14세기까지 쓰인 회골 문자도 소그드 문자를 흘려 쓴 것에서 나왔다. 회골 문자는 후에 몽골 전통 문자와 만주 문자의 바탕이 된다. 회골(回鶻)은 오늘날 위구르(Uyghur)라고 부르는 이름의 옛 형태를 음차한 것이므로 이들을 그냥 위구르라고 부르는 경우가 많지만 이들은 구별하는 것이 편리하다. 위구르라는 이름이 가리키는 대상은 시대에 따라 달라졌으므로 역사에 나오는 회골과 오늘날의 위구르는 같은 튀르크족이고 활동 무대가 겹친 것 외에는 그다지 가까운 관계가 아니다. 오늘날의 위구르어는 회골어에서 나온 것이 아닐 뿐만 아니라 튀르크어족 내에서도 완전히 다른 어파에 속한다.

옛 회골과 이름만 같은 오늘날 중국의 신장 위구르 자치구의 위구르어는 페르시아식 아랍 문자로 적는다. 위구르어 뿐만 아니라 약 10세기부터 20세기 초까지 천 년의 세월 동안 튀르크어족에 속하는 언어는 보통 페르시아식 아랍 문자로 적었다. 튀르크족 대부분이 이슬람교와 함께 페르시아 문화를 고급 문화로 받아들이면서 그 문자를 빌려 자신들의 언어도 적기 시작했기 때문이다. 페르시아어도 소그드어처럼 이란어파에 속하는데 7세기 후반 사산조 페르시아가 아랍 이슬람군에게 정복되었기 때문에 약 8세기부터 이전의 팔라비 문자 대신 아랍 문자를 쓰기 시작했다. 그러면서 페르시아어에서 쓰는 소리를 나타내기 위해 원래의 아랍 문자에 자음 글자 네 개를 추가한 것을 페르시아식 아랍 문자라고 부른다. 오늘날에도 중국의 위구르어 외에 이란의 아제르바이잔인들이 쓰는 아제르바이잔어도 아제르바이잔 공화국에서와 달리 페르시아식 아랍 문자를 쓰며 이란과 아프가니스탄의 투르크멘인들이 쓰는 투르크멘어도 투르크메니스탄에서와 달리 페르시아식 아랍 문자를 쓴다.

아랍 문자는 모음을 따로 나타내는 글자가 없기 때문에 모음 표시가 극히 제한적이고 짧은 모음은 철자에서 아예 생략한다. 그러니 모음 소리가 풍부한 튀르크어 발음을 제대로 나타내지 못한다는 한계가 있다. 하지만 이는 거꾸로 보면 특정 방언의 발음에 치우치지 않고 서로 발음 차이가 많이 나는 방언도 같은 문자 언어로 표현할 수 있다는 장점이 있다. 또 튀르크어에서 흔한 페르시아어와 아랍어에서 들어온 말은 단순히 원어 철자를 그대로 쓸 수 있다는 편리함이 있다.

그래서 오스만 튀르크 제국에서 쓰인 오스만 튀르크어와 중앙아시아에서 쓰인 차가타이어 등 20세기 초까지 주요 튀르크어 기록은 대부분 페르시아식 아랍 문자로 남겨졌다. 물론 이 밖에도 시리아 문자, 아르메니아 문자, 히브리 문자, 그리스 문자가 튀르크어를 적는데 응용되기도 했으며 유럽에서는 로마자로 튀르크어를 기록하기도 했다. 14세기 초에 라틴어로 기록된 언어 교재인 《쿠만의 서(Codex Cumanicus)》는 헝가리 등지에서 살던 킵차크 튀르크계 민족인 쿠만인의 언어인 쿠만어를 로마자로 기록하고 있다.

러시아 제국과 소련 치하의 튀르크어

16세기부터 이미 볼가강 유역 타타르스탄의 튀르크족을 지배하기 시작한 러시아 제국은 19세기 대대적인 정복 활동을 통해 캅카스와 중앙아시아로 영토를 크게 확장하면서 이들 지역의 튀르크족도 지배하게 되었다. 1917년 러시아 혁명이 일어나자 이들은 독립을 시도했으나 새로 들어선 볼셰비키 정부의 진압으로 실패했다. 볼셰비키 정부는 치하의 튀르크족이 단결하지 못하도록 이들 지역을 나누어 통치하기 시작했다.

캅카스의 튀르크족 다수 지역은 1918년 이웃 페르시아 아제르바이잔주의 이름을 따서 아제르바이잔 민주 공화국으로서 독립을 선포한 바가 있는데 1920년 볼셰비키 군에게 정복이 된 후에도 아제르바이잔이란 이름을 계속 썼다. 중앙아시아에서는 1920년대에 카자흐스탄과 투르크메니스탄, 우즈베키스탄, 키르기스스탄의 경계가 확정되었다. 이들은 1936년 키르기스스탄을 마지막으로 모두 소비에트 사회주의 공화국의 지위를 얻었다. 1922년 출범한 소련은 형식적으로는 이런 소비에트 사회주의 공화국이 이룬 연방이었다. 물론 소련 시절에는 모스크바의 중앙 정부가 실권을 쥐었기 때문에 이게 별 의미가 없었지만 1991년 소련이 해체되면서 소비에트 사회주의 공화국이 모두 독립국이 되는 결과를 낳았다(여담으로 러시아 제국에게 지배를 받은 역사가 가장 긴 타타르스탄은 소비에트 사회주의 공화국 지위를 얻지 못하고 러시아에 속한 자치공화국에 그쳤기 때문에 1992년 국민투표에서 대다수가 독립을 지지했지만 독립을 얻는데 실패했다). 결국 현재의 중앙아시아 국경은 소련 시절 이 지역을 나누어 다스리려 한 결과이다.

볼셰비키(후에 소련) 정부는 공산주의 교육을 위해 모든 민족에게 각자의 언어로 글을 가르치기 시작했다. 하지만 튀르크어와 페르시아어(타지크어)를 이슬람교의 영향을 상징하는 페르시아식 아랍 문자로 쓰는 것이 못마땅했다. 그래서 1926년 이들을 적기 위해 페르시아식 아랍 문자 대신 로마자를 도입하였다. 그리하여 전통 문자를 쓰던 식자층의 특권은 하루아침에 사라졌고 전통 문자 교육을 주관하던 이슬람교의 영향력도 약화되었다. 이 시기에는 튀르크어와 페르시아어 뿐만이 아니라 아랍 문자로 썼던 체첸어와 인구시어, 아디게어를 비롯하여 몽골 회골 문자와 키릴 문자를 썼던 칼미크어, 키릴 문자를 썼던 압하스어 등 소련의 여러 비슬라브계 언어에 로마자를 도입하였다. 심지어 중국어도 한자 대신 로마자로 쓰는 Latinxua Sin Wenz '라틴화 신원쯔(신문자)'를 도입하기도 했다.

소련에서는 문자 언어의 표준화도 각 지역마다 독립적으로 이루어져 구성 공화국 단위로 카자흐어, 투르크멘어, 우즈베크어, 키르기스어로 나누어졌다. 그러면서 각 지역의 튀르크어 사이의 유사성보다는 차이점이 강조되었다. 예를 들어 우즈베크어는 모음조화가 있는 북쪽 방언이 아니라 페르시아어의 영향으로 모음조화가 사라진 남쪽 방언을 기준으로 표준화하여 다른 튀르크어와 차별화시켰다. 그리하여 로마자의 도입은 범이슬람주의와 범튀르크주의를 동시에 견제하는 역할을 했다. 또 오스만 튀르크 제국을 계승하여 튀르크어권의 맹주가 된 터키 공화국도 견제한다는 의도도 있었을 것이다. 이들은 이때까지 페르시아식 아랍 문자를 쓰고 있었기 때문이다.

하지만 터키 공화국에서도 이미 전통 문자를 버리려는 준비를 하고 있었다. 근대 터키의 아버지로 불리는 초대 대통령 무스타파 케말 아타튀르크는 터키 사회 전반을 개혁하는 일환으로 오스만 제국과 이슬람교의 전통을 상징하는 페르시아식 아랍 문자 대신 서유럽 문화를 상징하는 로마자를 도입할 생각을 하고 있었던 것이다. 그는 1928년 언어학자들을 만나 이 계획을 발표해 이듬해 1월 1일을 기준으로 시행하도록 하는 엄청난 추진력을 보여주었다. 그리하여 터키어를 쓰는 문자가 이처럼 하루아침에 바뀌었다. 이렇게 도입된 터키어 로마자는 소련에서 튀르크어에 쓰인 로마자와는 조금 달랐다. 하지만 어쨌든 전 세계 튀르크어 사용 인구 대부분이 다시 같은 문자권으로 들어온 셈이니 소련 입장에서는 범튀르크주의의 위협이 되살아나는 듯했다.

1920년대에 각 민족의 언어를 포함한 민족 문화의 발전을 장려했던 소련의 정책은 1930년대 스탈린 치하에서 180도 바뀌었다. 민족주의자들은 숙청되었고 소련 전역에서 비러시아인에게도 러시아어를 의무적으로 가르치기 시작했다. 그러면서 1940년을 전후로 소련의 튀르크어를 적는 문자도 로마자 대신 러시아어와 같은 키릴 문자로 대체되었다. 정치적인 계산 외에는 다른 이유가 없었다. 로마자가 도입된지 고작 10여년 만이었다.

로마자를 쓴 1937년도 카자흐스탄 신문 《소치얄드 카자흐스탄(Sotsijaldь Qazaƣьstan》. Ƣ/ƣ, Ꞑ/ꞑ, Ə/ə를 비롯하여 키릴 문자의 연음 부호 Ь/ь 등을 쓴 당시의 독특한 로마자 철자를 확인할 수 있다.

독립 후 다시 로마자로

이런 역사 때문에 튀르크 민족주의자 가운데는 키릴 문자를 탄압의 상징으로 여기고 로마자를 다시 도입하기를 희망하는 이들이 많았다. 그래서 아제르바이잔은 1991년 독립하자마자 공식 문자를 키릴 문자에서 로마자로 바꾸었고 1993년에는 투르크메니스탄도 그 뒤를 따랐다. 아제르바이잔은 성공적으로 단기간에 로마자로 전환했지만 투르크멘어는 2000년까지 로마자 전환을 완료한다는 당초 계획에도 불구하고 아직 키릴 문자를 많이 쓴다.

우크라이나의 크림 자치공화국에서는 1997년 공식적으로 크림타타르어를 로마자로 쓰기 시작했다. 하지만 2014년 러시아가 크림반도를 점령한 후 키릴 문자가 다시 공식적으로 쓰이게 된 것으로 보인다.

우즈베키스탄 정부는 1995년 로마자를 공식적으로 도입했다. 한동안 키릴 문자와 병행하다가 2000년까지 로마자 전용으로 간다는 계획이었다. 하지만 아직도 키릴 문자가 많이 쓰이며 로마자 전용 시점은 2005년으로, 다시 2010년으로 계속 미루어졌다.

카자흐스탄이 독립한 이후 지금까지 계속 대통령으로 있으면서 막강한 권력을 행사하고 있는 누르술탄 나자르바예프는 그동안 이따금 카자흐어는 로마자로 써야 한다는 의견을 피력하면서도 이웃 우즈베키스탄이 로마자 도입에 난항을 겪는 것을 보면서 실행을 계속 미루고 있었다. 하지만 올해 드디어 때가 왔다고 결심한 모양이다. 4월에 그는 학자들에게 2025년까지 키릴 문자를 로마자로 대체하는 것을 목표로 카자흐어 로마자 시안을 주문했다. 지난달 그 시안이 의회에 소개되었고 몇 가지 수정을 거쳐 이번에 확정되었다.

옛 소련의 튀르크계 공화국 가운데 민족적으로나 지리적으로 터키에 가장 가까운 아제르바이잔과 그 정도까지는 아니지만 중앙아시아에서는 그래도 가까운 투르크메니스탄은 비교적 단기간에 로마자를 도입할 수 있었던 반면 러시아계를 비롯한 비튀르크계 주민이 많은 우즈베키스탄과 카자흐스탄이 키릴 문자를 버리는데 어려움을 겪는 것은 절대 우연이 아닐 것이다.

한편 러시아의 타타르스탄에서는 타타르어를 공식적인 용도로 키릴 문자 외에 로마자나 페르시아식 아랍 문자 등 다른 문자로 쓰는 것이 법으로 금지되어 있다. 1999년 타타르스탄 공화국 정부는 2001년 도입을 목표로 로마자 철자법을 확정지었지만 러시아 연방 정부가 제동을 걸었다. 그래서 타타르어는 비공식적으로만 로마자로 쓴다.

주요 튀르크어 로마자 대조표
터키어아제르바이잔어투르크멘어크림타타르어타타르어우즈베크어카자흐어IPA
A aA aA aA aA aO o
/ɒ/
A a/ɑ/
-Ə əÄ ä-Ä äA aAʼ aʼ/æ/
B bB bB bB bB bB bB b/b/
C cC cJ jC cC cJ j-/ʤ/
J jJ jŽ žJ jJ jJ j/ʒ/
Ç çÇ çÇ çÇ çÇ çCH chCʼ cʼ/ʧ/
D dD dD dD dD dD dD d/d/
E eE eE eE eE eE eE e/e/
F fF fF fF fF fF fF f/f/ /ɸ/
G gG gG gG gG gG gG g/ɡ/ /ɟ/
Ğ ğĞ ğĞ ğĞ ğGʻ gʻGʼ gʼ/ɣ/ /ʁ/
H hH hH h-H hH hH h/h/
-X xH hX xX x/x/ /χ/
I ıI ıY yI ıI ı-Y y/ɯ/
İ iİ iI iİ iİ iI iI i/i/
K kK kK kK kK kK kK k/k/ /c/
-Q qQ qQ qQ qQ q/q/ /ɢ/
L lL lL lL lL lL lL l/l/
M mM mM mM mM mM mM m/m/
N nN nN nN nN nN nN n/n/
--Ň ňÑ ñÑ ñNG ngNʼ nʼ/ŋ/ /ɴ/
O oO oO oO oO oO oO o/o/
Ö öÖ öÖ öÖ öÖ öOʻ oʻOʼ oʼ/ø/
P pP pP pP pP pP pP p/p/
R rR rR rR rR rR rR r/r/
S sS sS s /θ/S sS sS sS s/s/
Ş şŞ şŞ şŞ şŞ şSH shSʼ sʼ/ʃ/
T tT tT tT tT tT tT t/t/
U uU uU uU uU uU uU u/u/
Ü üÜ üÜ üÜ üÜ ü-Uʼ uʼ/y/
V vV vW wV vV vV vV v/v/ /β/
----W wYʼ yʼ/w/
Y yY yÝ ýY yY yY yIʼ iʼ/j/
Z zZ zZ z
/ð/
Z zZ zZ zZ z/z/

로마자 표기안 분석

보통 로마자라고 하면 영어에서 쓰는 기본 로마자 스물여섯 자를 떠오른다. 그런데 언어마다 의미가 구별되는 소리의 단위, 즉 음소의 개수가 다르니 이들을 로마자에서 쓰는 글자와 일 대 일로 대응시키기는 어렵다. 그래서 한 글자가 여러 소리를 나타내기도 하고 여러 글자의 조합으로 한 소리를 나타내기도 한다.

잘 알려진 것처럼 영어는 글자와 소리와의 관계가 매우 복잡하니 논외로 하고 글자와 소리의 대응이 훨씬 더 규칙적인 에스파냐어의 예를 들더라도 한 글자로 나타내기 곤란한 글자를 CH/ch, LL/ll처럼 두 글자의 조합으로 나타내기도 하고 Ñ/ñ처럼 기본 글자에 부호를 더해서 나타내기도 한다. 아이슬란드어의 Ð/ð, Þ/þ, Æ/æ처럼 아예 새로운 글자를 추가한 경우도 있다. 따지고 보면 영어에서 쓰는 J/j, W/w도 중세에 도입된 새 글자이며 U/u와 V/v의 구별도 중세에 도입된 것이다.

터키어에서는 기본 로마자에 자음 글자 Ç/ç, Ğ/ğ, Ş/ş와 모음 글자 Ö/ö, Ü/ü를 추가하였으며 소문자에도 점이 없는 I/ı와 대문자에도 점이 있는 İ/i를 구별한다. 그래서 대체로 한 소리는 한 글자로 나타낸다(대신 차용어에서 나타나는 소리 구별을 다 나타내지는 못한다). 이는 Ә/ә, Ç/ç, Ğ/ğ, Ş/ş, Ö/ö, Ü/ü를 쓰는 아제르바이잔어와 Ç/ç, Ä/ä, Ž/ž, Ň/ň, Ö/ö, Ş/ş, Ü/ü, Ý/ý를 쓰는 투르크멘어도 마찬가지이다. 우즈베크어는 기본 글자에 왼쪽 작은따옴표와 같은 모양의 기호를 붙인 Oʻ/oʻ, Gʻ/gʻ만 추가하였다.

터키의 카자흐인들은 카자흐어를 비공식적으로 로마자로 쓸 때 터키어 철자법을 흉내내어 여러 특수 기호를 쓴다. 하지만 이번에 확정된 카자흐어 로마자 철자법은 ç, ğ, ş, ö, ü, ı 같은 글자를 전혀 쓰지 않고 아포스트로피(apostrophe, 오른쪽 작은따옴표 같은 모양의 기호)를 붙인 Aʼ/aʼ, Gʼ/gʼ, Iʼ/iʼ, Nʼ/nʼ, Oʼ/oʼ, Sʼ/sʼ, Cʼ/cʼ, Uʼ/uʼ, Yʼ/yʼ를 쓰는 것이 특징이다. 여기서는 유니코드 문자 U+02BC ʼ MODIFIER LETTER APOSTROPHE를 썼는데 현실적으로는 문장 부호로 쓰이는 U+2019 ’ RIGHT SINGLE QUOTATION MARK가 더 입력하기 편해서 더 자주 쓰일 것으로 보인다.

아포스트로피 외에 다른 특수 기호는 전혀 쓰지 않고 W/w와 X/x를 제외한 기본 로마자 스물네 자만 활용한다는 점에서 카자흐어 키릴 문자가 러시아어에서 쓰지 않는 글자를 아홉 자나 추가해서 쓰는 것과 대조적이다. 기본 로마자와 아포스트로피만 쓰면 특수 기호를 입력하기 위한 키보드나 글꼴 지원 같은 문제는 없다. 카자흐어 로마자 전환을 추진하면서 입력이 불편한 특수 기호를 쓰지 않는 것을 기본 방침으로 삼은 것으로 보인다. 대신 다른 튀르크어 로마자와 상당한 차이가 나며 글자와 발음의 관계를 짐작하기 어렵다는 불편함이 있다.

카자흐어 문자 대조표
키릴 문자로마자아랍 문자음소
А аA aا‎/ɑ/
Ә әAʼ aʼٵ‎/æ/
Б бB bب‎/b/
В вV vۆ‎/v/
Г гG gگ‎/ɡ/
Ғ ғGʼ gʼع‎/ʁ/
Д дD dد‎/d/
Е еE eە‎/e/, /je/
Ё ёيو‎/jo/
Ж жJ jج‎/ʒ/, /ʐ/
З зZ zز‎/z/
И иIʼ iʼٸ‎/əj/, /ɪj/
Й йIʼ iʼي‎/j/
К кK kك‎/k/
Қ қQ qق‎/q/
Л лL lل‎/ɫ/, /l/
М мM mم‎/m/
Н нN nن‎/n/
Ң ңNʼ nʼڭ‎/ŋ/
О оO oو‎/o/, /wo/
Ө өOʼ oʼٶ‎/œ/, /wœ/
П пP pپ‎/p/
Р рR rر‎/ɾ/
С сS sس‎/s/
Т тT tت‎/t/
У уYʼ yʼۋ‎/w/, /ʊw/, /ʉw/
Ұ ұU uۇ‎/ʊ/
Ү үUʼ uʼٷ‎/ʉ/
Ф фF fف‎/f/
Х хH hح‎/χ/
Һ һH hھ‎/h/
Ц цتس‎/ʦ/
Ч чCʼ cʼچ‎/ʨ/
Ш шSʼ sʼش‎/ʃ/, /ʂ/
Щ щشش‎/ɕː/
Ъ ъ
Ы ыY yى‎/ə/
І іI iٸ‎/ɪ/
Ь ь
Э эە‎/e/
Ю юيۋ‎/jʉw/, /jʊw/
Я яيا‎/jɑ/

지난달 발표된 첫 시안에서는 아포스트로피마저 쓰지 않았다. 대신 두 글자의 조합을 쓰는 전략을 썼다. aʼ, gʼ, nʼ, oʼ, sʼ, cʼ, uʼ는 각각 ae, gh, ng, oe, sh, ch, ue로 적었고 yʼ는 w로 적었으며 최종안에서 iʼ로 적는 음의 일부는 j로, 일부는 i로 적었다.

그런데 이렇게 쓰면 모호한 경우가 발생한다는 지적이 일었다. 예브게니 드로뱌스코(Евгений Дробязко Yegeniy Drobyazko)라는 페이스북 사용자는 асхана '아스하나'와 намазхана '나마즈하나'를 각각 ashana, namazhana로 쓰면 *ашана '아샤나', *намажана '나마자나'인 것으로 오해할 수 있다고 지적했다(원문). 최종안에서는 ш와 ж를 각각 sʼ와 j로 적으니 이런 혼동이 일어날 여지가 없다.

또 키릴 문자의 У/у를 W/w로 적기로 한 것도 논란이 되었다. 키릴 문자 у는 카자흐어의 반모음 /w/를 나타내기도 하지만 /ʊw/, /ʉw/, /əw/, /ɪw/ 등 모음 음소와 /w/의 조합이 [u]로 발음되는 것을 나타내기도 하며 러시아어에서 들어온 차용어에서도 원어의 /u/에 해당하는 음을 나타낸다. 그래서 카자흐스탄에서 남자 이름으로 흔히 쓰이는 Тимур '티무르'는 첫 시안을 따르면 Timwr로 적어야 했다. 마치 영국 웨일스에서 쓰이는 웨일스어 같다는 평도 나왔다. 웨일스어에서는 w가 자음 /w/ 외에 모음 /ʊ/, /uː/도 나타내며 웨일스어 지명에 많이 등장하는 cwm [kʊm] '쿰'을 예로 들 수 있다. 하지만 영국 밖에서는 잘 알려지지 않은 언어라서 대부분의 사람들에게는 w를 모음으로 쓰는 것이 어이없어 보인다.

그래서 최종안에서는 w 대신 yʼ를 썼는데 이것도 [w], [u]를 나타내는 글자로 쓰는 것이 어색한 것이 사실이다. '티무르'는 Timyʼr가 되고 카자흐어 여자 이름 Аяулым '아야울름'은 Aiʼayʼlym이 된다. 키릴 문자의 Ы/ы는 양 로마자 표기안에서 Y/y로 옮기며 중설 비원순 중모음 /ə/를 나타내는데 다른 튀르크어의 후설 비원순 고모음 /ɯ/, 즉 '으'의 소리에 대응되며 실제 이 기호를 쓰기도 할 정도로 발음도 비슷하다. 그러니 이 기호를 고른 의도를 짐작하자면 '으'는 y로 적으니 이와 비슷한 음인 '우'는 yʼ로 적은 것으로 이해할 수 있겠다.

하지만 꼭 이렇게 정해야만 했을까? u /ʊ/와 uʼ /ʉ/는 이미 다른 음을 나타내니 어쩔 수 없더라도 예를 들어 /w/ 발음에는 w를 쓰고 [u]는 원형을 밝혀 uw, uʼw, yw, iw 등으로 쓰든지 uw로 통일하는 방식은 고려되었는지 모르겠다.

그러나 이미 키릴 문자에서 у가 [w]와 [u]를 둘 다 나타내는 글자로 쓰였기 때문에 이를 분리시키는 것은 어렵다고 보았을 것이다. 첫 시안이나 최종안이나 키릴 문자로 쓴 카자흐어 문서를 단순 변환을 통해 로마자로 바꿀 수 있도록 했다. 만약 원래의 у를 w와 uw로 나눈다면 단순 변환이 불가능하다. 러시아어에는 /w/가 없으므로 러시아어용 키릴 문자에는 /w/를 나타내는 글자가 따로 없어서 카자흐어를 키릴 문자로 적을 때 [w]와 [u]를 한 글자로 나타낸 것이 끝까지 자연스러운 로마자 표기를 방해하고 있는 셈이다.

그런데 로마자로 바꾸면서 키릴 문자에서 나타내던 구별 가운데 사라지는 것도 있다. 예를 들어 키릴 문자에서 І/і는 모음 /ɪ/, Й/й는 반모음 /j/를 나타내며 И/и는 /əj/, /ɪj/ 등 모음 음소와 /j/의 조합이 [i]로 발음되는 것과 러시아어에서 들어온 차용어에서 원어의 /i/에 해당하는 음을 나타낸다.

첫 시안에서는 й를 j로 적고 і와 и는 i로 합쳤다(첫 시안에서는 Ж/ж를 J/j 대신 ZH/zh로 썼다). 반면 최종안에서는 키릴 문자의 і만 i로 적고 и와 й는 iʼ로 합쳤다. 즉 키릴 문자에서 세 글자로 나눠 쓰던 음이 로마자로 옮기면서 두 글자로 나눠 적게 된 것이다. 그 조합은 안마다 달라졌지만.

카자흐어 반모음과 고모음 표기 대조표

키릴 문자로마자 첫 시안로마자 최종안발음음소 분석
Й йJ jIʼ iʼ[j]/j/
И иI i[i]/əj/, /ɪj/
І іI i[ɪ]/ɪ/
Ы ыY yY y[ə]/ə/
У уW wYʼ yʼ[w]/w/
[u]/ʊw/, /ʉw/
Ұ ұU uU u[ʊ]/ʊ/
Ү үUE ueUʼ uʼ[ʉ]/ʉ/

이 밖에 러시아어와 페르시아어, 아랍어계 차용어에 나타나는 무성 구개수 마찰음 /χ/와 페르시아어와 아랍어계 차용어에서 나타나는 성문음 /h/는 키릴 문자에서 각각 Х/х, Һ/һ로 나누어 썼지만 로마자로는 H/h로 합친다. 그렇게 아포스트로피를 남발할 것이면 둘 가운데 하나는 hʼ로 써서 구별하는 것이 어떨까 하는 생각도 들지만 둘 다 어차피 차용어에만 쓰는 음이라서 그다지 구별할 필요가 없다고 본 것일 수 있겠다.

최종안에서 C/c는 단독으로 쓰이지 않고 한국어의 'ㅊ' 비슷한 파찰음 /ʨ/를 나타내는 Cʼ/cʼ에만 쓰인다. c만 따로 쓰지 않을 것이면 구태여 아포스트로피를 붙일 필요가 있을까 하는 지적도 있다. 혹시라도 카자흐어에서 쓰지 않는 음인 러시아어의 Ц/ц /ʦ/를 C/c로 나타내려는 것이 아닐지 지켜봐야 하겠다. 그렇다면 카자흐어에서는 쓰지 않는 음이라서 법령과 함께 발표된 대조표에서는 생략되었을 것이다.

아포스트로피가 많아 보기 흉하다고 하는 의견도 있지만 카자흐어 음을 표현하는데 지장이 없다면 상관이 없을 텐데 반모음 /w/, /y/를 각각 yʼ, iʼ로 적는 것은 아무래도 적응하기 힘들 것 같다. '시간'을 뜻하는 카자흐어 уақыт '와크트'는 로마자 표기는 yʼaqyt가 되고 '뿔'을 뜻하는 мүйіз '뮈이즈'의 로마자 표기는 muʼiʼiz가 된다. 또 《위키백과(Wikipedia)》의 카자흐어 이름 Уикипедия '위키페디야'는 Yʼiʼkiʼpediʼiʼa가 된다. и를 뒤따르는 я를 어떻게 처리하느냐에 따라 Yʼiʼkiʼpediʼa가 될 수도 있겠다. 만약 다른 튀르크어와 비슷한 로마자 표기 방식을 따랐다면 각각 waqıt, müyiz, Wïkïpedïya 정도로 적었을 것이다.

카자흐스탄의 언어 사정

카자흐스탄의 국가공용어를 표기하는 문자를 바꾸는 것이 실질적으로 어떤 영향이 있을 것인지, 카자흐스탄인들의 반응은 어떨지 예측하려면 먼저 카자흐스탄의 언어 사정부터 살펴봐야 한다. 단순히 국가공용어가 카자흐어라고 해서 카자흐스탄의 언어 생활이 카자흐어를 중심으로 이루어질 것이라고 생각한다면 큰 오해이다.

카자흐스탄에서는 1920년대와 1930년대 대규모 기근으로 인해 카자흐계 주민이 급감했다. 그래서 1939년 통계에서는 놀랍게도 카자흐스탄 주민의 40.2%가 러시아계로 38.0%에 그친 카자흐계를 앞질렀다. 소련은 카자흐스탄에 반체제 인사를 보내기도 하고 폴란드인, 고려인, 라트비아인, 에스토니아인, 루마니아인, 독일인, 크림타타르인, 체첸인, 칼미크인 등 여러 민족을 강제 이주시키기도 했다.

그래서 1970년대까지는 카자흐스탄 최대 민족은 러시아인이었으며 독립 직전인 1989년까지도 카자흐계가 39.7%, 러시아계가 37.4%로 대등했다. 하지만 독립 이후 러시아계 주민들은 러시아로 대거 떠나가고 높은 출산율로 카자흐계 주민 비율이 증가하였다. 그래서 2014년 통계에 의하면 카자흐계 주민이 65.5%로 21.5%에 그친 러시아계 주민을 크게 앞질렀다. 카자흐스탄은 이 밖에도 우즈베크인, 우크라이나인, 위구르인, 타타르인, 독일인, 고려인, 벨라루스인 등의 소수 민족이 있다(인구 통계).

하지만 사용 언어로 따지면 이야기가 조금 다르다. 러시아어를 강요한 소련의 교육 정책의 후유증으로 카자흐계 주민 상당수가 카자흐어 구사 능력이 떨어지며 카자흐스탄의 여러 민족은 서로 의사 소통을 위해 러시아어를 쓴다. 본토에서 멀리 떨어져 여러 세대를 지낸 독일인, 고려인, 벨라루스인 등도 대부분 러시아어를 모어로 쓴다. 그래서 도시 지역에서는 러시아어를 주로 쓰며 특히 아직도 슬라브계 주민이 많은 북쪽은 대부분 러시아어를 쓴다. 또 카자흐계 주민 가운데도 소련 시절에 대한 향수를 느끼는 이들, 특히 장년층일수록 러시아어를 선호하는 편이다.

2009년 통계(PDF 문서)에 의하면 카자흐스탄 인구의 62%가 카자흐어를 모어로 쓰고 74%가 알아들을 수 있다. 러시아어는 카자흐스탄 인구의 23%만이 모어로 쓰는 반면 94%가 알아들을 수 있다. 독립 이후 러시아어 사용 비율은 소폭 하락했지만 아직도 카자흐어보다는 러시아어를 쓰는 비율이 앞서는 것이다. 카자흐스탄의 인터넷 도메인 .kz를 쓰는 웹사이트에서는 2015년 기준으로 84%가 러시아어를 쓰고 13%가 영어, 3%만이 카자흐어를 쓴다(출처). 행정은 명목상의 공용어인 카자흐어보다는 러시아어로 주로 이루어지며 카자흐어 로마자 전환을 포고한 법령조차 러시아어로 작성한 것이 현실이다. 그렇다면 카자흐스탄의 실질적인 제1공용어는 러시아어라고 해도 과언이 아니다.

카자흐어 표기 수단이 키릴 문자에서 로마자로 바뀌더라도 이러한 언어 현실은 쉽게 바뀌지 않을 듯하다. 이는 앞으로 카자흐스탄 고유명사의 한글 표기를 정할 때에도 염두에 두어야 하겠다.

카자흐스탄은 원래 카작스탄

'카자흐스탄'이라는 국호는 러시아어 Казахстан Kazakhstan을 따른 것이다. 카자흐어로는 Қазақстан이며 로마자로는 Qazaqstan이 된다. 카자흐어의 қ/q는 무성 구개수 폐쇄음 [q]를 나타낸다. 무성 연구개 폐쇄음 [k]보다 더 입 뒤에서 발음되는 소리이며 한글로는 'ㅋ'으로 옮길 수 있다. 즉 카자흐어로는 '카작스탄'인 것이다. 국립국어원에서 마련한 적 있는 아랍어 한글 표기 시안에서는 아랍어의 [q]를 [k]와 구별한다며 'ㄲ'으로 적지만 카자흐어의 [q]는 유기음이므로 'ㄲ'보다는 'ㅋ'에 가깝게 들린다. 사실 조음 위치로 구별되는 [k]와 [q]를 조음 방법으로 구별되는 'ㅋ'과 'ㄲ'에 대응시키는 것은 그다지 바람직한 방식이 아니다.

왜 '카작스탄'이 '카자흐스탄'이 되었을까? 카자흐인을 이르는 이름인 Қазақ/Qazaq '카자크'는 중세 중앙아시아에서 누군가의 지배를 벗어나 독립한 사람이나 집단에 흔히 붙여졌다. 그러다가 오늘날 우리가 카자흐인이라고 부르는 민족의 명칭으로 굳어졌다. 하지만 드네프르 강 하류나 돈 강 유역 등 러시아 제국 변경에서 자치를 누린 여러 집단도 러시아어로 Казак Kazak '카자크'(영어로는 Cossack)라고 불렀다. 그래서 17세기 러시아 제국에서는 이들과 구별하기 위해서 중앙아시아의 카자흐인은 끝 소리를 약간 바꿔 Казах Kazakh라고 부른 것이 '카자흐'가 되어 오늘날까지 이어지는 것이다.

카자흐스탄처럼 소련의 일부였던 벨라루스는 독립 이후 영어에서 국호를 러시아어 이름인 Белоруссия Belorussiya에 따라 Belorussia 또는 Byelorussia로 써왔던 것을 벨라루스어 Беларусь Belarus'에 따라 Belarus로 고치게 하는데 성공했다. 또 새 국호의 예전 러시아어 형태인 Белорусь Belorus'에 따라 '벨로루시'라고 쓰던 한국도 벨라루스 정부의 요청으로 '벨라루스'로 바꾸었다(예전 글 참조).

카자흐스탄도 혹시 영어 국호를 Kazakhstan에서 Qazaqstan으로 바꿔달라고 요청할지는 두고 볼 일이다. 현재로서는 가능성이 매우 낮아 보이지만 어쩌면 영어에 그치지 않고 벨라루스처럼 한국어 국호도 '카작스탄'으로 바꿔달라고 요청할지도 모른다. 하지만 카자흐스탄 쪽에서 요청하지 않는 이상 한국어에서 그동안 써왔던 '카자흐', '카자흐스탄'을 굳이 바꿀 필요는 없을 것이다.

국호 외에도 카자흐스탄의 주요 지명은 러시아어 형태를 기준으로 알려져 있다. 옛 수도 '알마티'는 러시아어 Алматы Almaty를 기준으로 한 표기이고 카자흐어 Алматы/Almaty를 기준으로 삼는다면 '알마트'가 된다. 우주 기지로 유명한 '바이코누르'는 러시아어 Байконур Baykonur를 기준으로 한 것인데 카자흐어 이름은 Байқоңыр/Bayqonʼyr '바이콩으르'이다. 둘 다 원래 카자흐어 지명인데 러시아어로 흉내낸 형태가 국제적으로 알려진 예이다. 이들도 괜히 카자흐어 형태를 따른다고 한글 표기를 바꿀 필요는 없겠다.

카자흐스탄 인명의 표기

국제적으로 통용되는 카자흐스탄 인명은 보통 러시아어 형태를 기준으로 한다.

누르술탄 나자르바예프(카자흐스탄 대통령)
통용 로마자 이름: Nursultan Nazarbayev
러시아어 이름: Нурсултан Назарбаев Nursultan Nazarbayev
카자흐어 이름: Нұрсұлтан Назарбаев / Nursultan Nazarbaev

티무르 베크맘베토프(영화감독)
통용 로마자 이름: Timur Bekmambetov
러시아어 이름: Тимур Бекмамбетов Timur Bekmambetov
카자흐어 이름: Темір Бекмамбетoв / Temir Bekmambetov

알리야 유수포바(리듬체조 선수)
통용 로마자 이름: Aliya Yussupova
러시아어 이름: Алия Юсупова Aliya Yusupova
카자흐어 이름: Әлия Жүсіпова / Aʼliʼiʼa (Aʼliʼa) Jusipova

사비나 알틴베코바(배구 선수)
통용 로마자 이름: Sabina Altynbekova
러시아어 이름: Сабина Алтынбекова Sabina Altynbekova
카자흐어 이름: Сабина Алтынбекова / Sabiʼna Altynbekova

카자흐어 인명에서 쓰이는 러시아어에서 온 접미사 -ев/-ev와 -oв/-ov는 원어 발음을 따라 각각 '에프/예프', '오프'로 적으면서 위의 인명을 카자흐어 형태를 기준으로 표기한다면 각각 '누르술탄 나자르바예프', '테미르 베크맘베토프', '앨리야 주시포바', '사비나 알튼베코바'가 된다. '누르술탄 나자르바예프'는 러시아어와 카자흐어 형태를 따른 한글 표기가 동일하지만 나머지 경우는 조금씩 달라진다.

하지만 여전히 국제적으로는 러시아어 형태를 기준으로 한 로마자 표기로 알려져 있으니 한글 표기도 러시아어 형태를 따르는 것이 자연스럽다. 외래어 표기법에서는 카자흐어를 다루지 않지만 러시아어 표기 규정은 있다는 현실적인 고려도 있다.

그렇다고 옛 소련의 튀르크어 인명을 언제나 러시아어 형태를 기준으로 한글로 표기하는 것은 아니다. 2013년 10월 16일 정부·언론 외래어 심의 공동위원회 제111차 회의에서 Rustam Ibrahimbeyov로 통용되는 아제르바이잔 영화감독 이름을 아제르바이잔어 Rüstəm İbrahimbəyov에 따라 '이브라힘배요프, 뤼스탬'으로 심의한 바가 있다. 아제르바이잔어 ə /æ/를 '애'로 적고 ü /y/를 '위'로 적은 것이 인상적이다. 아제르바이잔 독립 이후 로마자로 쓰는 아제르바이잔어가 명실상부한 공용어가 되었으므로 아제르바이잔 고유명사를 한글로 표기할 때 기준으로 삼는 것이 당연하다.

반면 우즈베키스탄도 카자흐스탄과 사정이 비슷하다. 지금까지 카자흐스탄과 우즈베키스탄 인명은 줄곧 러시아어 형태를 기준으로 심의하고 있다. 명목상으로는 카자흐어와 우즈베크어가 각각 공용어이지만 실제로는 러시아어가 교통어 역할을 하고 대외적으로도 러시아어 이름으로 알려지는 경우가 많기 때문이다. 더구나 국제적으로 알려지는 우즈베키스탄 인물 가운데는 우즈베크계가 아닌 이들이 많다.

K리그에서도 뛴 적이 있어서 친숙한 우즈베키스탄 축구 선수로 독일계인 알렉산드르 게인리흐(러시아어: Александр Гейнрих Aleksandr Geynrikh, 독일어: Alexander Heinrich '알렉산더 하인리히', 통용 로마자: Alexander Geynrikh)와 크림타타르계인 세르베르 제파로프(러시아어: Сервер Джепаров Server Dzheparov, 크림타타르어: Server Ceparov, 통용 로마자: Server Djeparov)가 있다. 이들은 러시아어를 주로 쓰며 우즈베크어는 거의 못 한다고 봐야 한다. 그러니 이들을 우즈베크어 이름을 기준으로 한글로 표기할 명분이 제대로 서지 않는다.

다만 점차 우즈베크어와를 기준으로 한 로마자 표기로 알려지는 인명도 늘어나고 있으니 경우에 따라 우즈베크어 이름을 기준으로 한글 표기를 정하는 것이 좋을 수도 있다. 우즈베크어로 작품 활동을 한 작가 Abdulla Qahhor(1907년~1968년)의 경우 러시아어 이름 Абдулла Каххар Abdulla Kakhkhar에 따른 '아브둘라 카하르'보다는 우즈베크어 이름에 따라 '압둘라 카호르'로 적는 것이 나을 것이다.

카자흐스탄 인명도 앞으로 비슷한 경우가 늘어날 수 있다. 카자흐어로 작품 활동을 한 시인 Міржақып Дулатұлы(1885년~1935년)는 예전에는 러시아어 이름인 Мир-Якуб Дулатов Mir-Yakub Dulatov '미르야쿠프 둘라토프'에 따라 Mir Yakub Dulatov로 널리 알려졌지만 요즘에는 카자흐어 이름에 따라 Mirjaqip Dulatuli로 많이 쓴다. 새로운 로마자 표기로는 Mirjaqyp Dyʼlatuly, 이에 따른 한글 표기는 '미르자크프 둘라툴르' 정도가 되겠다.

계획대로 카자흐어를 적는 문자가 로마자로 바뀐다면 [w] 또는 [u]를 나타내는 yʼ처럼 원 발음을 알기 어려운 철자로 이들 이름을 접하는 일이 늘어날 것이다. 그런 경우 카자흐어 로마자 표기에 대한 지식 없이 철자만 보고 발음을 짐작하여 한글로 표기하는 일이 없어야 하겠다.

물론 카자흐어를 로마자로 적게 되더라도 대외적으로 쓰는 로마자 표기는 이와 다를 수도 있다. 예를 들어 독일어 인명 Gauß '가우스', 네덜란드어 인명 Kuijt '카위트', 세르비아어 인명 Ђоковић/Đoković '조코비치'는 영어권에서는 각각 Gauss, Kuyt, Djokovic로 알려져 있다(세르비아어는 특이하게 키릴 문자와 로마자를 둘 다 쓰는데 키릴 문자가 우세한 편이다). 다른 언어 화자가 발음을 짐작하기 힘든 철자를 더 발음하기 쉽게 고친 것이다. 또 소말리아의 대통령은 Mohamed Abdullahi Mohamed라는 로마자 표기로 알려져 있지만 소말리어 이름은 Maxamed Cabdulaahi Maxamed '마하메드 압둘라히 마하메드'이다. 소말리어는 공식적으로 로마자를 쓰지만 x가 무성 인두 마찰음 /ħ/를 나타내고 c가 유성 인두 마찰음 /ʕ/를 나타내는 소말리어 로마자가 생소해서 외부인들이 발음을 짐작하기 힘든 탓에 국제적으로 통용되는 로마자 표기에는 잘 쓰이지 않는다. 다만 이 인명의 경우 통용 로마자 표기가 이에 대응되는 아랍어 이름을 기준으로 한 것일 수도 있다.

이처럼 예를 들면 Аяулым Қайратқызы/Aiʼayʼlym Qaiʼratqyzy와 같은 카자흐어 이름도 대외적으로는 카자흐어에서 쓰는 로마자 철자가 아니라 Ayawlym Qayratqyzy와 같이 실제 발음을 연상하기 쉬운 로마자 표기로 알려질 수도 있겠다. 이런 경우는 원래의 카자흐어 철자와 그에 대응되는 발음을 고려하여 '아야울름 카이랏크즈'로 적어야 할 것이다.

한글과 로마자가 병기된 19세기 한반도 전도 한글과 한국어

프랑스 루브르 박물관에서 2015년 9월 24일부터 이듬해 1월 4일까지 열린 특별전 '미래의 간략한 역사(Une brève histoire de l’avenir)'에 포함된 작품 가운데 작자 미상의 19세기 한반도 지도가 있었다.
이 특별전은 프랑스의 석학 자크 아탈리(Jacques Attali)가 쓴 동명의 책(한국에는 《미래의 물결》이라는 제목으로 소개되었다)을 소재로 기획되었는데 그 가운데 '지식의 전달(la transmission des savoirs)'을 다룬 부분에서 지리에 대한 지식이 발전한 예로 근대까지도 유럽의 입장에서는 미지의 땅이었던 조선을 그린 지도를 소개한 것이다.

이 지도는 파리의 프랑스 국립도서관(Bibliothèque nationale de France)이 소장하고 있는데 아쉽게도 종이에 먹으로 그린 19세기 지도라는 것과 Ge C 3317이라는 일련번호 외에는 별다른 서지 정보가 없다. 제목조차 쓰여있지 않아서 프랑스어로 Carte en coréen de la Corée, 즉 '조선어 조선 지도'라는 가제를 붙였다. 크기는 가로 60cm, 세로 97cm이다. 아마도 조선의 천주교 신자가 작성하여 프랑스인 선교사를 통해 프랑스에 전해진 것이 아닐까 추측해본다. 1846년 김대건 신부가 작성한 〈조선전도(朝鮮全圖, Carte de la Corée)〉도 같은 경로로 프랑스 국립도서관에 전해졌다.

이 지도는 현대 한국어 화자 입장에서, 특히 한국어의 역사에 관심을 가진 이의 입장에서는 보면 볼수록 흥미롭다. 바로 한글과 로마자가 병기되었기 때문이다. 주요 성읍과 산, 하천, 섬 등의 이름을 한글로 적고 그 가운데 대다수는 로마자를 병기했다. 이에 반해 김대건의 〈조선전도〉는 일부 한자로 적은 지명을 제외하고는 로마자로만 표기되었다. 또 여러 성읍을 잇는 도로를 그리고 주요 성읍마다 서울까지의 거리를 한자와 아라비아 숫자로 적었다.

이 지도는 프랑스 국립도서관이 운영하는 디지털 도서관 갈리카(Gallica) 누리집에서 마음껏 확대해서 볼 수 있다.

같은 누리집에서는 또 김대건의 〈조선전도〉를 베낀 지도도 찾아볼 수 있다. Carte de la Corée / d'après l'original envoyé par André Kim en 1846, 즉 '조선전도: 김 안드레아(김대건)가 1846년 보낸 원본을 따름'이라는 제목이며 여기서 확인해서 비교해볼 수 있다.

지도에 쓰인 로마자 표기 방식

'조선어 조선 지도'에서 조선 팔도는 다음과 같이 적고 있다.
함경도 ham kieng to
평안 hpieng an to
황ᄒᆡ도 hoang hai to (황해도)
강원도 kang ouen to
경긔 kieng kei to (경기도)
츙쳥도 tchioung tchieng to (충청도)
경샹도 kieng siang to (경상도)
젼라도 tjien la to (전라도)
사실 로마자 표기에서 언제나 분명한 띄어쓰기가 있는 것은 아니고 일부 경우는 아주 살짝 띄어 쓴 정도이지만 여기서는 읽기 쉽도록 음절 사이를 모두 띄어 쓰는 것으로 통일했다.

여기서 쓴 로마자 표기 방식은 프랑스어 발음을 기준으로 했다. 프랑스어에서는 ou가 [u] 또는 모음 앞에서는 [w]를 나타내며 e는 [e]와 [ɛ] 외에도 [ə]를 나타낼 수 있다. 그러니 'ㅜ'를 ou로, 'ㅓ'를 e로, 'ㅝ'를 oue로 나타내는 것이다('ㅔ'는 ei로 나타낸다). 또 프랑스어의 ch는 [ʃ], j는 [ʒ]로 마찰음을 나타내기 때문에 파찰음인 'ㅊ'와 'ㅈ'를 나타내려 그 앞에 t를 붙여서 tch, tj로 쓴 것이다. 1866년 병인교난 때 조선에서 탈출했던 프랑스인 주교 펠릭스클레르 리델(Félix-Claire Ridel)이 편찬하여 1880년 출판한 한불 사전인 《한불ᄌᆞ뎐(韓佛字典, Dictionnaire coréen-français)》에서 쓴 로마자 표기 방식과 꽤 비슷한데 다른 점은 《한불ᄌᆞ뎐》에서는 'ㅑ', 'ㅕ' 등을 ya, ye와 같이 y를 써서 적었고 이 지도에서는 ia, ie와 같이 i를 써서 적었다는 것과 'ㅌ'을 《한불ᄌᆞ뎐》에서는 ht로, 이 지도에서는 th로 적었다는 것이다.
흥미로운 것은 평안도를 적은 hpieng an to에서 p를 대문자처럼 기준선에서 위치를 올려 썼다는 것이다. 즉 원래 Pieng an to로 적었다가 앞에 h를 붙인 것으로 보인다. 이렇게 한국어 지명을 로마자로 표기하면서 그 중간에 표기 방식을 수정한 흔적이 드러나서 흥미롭다. 프랑스어에서는 ph가 보통 [f]를 나타내기 때문에 'ㅍ'를 ph 대신 hp로 적었다. 또 충청도를 나타낸 tchioung tchieng to도 첫머리를 수정한 흔적이 있다.
서울은 특이하게도 한글로는 '경', 로마자로는 sieoul이라고 적었다. 여기서도 원래는 그냥 seoul로 적었다가 i를 집어넣어 sieoul이라고 고친 흔적이 보인다. 그러니 '서울'의 옛 형태인 '셔울'을 기준으로 고친 표기이다. 이 지도에서는 '경샹도', '젼라도', '츙쳥도'의 예에서 볼 수 있는 것처럼 'ㅅ', 'ㅈ', 'ㅊ' 뒤에 [j]가 들어간 'ㅑ', 'ㅕ' 등을 쓰고 있지만 현대 한국어로 넘어오면서 이들은 'ㅏ', 'ㅓ'로 [j]가 탈락한다. 만약 seoul로 먼저 썼다가 한글 철자 '셔울'을 의식하여 sieoul로 고친 것이라면 철자는 옛 발음을 따라 '셔울'로 썼지만 실제로는 당시에 이미 [j]가 탈락한 [서울]로 발음되었다는 증거일 수가 있다.

Seoul이라는 로마자 표기는 이처럼 원래 'ㅓ'는 e로, 'ㅜ'는 ou로 적는 프랑스어 발음을 기준으로 한 방식에서 나왔다. 예전에 한국어 지명을 매큔·라이샤워 표기법에 따라 쓰던 시절에도 서울만은 Sŏul 대신 전통 표기인 Seoul로 흔히 적었었다. 그러다가 2000년에 현행 국어의 로마자 표기법이 발표되면서 '어'를 eo로, '우'를 u로 적게 했기 때문에 이를 따른 '서울'의 표기가 전통 표기인 Seoul과 일치하게 되었지만 원래는 Se-oul이었고 새 로마자 표기법으로는 Seo-ul이니 그 철자를 쓰게 된 경위는 다르다.

이 지도에 나타나는 한글 표기와 로마자 표기를 같이 살펴보면 근대 한국어의 모습을 엿볼 수 있다.

아래아(ㆍ)

중세 한국어에서 기본 모음을 나타냈던 글자인 아래아(ㆍ)는 시간이 지나면서 점차 다른 모음에 흡수되어 고유의 음가가 사라졌다. 하지만 20세기 초까지도 글에서는 일부 쓰였다. 이 지도에서는 현대 국어에서 'ㅏ'에 대응되는 'ㆍ'가 일부 쓰이며 'ㅐ'에 대응되는 'ㆎ'는 꽤 흔하게 쓰인다.
그런데 로마자 표기에서는 그냥 'ㅏ', 'ㅐ'인 것처럼 a, ai로 적었다. 이는 한글 철자에서 'ㆍ', 'ㆎ'로 썼더라도 실제 발음은 'ㅏ', 'ㅐ'와 구별이 없었다는 증거가 될 수도 있다. 참고로 《한불ᄌᆞ뎐》에서는 'ㆍ', 'ㆎ'를 반달 모양 부호를 써서 ă, ăi로 적어 'ㅏ', 'ㅐ'와 구별한다.
츄ᄌᆞ tchiou tja (추자)
ᄌᆞ산 tja san (자산)
ᄉᆞ랍 sa rap (사랍?)
황ᄒᆡ도 hoang hai to (황해도)
ᄇᆡᆨ두산 paik tou san (백두산)
ᄃᆡ마도 tai ma to (대마도)
대동강 tai tong kang
그런데 이 지도에서는 'ㅢ'와 'ㅔ'를 둘 다 ei로 적는다. 'ㅡ'는 eu로 적으면서 'ㅢ'는 eui가 아닌 ei로 적은 것이 흥미롭다(참고로 《한불ᄌᆞ뎐》에서는 'ㅢ'를 eui로, 'ㅔ'를 ei로 써서 구별한다). 로마자 표기를 이렇게 정한 사람은 정말 'ㅢ'와 'ㅔ'를 같거나 비슷하게 발음한 것일까? 그게 아니라면 'ㆍ', 'ㆎ'를 'ㅏ', 'ㅐ'와 동일하게 표기했다고 해서 꼭 같은 발음이었다고 단정할 수는 없다.

물론 'ㅢ'는 당시 한자어에서 '의', '긔', '희' 정도로 한정되어 있고 '에', '게', '헤'는 한자어에서 거의 쓰이지 않으니 혼동의 여지가 별로 없어서 발음이 다르더라도 둘 다 ei로 적어도 무난하다고 판단한 것일 수도 있다.
의쥬 ei tjiou (의주)
긔쟝 kei tjiang (기장)
희쳔 hei tchien (희천)
졔쥬 tjiei tjiou (제주)
초계 tcho kiei

구개음화

근대 국어에서 'ㄷ', 'ㅌ' 직후에 모음 /i/ 또는 반모음 /j/가 오면 'ㅈ', 'ㅊ'로 구개음화되는 현상이 나타났는데 방언에 따라 진행 속도가 달랐다. 이 지도에서는 구개음화가 일어나기 전의 음을 적은 표기가 보인다.
팔디 hpal-ti (팔지)
텬안 thieun an (천안)
그런데 흥미롭게도 한글 표기는 구개음화 이전의 형태를 쓰고 로마자 표기는 구개음화된 형태를 쓴 경우도 있다.
텬마산 tchien ma san (천마산)
'텬안 thieun an'에서는 'ㅕ'를 ie 대신 ieu로 쓴 것도 흥미로운데 이 지도에는 en이 예상되는 곳에 eun을 쓴 예가 꽤 있다.

두음 법칙

근대 국어에서 발생한 음운 변화로 이른바 두음 법칙이 있다. 표기상으로 어두의 'ㄹ'이 'ㄴ'으로 바뀌는 일은 16세기부터 시작되었으며 18세기에는 /i/, /j/ 앞의 'ㄴ'이 탈락하는 현상이 시작되었는데 이 역시 방언마다 진행 속도가 달랐다. 이 지도에는 두음 법칙이 완전히 적용되지 않은 표기가 많이 나타나지만 흥미롭게도 한글 표기에는 두음 법칙이 적용되지 않았는데 로마자 표기에는 적용된다거나 그 반대인 경우가 몇몇 관찰된다.
년안 ien an (연안)
령덕 ieng tek (영덕)
영월 rieng ouel
특히 'ㄹ'이 'ㄴ'으로 바뀌는 두음 법칙으로 인해 한글 표기의 'ㄹ'이 로마자 표기의 n에 대응되는 경우가 많다.
림피 nim hpi (임피)
룡인 niong in (용인)
룡담 niong tam (용담)
한편 두음 법칙의 영향인지 '울릉도'의 '릉(陵)'을 어중에서도 '능'으로 적은 예도 보인다.
울능도 oul-neung-to (울릉도)
이 밖에도 이 지도를 통해 오늘날 '지리산'이라고 부르는 산을 당시에는 한자 智異山의 본음에 따라 '지이산'이라고 썼다는 것을 확인할 수 있다. '지리산'이란 속음이 쓰이게 된 배경에는 두음 법칙에 의한 '이'와 '리'의 혼동도 일조했을 것이다.

이 글에서 언급한 것 외에도 갈리카 누리집에서 지도를 확대해서 보면 흥미로운 것을 많이 발견할 수 있을 것이다. 이 지도에는 주로 기본적인 지리 정보만 나오지만 한산도 근처에는 '츙무공왜국파ᄒᆞᆫ곳(충무공 왜국 파한 곳)'이라는 설명이 붙어 있는 것을 보는 재미도 있다.

고다이바 부인과 고디바 초콜릿 표기 용례

존 콜리어(John Collier)의 《고다이바 부인》. 1897년경. 허버트 미술관 소장.

'고디바'라는 벨기에 고급 초콜릿 브랜드가 있다. 그 상징인 말을 탄 나체 여인 그림은 전설의 고다이바 부인(영어: Lady Godiva)을 나타낸다. 1926년 벨기에 브뤼셀에서 조제프 드랍스(프랑스어: Joseph Draps [ʒozɛf dʁaps])가 설립한 드랍스 초콜릿 회사가 1956년 브뤼셀에 첫 매장을 열면서 고다이바 부인의 전설에서 이름을 따서 상호를 '고디바'로 바꿨다. 프랑스어로는 Godiva를 [ɡɔdiva] '고디바'라고 발음한다.

고디바 초콜릿 로고.

전설에 따르면 고다이바 부인은 오늘날 영국의 일부인 잉글랜드 코번트리에 살았다. 그는 영주인 남편이 책정한 터무니 없이 높은 세금으로 백성들이 고통을 받는 것을 보고 세금을 감면해달라고 남편에게 여러 차례 애원했다. 결국 남편은 고다이바 부인이 나체로 말을 타고 길거리에 나가면 이를 들어주겠다고 답했다. 물론 설마 부인이 이를 따를 것이라고는 생각하지 않고 한 말이었다. 하지만 고다이바 부인은 성의 주민들에게 실내에 머물고 창을 가리라고 명한 뒤 정말로 나체로 말을 타고 코번트리의 길거리를 지나가 백성들을 향한 애정을 증명했다고 한다.

고다이바 부인이든 초콜릿 브랜드 고디바이든 Godiva의 프랑스어 발음은 [ɡɔdiva] '고디바'이지만 영어로는 /ɡə.ˈdaɪ̯v.ə/ '거다이바'로 발음한다. 그런데 《표준국어대사전》에는 '고다이바'가 전설의 귀족 부인을 뜻하는 표제어로 나온다. [ə]로 발음되는 o를 철자에 이끌려 '오'로 적는 관습을 인정한 것이다. 외래어 표기법에서는 영어에서 [ə]로 발음되는 어말의 a는 '아'로 적도록 하고 있지만 다른 위치에서는 철자에 상관 없이 '어'로 적는 것이 원칙이니 엄밀히 말하면 '거다이바'로 적어야 한다. 하지만 실제로는 [ə]로 발음되는 o를 '오'로 적는 경우가 매우 많다. chocolate도 영어 발음 /ˈʧɒk.lᵻt, ˈʧɒk.(ə)l.ᵻt/을 따르면 '초컬릿'으로 써야 하지만 '초콜릿'이 표준 표기로 인정되었다. '초코렛', '초콜렛' 등 '에'로 발음하는 관습이 있는 마지막 모음은 외래어 표기법을 적용하여 '이'로 적으면서도 가운데 음절의 모음만은 '오'로 적는 관습적인 표기를 인정한 것이다.

나체로 말을 타고 코번트리의 길거리에 나섰다는 것은 지어낸 얘기일 가능성이 높지만 고다이바 부인은 11세기 잉글랜드 머시아 백작 레프릭(Leofric)의 아내였던 실존 인물이다. 머시아(영어: Mercia /ˈmɜːɹs.i‿ə, ˈmɜːɹʃ-, ˈmɜːɹʃ.ə/)는 10세기 초 잉글랜드의 통일 이전에 존재했던 앵글로색슨 소왕국 가운데 하나였으며 고다이바 부인이 활약했던 11세기에는 잉글랜드 왕국의 주였다. 백작 Leofric은 영어로 /ˈlɛf.ɹɪk/ '레프릭' 외에도 /ˈleɪ̯.əf.ɹɪk/ '레이어프릭', /ˈliː‿əf.ɹɪk/ '리어프릭', /li.ˈɒf.ɹɪk/ '리오프릭' 등으로 다양하게 발음된다.

머시아를 포함한 앵글로색슨 소왕국들을 나타낸 지도.

이처럼 영어 발음이 고정되어 있지 않은 이유는 Leofric이 고대 영어 이름으로 현대 영어에서는 잘 쓰지 않는 이름이며 현대 영어 화자 입장에서 봤을 때 고대 영어는 완전히 외국어이기 때문이다. 그 발음만 해도 f가 유성음 사이에서 [v]로 실현되고 c, g가 경우에 따라 오늘날의 ch, y처럼 [ʧ], [j]로 실현되는 등 현대 영어 화자에게는 낯선 부분이 많다.

원래의 고대 영어 발음은 [ˈleːovriːʧ] '레오브리치' 정도로 재구성할 수 있다. 오늘날 고대 영어 교재 등에서는 원래의 발음을 나타내기 위해 부호를 추가하기도 하는데 이 경우 Leofric은 Lēofrīċ으로 쓴다. 여기서 e와 i가 장음이라는 것을 나타내기 위해 위에 줄을 그었고 c가 현대 영어에서 ch로 적는 음이라는 것을 나타내기 위해 위에 점을 찍었다. 하지만 오늘날의 영어 화자들은 고대 영어의 발음을 잘 모르니 Leonard /ˈlɛn.əɹd/ '레너드', leopard /ˈlɛp.əɹd/ '레퍼드' 등에서 유추하여 /ˈlɛf.ɹɪk/ '레프릭'으로 발음하거나 앞서 열거한 다양한 발음을 쓰는 것이다. Lēofrīċ는 '사랑스러운'을 뜻하는 lēof '레오프'와 '권력', '왕국' 등을 뜻하는 rīċe '리체'가 합친 이름인데 Leonard의 leon-과 leopard의 leo-는 각각 고대 고지 독일어와 라틴어·고대 그리스어에서 '사자'를 뜻하니 어원상으로는 Leofric과 아무런 관련이 없다.

상단에서 머시아 백작 레프릭과 참회왕 에드워드가 성찬식 빵에 예수의 얼굴이 나타나는 기적을 목격하고 있다. 잉글랜드 토지 대장인 《둠즈데이 북(Domesday Book)》의 13세기 요약본.

Godiva는 원래 고대 영어 이름인 Godgifu를 라틴어식으로 적은 것이다. 둘째 g가 오늘날의 y처럼 발음되었다는 것을 나타내기 위해 위에 점을 찍어 Godġifu와 같이 쓸 수 있으며 그 발음은 [ˈɡodjivu] '고드이부' 정도로 재구성할 수 있다. '신'을 뜻하는 god '고드'와 '선물'을 뜻하는 ġifu '이부'가 합친 이름이다. 중세 라틴어식으로 ġi [ji]는 그냥 i로 흉내내고 f [v]는 v로 적어 Godiv-가 된 것이며 라틴어에서 여성 이름이 흔히 -a로 끝나므로 이를 따라 Godiva가 된 것이다. 11세기 당시 고대 영어 발음에서는 어차피 Godġifu의 마지막 모음이 분명하게 발음되지 않았을 수도 있다.

조금 드문 노르웨이어 여자 이름 가운데 Synnøve [²synːøvə] '쉰뇌베'가 있는데 10세기에 아일랜드에서 노르웨이로 건너갔다는 성인 Sunniva '순니바'에서 나온 현대 노르웨이어 이름이다. 이 이름은 '태양'을 뜻하는 sunne '순네'와 ġifu '이부'가 합친 고대 영어 이름 Sunnġifu '순이부'가 고대 노르드어 Sunnifa '순니바'를 거쳐 중세 라틴어 Sunniva '순니바'가 된 것이다(고대 노르드어에서도 유성음 사이의 f가 [v]로 발음된다). 여기서도 고대 영어 이름의 -ġifu가 라틴어 -iva에 해당한다.

노르웨이의 한 교회 제단 장식으로 조각된 성 순니바 상. 1520년대. 베르겐 박물관 소장. 출처 Wikimedia: Nina Aldin Thune, CC-BY SA 3.0.

고다이바 부인의 전설은 13세기 중세 잉글랜드의 연대기 《플로레스 히스토리아룸(Flores Historiarum)》에 처음 등장했다. '역사의 꽃들'을 뜻하는 라틴어 제목에서 볼 수 있듯이 라틴어로 쓰인 연대기이다. 9세기에서 11세기 사이에는 고대 영어로 쓰인 문서가 꽤 많았지만 1066년 노르만족이 잉글랜드를 정복하여 노르만 왕조가 들어선 후 영어는 한동안 문자 언어로서 거의 자취를 감추었고 노르만어/프랑스어나 라틴어가 주로 쓰였다(이 시점을 기준으로 고대 영어와 중세 영어를 나눈다). 고다이바 부인의 전설은 인기를 끌게 되면서 자연스럽게 라틴어식 이름인 Godiva가 오늘날 영어에서 쓰는 형태로 이어지는 것이다. 대신 Lēofrīċ의 라틴어식 형태인 Leuricus '레우리쿠스' 또는 Leofricus '레오프리쿠스'는 잊혀지고 고대 영어 형태인 Leofric을 쓰는 것이다. Godġifu는 중세 잉글랜드에서 꽤 흔한 여자 이름이었지만 후대에는 쓰이지 않게 되었고 대신 여기서 나온 Goodeve /ˈɡʊd.iːv/ '구디브'가 성으로 드물게 쓰인다.

중세 잉글랜드에서 쓰인 Godiva의 라틴어 발음은 [ɡoˈdiːva] '고디바' 정도였을 것이다. 그런데 중세 영어 후기에 해당되는 15세기에 시작되어 근대 영어 시기까지 계속된 대모음 추이(Great Vowel Shift)로 영어 장모음의 음가가 심한 변화를 겪었다. 중세 영어에서는 단모음 i /i/와 가까운 음가였던 장모음 i /iː/는 대모음 추이를 통해 현대 영어의 /aɪ̯/ '아이'로 변했다. 거기에 영어 발음의 특징인 모음 약화 때문에 원래의 /o/와 /a/가 불분명한 무강세 모음 [ə]로 변해 오늘날 Godiva의 영어 발음은 /ɡə.ˈdaɪ̯v.ə/ '거다이바'가 된 것이다. '침'을 뜻하는 라틴어 saliva '살리바'가 영어에서 /sə.ˈlaɪ̯v.ə/ '설라이바'가 된 것도 같은 이치이다.

영어의 대모음 추이를 나타낸 표. 출처 Wikimedia: Olaf Simons, CC-BY 3.0.

'거다이바'는 너무 어색하다고 느낀 것인지 아니면 중간의 /aɪ̯/ '아이' 발음은 들었지만 나머지 모음은 [ə]로 약화된다는 것을 알아채지 못하고 정한 표기인지는 몰라도 '고다이바'가 전설의 부인 이름의 표준 표기로 정해졌다. 하지만 초콜릿 브랜드 Godiva는 프랑스어권인 벨기에 브뤼셀에서 나왔으므로 프랑스어 발음을 따라 '고디바'로 적는데 아무런 문제가 없다. 한국에서 쓰는 상호도 '고디바'이다. 프랑스어로는 고다이바 부인도 Dame Godiva '담 고디바'라고 하고 영어로는 고디바 초콜릿도 Godiva chocolate '고다이바 초콜릿'이라고 하는데 한국어에서는 '고다이바 부인', '고디바 초콜릿'으로 표기를 구별해야 하는 상황이 된 것이다.

중세 잉글랜드의 라틴어식 인명이고 당시에는 '고디바'로 발음했을 테니 '고디바 부인'으로 불러도 되지 않을까? 그런데 중세 잉글랜드 인물 가운데 라틴어식 이름으로 알려진 인물은 그리 많지 않다. 예를 들어 7~8세기에 활약한 성직자이자 라틴어로 《잉글랜드인들의 교회사(Historia ecclesiastica gentis Anglorum)》를 쓴 역사가는 《표준국어대사전》에 '비드'로 실려있다. 그가 쓴 라틴어 이름 Beda '베다' 대신 영어 이름 Bede /ˈbiːd/를 따라 '비드'로 쓴 것이다. 아무래도 중세 잉글랜드 인물 가운데 그나마 알려진 인물들은 많이 쓰는 영어식 이름이 따로 있어 굳이 라틴어 이름을 쓸 이유가 없으면 잘 알려지지 않은 인물들은 학계에서 라틴어보다는 고대 영어 이름으로 부르는 경우가 많다.

뉘른베르크판 《리베르 크로니카룸(Liber Chronicarum '연대기')》의 비드 삽화. 1493년.

이미 언급한 앵글로색슨 소왕국 머시아의 이름은 머시아 사람을 일컫는 고대 영어 Mierċe '미에르체' 또는 Myrċe '뮈르체'(본뜻은 '변경 사람')를 라틴어식으로 어미 -ia를 추가한 Mercia로 적은 것에서 비롯되었다. 이를 고전 라틴어 방식으로 읽으면 '메르키아'이다. 하지만 고대 영어의 표기에서도 짐작할 수 있듯이 라틴어에서 전설 모음 앞의 c는 잉글랜드에서 파찰음을 거쳐 결국 [s]로 변했기 때문에 '메르치아'가 당시 발음에 더 가까울 것이고 이게 현대 영어에서 '머시아'가 된 것이다.

또 다른 앵글로색슨 소왕국으로 Northumbria도 있는데 고대 영어 Norþhymbra '노르스휨브라'에서 온 라틴어명이다. 고대 영어 철자의 þ는 현대 영어의 th 음에 해당하며 위치에 따라 무성 치 마찰음 [θ] 또는 유성 치 마찰음 [ð]로 발음되었다. 그러니 이를 고전 라틴어 방식으로 읽어 '노르툼브리아'로 표기하기도 어색한 것이 사실이다. 그래서 보통 현대 영어 발음 /nɔːɹ.ˈθʌm.bɹi‿ə/에 따라 '노섬브리아'라고 적는다.

이처럼 중세 잉글랜드식 라틴어 발음에 어울리게 표기하려면 손봐야 할 부분이 몇몇 있기 때문에 라틴어 발음을 따르려 하기보다는 라틴어 이름이라도 아예 현대 영어식 발음대로 표기하는 것이 편할 수 있다. 그러니 Godiva 하나만 따지면 '고디바'로 적는 것이 무난하더라도 중세 잉글랜드의 라틴어식 고유 명사를 표기하는 방식을 하나로 통일하라면 현대 영어 발음을 따르는 것이 제일 쉬워보인다.

대문자 에스체트(ẞ), 독일어 맞춤법에 공식적으로 포함되다 어문 규정

독일어 맞춤법 위원회(Rat für deutsche Rechtschreibung)는 6월 29일 대문자 에스체트(ẞ)를 허용하는 것을 포함한 독일어 맞춤법 개정안을 발표하였다. 독일 만하임에 소재한 독일어 맞춤법 위원회는 독일, 오스트리아, 스위스, 이탈리아(남티롤 자치현), 벨기에(벨기에 독일어 공동체), 리히텐슈타인, 룩셈부르크(참관국) 등 독일어권 각국의 대표가 참여하여 독일어의 맞춤법 정책을 관리하는 국제 기관이다.

글꼴: Brill

그동안 소문자 ß로 쓰는 것만 허용되던 에스체트(Eszett [ɛsˈʦɛt])는 독일어에서만 쓰이는 독특한 글자이다. 한국에서는 워낙 낯선 글자인 나머지 생김새가 비슷한 그리스 문자의 베타(β)로 잘못 조판되는 수난을 흔히 겪는다. 한글 폰트에서는 아예 ß의 자리에 베타에 더 어울리는 자형을 넣는 일이 많고 심지어 기울임체 β를 쓰는 잘못을 저지른 것도 있다.

한 약도에서 Straße ([ˈʃtʁaːsə] '슈트라세', '길')의 ß가 그리스 문자 베타(β)로 잘못 조판되어서 Straβe가 되었다. 이 밖에 Hackerbruke는 Hackerbrücke '하커브뤼케'의 잘못이다.

이 글자는 장모음이나 이중모음 뒤의 음절말 음소 /s/를 나타내는 철자이다. '큰'을 뜻하는 groß [ɡʁoːs] '그로스', '흰'을 뜻하는 weiß [vaɪ̯s] '바이스'에서는 각각 장모음 [oː]와 이중모음 [aɪ̯] 뒤의 /s/를 ß로 적는다. 반면 단모음 뒤의 /s/는 ss로 적는다. 그래서 '(죄에 대한) 벌'을 뜻하는 Buße [ˈbuːsə] '부세'와 '버스'를 뜻하는 Bus [bʊs] '부스'의 복수형인 Busse [ˈbʊsə] '부세'의 철자가 구별된다. 전자는 장모음 [uː]가 쓰이고 후자는 단모음 [ʊ]가 쓰이므로 뒤따르는 /s/를 각각 ß, ss로 적는 것이다.

주의할 것은 표준 독일어 발음에서 음절말 자음은 무성음이 되므로 음절말 음소 /z/도 [s]로 발음되는데 /z/는 s로 적고 /s/일 때만 ß, ss로 적는다는 것이다. 영어의 as, has, his, is, was 등에서 s가 /z/를 나타내는 것처럼 독일어 어말의 s도 /z/를 나타내지만 음절말 자음이 무성음이 된다는 규칙 때문에 [s]로 발음되는 것으로 봐야 한다.

단독으로 쓰일 때는 어말의 /s/와 /z/ 둘 다 [s]로 발음되므로 구별할 수 없으니 굴절형이나 활용형 등에서 모음이 따를 때 [s]로 발음되는지 [z]로 발음되는지 확인해야 한다. 예를 들어 '풀'을 뜻하는 Gras [ɡʁaːs] '그라스'는 복수형이 Gräser [ˈɡʁɛːzɐ] '그레저'이기 때문에 마지막의 [s] 음이 사실은 /z/가 무성음화한 것이라는 것을 알 수 있으므로 ß 대신 s로 적는다. 반면 groß의 비교형은 größer [ˈɡʁøːsɐ] '그뢰서'로 모음 앞에서도 [s] 발음이 나니 원 음소를 /s/로 보고 ß로 적는 것이다.

1996년 맞춤법이 개정되기 전에는 단모음 뒤라도 어말이나 자음 앞의 /s/는 ss 대신 ß로 적었다. 그래서 예전에는 '러시아'를 독일어로 Rußland '루슬란트'로 적었는데 단모음 [ʊ]를 써서 [ˈʁʊslant]로 발음하기 때문에 1996년 이후 Russland로 철자가 바뀌었다. 이때 새 규칙 때문에 독일어에서 쓰던 ß가 많이 사라졌다. 하지만 성씨 같은 개별 고유명사는 애초에 맞춤법에 구애받지 않으므로 원래 쓰던 표기를 그대로 쓴다. 성씨를 Geßner [ˈɡɛsnɐ] '게스너'로 적는 이는 맞춤법 규정에 상관 없이 Geßner로 계속 적는다. 사람에 따라 같은 발음을 Gesner 또는 Gessner로 적기도 하니 제각각이며 공식적으로는 셋 다 다른 성씨이다.

독일어권에서 아예 ß를 쓰지 않는 곳도 있다. 바로 스위스와 이웃 소국 리히텐슈타인이다. 이들이 쓰는 스위스 표준 독일어에서는 다른 독일어권 나라에서 ß로 적는 것을 모든 경우에 ss로 대체한다. 하지만 스위스에서 출판되는 책들은 독일어권 전체를 대상으로 하기 때문에 ß를 쓴다.

ß의 정확한 기원에 대해서는 논란이 있지만 원래 오늘날의 표준 독일어의 전신인 중세 고지 독일어에서 쓰이던 철자인 sz에서 온 것으로 보인다. '에스체트'라는 이름도 독일어로 s를 이르는 '에스'와 z를 이르는 '체트'가 합쳐진 것이다. 당시에는 원시 게르만어의 *t에서 나온 [s] 비슷한 음을 z로 흔히 썼는데 파찰음 [ʦ] 비슷한 발음이 되기도 했기 때문에 [s] 비슷한 음은 sz, [ʦ] 비슷한 음은 tz로 구별하기도 했다. 이에 비해 원시 게르만어의 *s에서 나온 [s] 비슷한 음은 ss로 썼다. 중세에는 *t에서 나온 음과 *s에서 나온 음의 발음이 구별되었는데 전자는 /s/로, 후자는 /⁠ɕ/로 설명하기도 하고 전자는 치음 /s̪/로, 후자는 설첨음 /s̺/로 설명하기도 한다. 어쨌든 당시에는 sz와 ss가 비슷하지만 구별되는 음을 나타냈다.

독일어의 groß, weiß는 각각 원시 게르만어의 *grautaz, *hwītaz에서 나왔으며 영어의 great [ɡɹeɪ̯t] '그레이트', white [(h)waɪ̯t] '화이트', 네덜란드어의 groot [ɣroːt] '흐로트', wit [ʋɪt] '빗'에 각각 대응된다. 저지 독일어에서도 각각 groot [ɣroːt], witt [vɪt]로 쓰니 원시 게르만어의 *t가 /s/로 변한 것은 고지 독일어만의 특징이다. 여기서 ß가 다른 게르만어의 t에 대응되는 것을 볼 수 있다. 그런데 훗날 ß가 원시 게르만어의 *t에 해당하지 않는 경우에도 쓰이게 되었기 때문에 ß로 쓰인다고 꼭 원시 게르만어의 *t에서 나온 것은 아니다. 1996년 맞춤법 개정으로 원시 게르만어의 *t에 해당하지 않는 경우의 ß의 쓰임이 대폭 줄어들었다. 대신 영어의 hate, 네덜란드어의 haat에 해당하며 원시 게르만어의 *hataz에서 온 Hass [has](옛 철자는 Haß)에서처럼 원시 게르만어의 *t에서 온 경우에도 ß를 쓰지 않게 된 경우도 많다.

중세 글씨체에서 어중의 s는 '긴 s'라고 불리는 ſ 형태로 썼고 z는 꼬리가 달린 ʒ의 형태였기 때문에 sz는 ſʒ와 비슷한 모습이었다. 이 조합을 합자로 쓴 것이 ß의 시초이다. 그래서 독일어권에서 주로 쓰던 활자체인 흑자체(독일문자체)에서는 ß를 ſʒ 비슷한 형태로 썼다.

흑자체(글꼴: Walbaum Fraktur)로 쓴 weisz와 weiß. 여기서 s는 긴 s (ſ)로 썼다. ß는 긴 s (ſ)와 z의 합자 형태이다.

오늘날 독일 베를린의 도로명 표지판은 다른 글자는 익숙한 산세리프체 자형을 쓰지만 ß는 흑자체에서처럼 ſʒ가 합친 독특한 형태를 쓴다. 이 형태는 Verlag와 같은 일부 복고풍 글꼴에서 쓰이지만 오늘날 주류 형태는 아니다.
베를린의 도로명 표지판(Wikimedia: Chitetskoy, CC BY-SA-3.0)

한편 이탈리아, 프랑스 등 독일어권 바깥에서는 유럽에 인쇄술이 소개된 15세기에 이미 우리에게 익숙한 로마체 활자를 사용하기 시작했다. 독일에서도 19세기 이전부터 로마체 활자를 도입하려는 시도가 있었지만 나폴레옹 전쟁으로 신성 로마 제국이 해체되면서 프랑스에 대한 반감과 중세 독일에 대한 향수가 겹쳐 20세기 초까지 흑자체의 사용이 계속되었다. 하지만 로마체의 사용이라는 조류를 끝까지 막아낼 수는 없었다.

흑자체 활자에는 ſʒ 합자 형태의 ß가 따로 있었지만 로마체 활자에는 이에 대응되는 글자가 없었다. 그래서 ſs로 쓰거나 sz, ss로 쓰는 등의 다양한 시도가 있었다. 18세기에 이르러는 ss와 sz의 발음 구별이 사라졌기 때문에 둘이 혼용되었다. 하지만 결국 로마체 활자에서도 ß를 한 글자로 쓰는 것으로 의견이 모아졌다. 문제는 어떤 형태를 쓰느냐였다.

17세기 인쇄업자 아브라함 리히텐탈러(Abraham Lichtenthaler [ˈaːbʁaham ˈlɪçtn̩taːlɐ], 1621년~1704년)는 1667년에 이미 로마 말기의 철학자 보에티우스의 《철학의 위안》 독일어판을 펴내면서 긴 s (ſ)에 3자 모양의 우변을 합친 듯한 독특한 형태의 ß를 사용했다. 리히텐탈러는 바이에른 주의 줄츠바흐(Sulzbach [ˈzʊlʦbax])라는 소도시 출신이었기 때문에 여기에는 줄츠바허(Sulzbacher [ˈzʊlʦbaxɐ]) 형태라는 이름이 붙여졌다. 1903년 라이프치히에서 움라우트(ä, ö, ü)와 ß의 자형을 의논하러 모인 인쇄업자들은 앞으로 로마체 활자에서 ß를 줄츠바허 형태로 통일하기로 결의했다.

ß의 줄츠바허 형태를 쓴 글꼴(Walbaum 2010 Pro)로 쓴 weiß.

하지만 모든 이들이 줄츠바허 ß를 받아들인 것은 아니었다. 자형이 못생겼다거나 B나 베타(β)와 너무 유사하다는 비판을 받았다. 그래서 20세기 중반부터는 긴 s (ſ)와 s의 합자 비슷한 형태도 유행하게 되었다. ſs 합자는 다른 언어에서는 예전부터 쓰였지만 독일어의 ß를 나타내기 위해 쓰인 것은 더 최근의 일이다.

ß는 sz의 합자로 출발했지만 중세 고지 독일어에서 쓰인 sz와 ss의 구별이 사라진 이후 sz보다는 ss에 해당하는 글자라는 인식이 퍼졌다. 스위스 표준 독일어에서 ss로 대체하였고 대문자로 쓸 때에도 보통 SS로 쓰도록 한 것만 봐도 그렇다. z는 독일어에서 파찰음 /ʦ/를 나타내기 때문에 /s/를 나타내는 조합으로는 sz보다 ss가 어울려 보였을 것이다. 한동안 ß의 기원에 대해 ss 합자설과 sz 합자설이 대립했으며 특히 20세기 타이포그래피에 큰 영향을 끼친 디자이너 얀 치홀트(Jan Tschichold [jan ˈʧɪçɔlt], 1902년~1974년)는 ss 합자설을 주장하였다. 그래서 20세기 중반 이후 ſs 합자 형태의 ß가 많이 등장했다. ß의 실제 기원과는 상관 없이 오늘날 대다수 독일어 화자는 이를 ss에 해당하는 글자로 여기는 것이 사실이다.

ß의 ſs 합자 형태를 쓴 글꼴(Calluna)로 쓴 weiſs와 weiß.

그래서 오늘날 로마체 글꼴에서 ß는 줄츠바허 형태와 ſs 합자 형태가 둘 다 많이 쓰인다. 보통 손글씨를 흉내내는 풍의 글꼴에서는 ſs 합자 형태를 선호하고 단순한 기하학적 형태를 강조하는 글꼴에서는 줄츠바허 형태를 선호하지만 똑 부러지게 갈리는 것은 아니다.

이처럼 소문자 ß의 자형에 관해서도 의견이 분분했으니 이에 해당하는 대문자의 자형에 대해 의견이 모아질 리 없었다. 결국 1900년을 전후하여 ß의 대문자형을 정립하려는 시도는 실패로 돌아갔다. 몇몇 인쇄소에서는 대문자 ẞ를 포함한 활자를 내기도 했지만 널리 보급되지 않았다. 그 후 대문자 ẞ는 사실상 잊혀져 타자기나 컴퓨터 자판, 인코딩 등에서 제외되었다.

흑자체에서는 대문자 ẞ가 필요없었다. ß는 음절말에 오는 소리를 적는 글자이므로 말의 첫머리에 오는 적이 없다. 그러니 흑자체에서는 언제나 소문자로만 적게 된다. 하지만 흑자체와 달리 로마체에서는 단어를 대문자로만 적는 일도 가능하다. 이런 경우 ß를 대문자로 어떻게 적느냐의 문제가 발생했다.

ß를 대문자로 쓸 수 있는 글자가 없으니 이를 SS나 SZ로 파자하는 방법이 쓰이게 되었다. 즉 groß를 대문자로만 쓸 때에는 GROSS 또는 GROSZ로 적는 식이다. 원래는 ß의 대문자형이 정해질 때까지 임시로 그렇게 쓴다는 것이 결국 독일어 맞춤법의 일부가 되었다. 1996년 이전에는 주로 SS로 적고 ss의 대문자와 구별할 필요가 있을 때만 SZ로 적도록 했는데 1996년 맞춤법 개정 때 예외 없이 SS로 통일하는 것으로 바뀌었다.

물론 ß를 대문자로 쓸 때 SS나 SZ로 대체하는 방식은 불편했기에 대문자 ß를 도입하려는 시도는 계속되었다. 예를 들어 동독에서 출판된 표준 독일어 사전인 《두덴 대사전(Der Große Duden)》은 표지에 대문자 ẞ를 쓰기도 했다. 하지만 이 시도는 흐지부지되었고 20세기가 다 가도록 대문자 ẞ의 본격적인 도입은 요원해 보였다.

1965년판 동독 《두덴 대사전》(Flickr: Ralf Hermann, CC BY-NC 2.0)

하지만 2000년을 전후로 대문자 ẞ의 도입을 주장하는 움직임이 다시 거세어졌다. 이들은 대문자 ẞ 없이는 대문자로만 썼을 때 성씨를 구별할 수 없다는 것을 지적했다. 독일어로 Weiß와 Weiss는 둘 다 [vaɪ̯s]로 발음되지만 엄연히 다른 성인데 신분증에서 대문자로만 적게 하면 둘 다 WEISS가 되어서 원래 Weiß인지 Weiss인지 알 수가 없다. 이런 문제 때문에 대문자로만 쓸 때도 소문자 ß를 집어넣어 WEIß와 같이 쓰는 일도 잦았지만 맞춤법 규정에 어긋나는 것으로 간주되었다.

독일의 서체 디자이너이자 타이포그래피 전문지 《지그나(Signa)》의 편집자인 안드레아스 슈퇴츠너(Andreas Stötzner)는 대문자 ẞ를 도입하자는 캠페인을 주도했다. 그는 2004년과 2007년 두 차례에 걸쳐 유니코드 협회에 대문자 ẞ를 포함시켜달라는 제안서를 제출하여 2008년 유니코드 5.1.0 버전에 마침내 U+1E9E ẞ LATIN CAPITAL LETTER SHARP S로 등록되었다. sharp s는 독일어로 ẞ의 또다른 이름인 scharfes S를 영어로 옮긴 것인데 독일어로 scharf는 영어의 sharp처럼 '날카롭다'는 뜻도 있지만 무성음을 이를 때도 쓰인다. 즉 scharfes S는 '무성음 s'라는 뜻이다.

대문자 ẞ의 도입을 주장한 타이포그래피 전문지 《지그나》 9호 표지(2006년).

마침내 대문자 ẞ가 유니코드에 등록되었지만 곧바로 독일어 맞춤법에 반영되지는 않았다. 이를 지원하는 글꼴이 추가되는데 시간이 걸렸기 때문이다. 현재도 대문자 ẞ를 지원하지 않는 글꼴이 많다. 하지만 지난 9년 사이 대문자 ẞ 지원을 추가한 기존 글꼴이나 대문자 ẞ를 처음부터 포함한 신규 글꼴이 꽤 보급되었다. 20세기 초까지는 대문자로 SZ 또는 SS 합자를 비슷한 글자를 쓴 시도가 있었지만 오늘날에는 소문자 ß의 자형에서 출발하여 대문자에 어울리도록 크기와 모양을 바꾼 글자가 쓰인다.

이번에 발표된 독일어 맞춤법 개정안은 대문자 ẞ를 쓰는 것을 인정하되 예전 방식을 쓰지 못하게 하지는 않았다. 오히려 이전처럼 SS로 대체하는 것을 원칙으로 고수하되 대문자 ẞ로 쓰는 것을 허용한다는 것이다. 대문자 ẞ를 지원하는 글꼴이 꽤 보급되었지만 아직까지 지원하지 않는 글꼴도 많다는 현실을 고려한 결정으로 보인다.

대문자 ẞ가 유니코드에 등록된 이후 이를 지원하는 글꼴이 점차 늘어나고 있다(글꼴: PT Sans, Brill, Carlito, Nocturne Serif, Source Sans Pro, Iowan Old Style BT, Daytona Pro).

대문자 ẞ의 도입에 일반 언중이 얼마나 호응할지는 미지수이다. 아직까지 독일어 키보드로 쉽게 입력하기 어렵다는 중대한 문제가 남아있다. 또 모두 대문자로만 쓸 때나 필요한 글자이기 때문에 쓸 일이 별로 없는 이들이 많을 것이다. 하지만 유니코드에 등록된 이후에도 독일어 맞춤법에서 공식적으로 인정하지 않는다는 이유로 대문자 ẞ를 망설여왔던 이들은 이제 거리낌 없이 대문자 ẞ를 쓸 수 있게 되었다.

1 2 3 4 5 6 7 8 9 10 다음