구글 실험실의 아랍어 발음부호 추가 도구 '타슈킬'

아랍어 한글 표기에 유용하게 쓰일 수 있는 도구를 우연히 발견해 소개한다. 구글 실험실(Google Labs)의 '타슈킬(Tashkeel)'이란 베타 프로젝트인데 아랍어 글을 입력하면 발음부호를 추가해주는 도구이다.

(아랍어와 아랍 문자를 모르면서 쓰는 글이기 때문에 특히 아랍 문자의 전사 같은 내용에서 틀린 부분이 있을 수 있습니다. 잘 아시는 분은 꼭 지적 부탁드립니다.) 

완전한 발음을 보통 표기하지 않는 아랍 문자

아랍 문자는 보통 단자음과 장모음만 나타내기 때문에 철자만 보고는 발음에 대한 완전한 정보를 얻을 수가 없다. 이중자음이나 단모음은 글자 위나 아래 따로 조그맣게 부호를 써서 나타내지만 이런 보조 발음부호는 아랍어를 처음 배우는 학생들이나 어린이를 위한 글, 아랍어 사전, 낭독을 위해 정확한 발음을 나타내야 하는 경전 따위에서만 볼 수 있다. 간혹 비슷한 단어를 구분하기 위해 이중자음을 표시하는 부호를 쓰는 정도이다.

아랍어 발음을 아는 이들은 이중자음과 단모음을 표시하지 않은 글을 보아도 원 발음을 쉽게 짐작할 수 있지만 아랍어를 모르는 입장이라면 글을 보고도 발음을 몰라 답답할 수 밖에 없다. 아랍어 이름을 한글로 표기하려 해도 원 발음을 알려면 이중자음과 단모음까지 부호로 표기한 것을 참고해야 하는데 찾기가 쉽지 않다.

아랍어의 한글 표기 방법은 이미 수년 전 국립국어원에서 마련한 표기 시안이 있다. 당연한 이야기지만 이 표기 시안은 아랍어의 이중자음과 단모음까지 표기에 반영하기 때문에 부호 없이 쓰는 보통 아랍어 표기만 가지고는 적용할 수 없다.

아랍어의 모음 발음이 일정하지 않다는 어려움도 크게 작용한다. 표준 아랍어의 모음은 이론적으로 '아, 이, 우' 셋 뿐이지만 방언마다 실제 나타나는 모음에서는 '에, 오'가 흔히 추가된다. 예를 들어 카타르의 수도 '도하'는 고전 아랍어로는 '다우하(Dawḥa)'이지만 '아우'가 '오'로 단순화되어 발음되기 때문에 '도하'로 알려지는 것이다. 그래서 아랍어 표기 시안은 표준 아랍어의 모음만 인정하며 '에이', '오'로 발음이 관용화된 ay와 aw는 각각 '에이', '오'로 적을 수 있다는 예외를 두었다. 하지만 각 지역의 현실 아랍어 모음이 표준 아랍어와 달라진 예는 이에 그치지 않는다.

정부 언론 외래어 심의 공동위원회 제88차 회의(2009년 12월 3일)에서는 모로코인 Nawal El Moutawakel (نوال المتوكل‎)의 표기를 '나왈 엘무타와켈'로 정했다. 표준 아랍어 모음을 확인하기가 어려워서였는지 몰라도 표준 아랍어 모음을 따르는 것은 포기하고 로마자 표기에 나타난 모로코 현지 발음을 따랐다.

'타슈킬' 시험하기

구글 실험실의 베타 프로젝트 가운데 하나인 '타슈킬'은 발음부호 없이 쓰인 아랍어에 발음부호를 자동적으로 더해주는 도구이다. 사용자들이 구글 실험실에 남긴 덧글들을 보니 아직 오류가 있는 듯하다. 특히 아랍어 문법에 따라 모음이 바뀌는 경우는 자동적으로 나타내기 힘든 모양이다. 하지만 우리가 관심을 가지는 고유명사의 경우는 모음이 바뀌는 경우가 드물 테니 믿어보기로 하자.

예전에 궁금했던 아랍어 이름 가운데 그리스어 '엘레판티네(Ἐλεφαντίνη)'에서 유래하여 영어로는 Elephantine이라고 알려져 있는 이집트의 지명을 입력해 보았다. Elephantine은 나일 강의 섬으로 오늘날 아스완 시의 일부이다. 영어판에서 언어 링크로 들어간 아랍어판 위키백과에 실린 아랍어 표기는 'جزيرة إلفنتين'이다. 아랍 문자를 그대로 로마자로 전사하면 ǧzyra ʾalfntyn이다.

이것을 구글 타슈킬에 입력해봤다. 가운데 창에 아랍어 표기를 복사해서 붙이고 밑의 단추를 누르니 발음부호를 더한 결과가 다음과 같이 나왔다.


아래 큰 글씨가 모음부호를 추가한 표기 'جَزِيْرَة إلْفِنَتَين'이다. 로마자로 전사하면 ǧazīrat ʾilfinatayn이다. 아랍어 표기 시안에 따라 한글로 적으면 '가지라트 일피나타인', 즉 '일피나타인 섬'이다(jeltz님의 지적으로 표기 수정).

여기서 '섬'을 뜻하는 ǧazīra(t)는 로마자 전사 방식에 따라 jazīra가 될 수 있는데 ǧ가 이집트에서는 [g], 다른 곳에서는 보통 [dʒ]로 발음되기 때문이다. 아랍어 표기 시안에서도 이집트 이름에서만 'ㄱ'으로 적고 보통은 'ㅈ'으로 적도록 하고 있다. 카타르의 '알자지라(Aljazeera)' 방송국 이름도 동일한 단어이다. '알'은 아랍어의 정관사이고 '(아라비아) 반도'를 뜻하는 줄임말로 '섬'이란 이름을 쓰는 것이다.

이것은 물론 표준 아랍어 발음을 따른 것이다. 이집트 구어체 발음은 어떨까? 이집트에서는 단모음 i가 [e]가 되고 이중모음 ay는 장모음 ee가 되는 듯하니 이집트 구어체 발음으로는 '엘페나텐(Elfenateen)' 정도가 되지 않을까 추측해보지만 확인할 길이 없다. 사실 표준 발음도 제대로 알아낸 것인지 자신이 없다.

'나왈 엘무타와켈'로도 시험해 보았더니 nawāl al-mutawakkil이 나왔는데 아랍어 표기 시안을 따르면 '나왈 알무타왁킬'이다. 이중자음 kk를 따로 표시하지 않는 기존 관습으로는 '나왈 알무타와킬'이 무난할 것이다.

표준 발음이냐 현지 구어체 발음이냐

아랍어를 한글로 표기할 때 표준 발음과 현지 구어체 발음을 가운데 무엇을 따라야 할까? 아랍어를 공부하는 이들은 표준 아랍어부터 배운다. 또 표준 아랍어는 아랍어권 전역에 통한다는 장점이 있다. 아랍어권에서 교육을 받은 이들은 모두 표준 아랍어를 어느정도 구사할 수 있다.

그러나 실생활에서 쓰는 발음은 현지 구어체 발음이며 다른 문자권에 알려지는 표기도 현지 구어체 발음을 따를 때가 많다. 우리에게 낯익은 아랍어 이름은 현지 구어체 발음을 따른 것이 대부분이다. 이집트의 '나세르', '엘알라메인'은 알아도 '나시르', '알알라마인'은 낯설다. '히즈불라'보다는 '헤즈볼라'가 더 잘 알려져 있다.

그런데 만약 현지 구어체 발음을 따른다고 생각하면 이집트 아랍어, 레반트 아랍어, 사우디아라비아 아랍어, 걸프 아랍어, 이라크 아랍어, 수단 아랍어, 마그레브 아랍어 등 크게 잡은 분류로만해도 만만치 않은 여러 지역 발음을 연구해야 하는 어려움이 있다. 이들 발음에 대한 정보도 찾기 어려울 것이다. 다만 아랍어 이름이 로마자로 표기될 때는 보통 현지 구어체 발음을 따르니 로마자 표기를 참고하여 모음 표기를 따를 수 있을 것이다. 프랑스어권이기도 한 모로코, 알제리, 튀니지, 레바논의 아랍어 이름은 대부분 현지 구어체 발음에 따라 정해진 로마자 표기가 있다.

현재로서는 역사 인명, 종교 용어 등은 표준 발음을 따르고 현지 구어체 발음으로 더 잘 알려진 현대 인명이나 지명은 현지 구어체를 따르는 것이 무난할 것이다. 어느 쪽이든 올바른 발음 정보를 얻는 것이 급선무이다.

덧글

  • 까롤로 2010/08/03 18:35 # 답글

    이 문장 뭔가 깨진 것 같네요..
    >>현재로서는 역사 인명, 종교 용어 등은 표준 발음을 따르고 등의 현지 구어체 발음으로 더 잘 알려진 이름은 현지 구어체를 따르는 것이 무난할 것이다
  • 끝소리 2010/08/04 02:27 #

    지적 감사합니다. 글을 급히 올린 티가 확 나는군요... 수정하겠습니다.
  • 나그네 2010/08/04 03:10 # 삭제 답글

    헤즈볼라, 탈레반, 모슬렘 같은 발음(표기)은 아랍어 방언 발음일 수도 있지만 페르시아어 발음에 바탕을 둬서 그렇다고 볼 수도 있습니다.
    그리고 다른 곳도 그렇지만 알제리와 리비아 고유명사도 참 아리송한 경우가 많죠.
    알제리 Ghardaïa와 Relizane의 경우 초성의 gh와 r가 똑같이 غ을 나타내는데 불어 [ʁ]와 비슷한 발음이라 r로 표기하기도 하는 것이죠.
    리비아 아랍어도 그렇듯이 ق의 표기가 표준 아랍어로 치면 /q/이고 알제리아 리비아 아랍어 발음으로는 /g/라서 로마자 Gaddafi, Qaddafi , 한글 가다피, 카다피 등 혼용이 되고 있습니다.
    영어 매체는 현지음에 가까운 Gaddafi를 선호하고 한국어 매체는 아마도 아랍어 표준어에 따른 표기인 카다피를 선호하는 듯합니다.
    사실 카다피나 가다피나 한국어로는 큰 발음 차이가 없어서 아직 별 문제는 없어 보이는데 앞으로 이쪽의 고유명사가 많이 등장하면 혼란스럽겠죠.
    아마 현재로서는 어차피 모든 고유명사마다 일일이 표기법을 마련하지 않는 한 상당수 언론 출판 관계자가 아랍 문자에 대한 지식을 갖기는 힘들기에 결국 로마자를 기준으로 표기하는 경향이 많을 텐데 표준어 아랍어에 상관 없이 해당 아랍어 방언의 로마자 표기에 대한 한글 표기 기준을 마련하는 것도 방법이라고 봅니다.
  • 끝소리 2010/08/04 04:04 #

    우리가 아는 헤즈볼라는 레바논에 연고를 둔 단체이지만 '헤즈볼라'라는 이름은 말씀대로 페르시아어에서 온 것일 수도 있습니다. 이란에서 '헤즈볼라'라는 이름이 쓰인 적이 있거든요(이 페르시아어 이름도 원래는 아랍어를 차용한 것이지만). '탈레반' 역시 아랍어에서 유래했지만 파슈토어, 다리어 등이 쓰이는 아프가니스탄 이름이니 굳이 표준 아랍어식 표기를 쓸 필요는 없다고 봅니다. '모슬렘'은 영어 표기 Moslem에서 온 듯한데(지금은 Muslim이 선호되는 표기) 영국인들이 인도 쪽에서 접한 당시 페르시아어 발음일 수도 있겠네요.

    Ghardaïa와 Relizane도 흥미로운 경우네요. 제보 감사합니다. 카다피야 이름의 로마자 표기만해도 수십 개가 있을 정도이니... 이처럼 아랍어 방언의 발음에 따른 로마자 표기 기준조차 제대로 마련되지 않았으니 정말 막막합니다. 그래도 말씀하신 것처럼 로마자 표기를 참고로 한글 표기를 정할 수 있도록 일정한 기준을 마련하는 것도 생각해볼 만합니다.
  • RedPain 2010/08/04 06:12 # 답글

    이집트의 '나세르', '엘알라메인'은 알아도 '나시르', '알알라마인'은 낯설다. (X)

    이집트의 '나세르', '엘알라메인'도 낯설고 '나시르', '알알라마인'도 낯설다. (O)

    머... 먹는 건가요? ;;;
  • 끝소리 2010/08/04 06:29 #

    죄.. 죄송... 제가 예를 잘못 고른 겁니다... 아랍어권 이름 가운데 사실 익숙한 것이 많지 않아서요. 더구나 표준 발음과 구어체 발음이 다르고 구어체 발음으로 알려진 것을 고르기가 쉽지 않네요. '오사마 빈라덴/우사마 빈라딘'이 더 잘 알려졌겠지만 테러리스트 이름이라 좀 그렇고... 더 잘 알려진 아랍어 이름은 뭐가 있을까요?
  • RedPain 2010/08/04 19:06 #

    앉아서 곰곰히 생각을 해보니, 알고 있는 아랍 인물이 없군요. 놀랍습니다. (응?) 인물의 이름보다는 지명 같은 것이 좋을 것 같습니다. 아니면 알 자지라 방송이라던가...

    덧. 저의 무식함을 농담으로 승화시켰는데 너무 진지하게 받아들이신 것 같습니다. ;;;;
  • 끝소리 2010/08/05 03:33 #

    농담이셨지만 맞는 말씀이라 진지 모드 돌입한 거죠... 저도 '엘알라메인'이란 이름을 언제 처음 들었더라?
  • jeltz 2010/10/03 18:49 # 답글

    페르시아어에서 학생을 뜻하는 단어인 طالب 은 아랍어에서 나온 단어인데, 페르시아어 발음 특성상 아랍어(talib)과 다르게 '털렙' 으로 발음합니다. 여기에 복수형이 되면 '털레번' 이 되죠.

    근데 어떻게 탈레반으로 변했을까요. 아랍 문자로 طالبان 이라고 쓴 것을 그냥 아랍식으로 읽어서 그렇게 된 것일까요.

    ps : 모음부호대로 읽으면 자지-라트 일 핀타인 같습니다. 함자가 알리프 아래 있으면 이 모음으로 나는걸로 알고 있습니다.
  • 끝소리 2010/10/03 19:57 #

    복잡하게 생각할 것 없이 페르시아어의 ā [ɒː]를 '아'로 옮겨서 '탈레반'이겠죠. '이란', '테헤란'에서처럼 ā 모음은 로마자 표기의 영향으로 '아'로 옮기는 것이 보통입니다.

    화면 캡처에는 함자가 들어가있는데 그 밑에는 제가 함자 없이 الْفِنْتَين이라고 써놓고 로마자와 한글로 옮겼군요. 함자가 있는 표기로 수정하겠습니다. 타슈킬에서 출력된 표기는 إلْفِنَتَين로 함자 외에도 눈 뒤에 수쿤 대신 파트하를 쓰고 있어서 '일피나타인'입니다. 아마 제가 이 글을 준비할 때 이 모음 표기가 이상하다고 생각해서 다른 것들도 찾아보다가 실수로 타슈킬에서 출력한 표기가 아닌 다른 표기를 쓴 것 같습니다. 지적 감사드립니다.

  • jeltz 2010/10/03 20:06 #

    헤에.. 로마자 표기법은 또 그렇군요.
  • hN_ 2011/04/20 21:52 # 답글

    이 글을 보니 아랍-페르시아 사서에서 왜 셀주크를 왜 S.ljūq라고 표기했는지 이해가 가는군요.

    많이 배우고 갑니다.
댓글 입력 영역