3 years ago · 5f1753fb37
--- a/transliterator/tables/data/asian_cyrillic.yml
+++ b/transliterator/tables/data/asian_cyrillic.yml
@@ -0,0 +1,452 @@
 
															+general:
														
 
															+  name: Asian Cyrillic
														
 
															+  inherits: _cyrillic_base
														
 
															+
														
 
															+roman_to_script:
														
 
															+  map:
														
 
															+    # COMMON COMBINING CHARACTERS (always follow a base letter): 
														
 
															+    # combining grave U+0300
														
 
															+    # combining acute U+0301
														
 
															+    # combining circumflex U+0302
														
 
															+    # combining macron U+0304
														
 
															+    # combining breve U+0306
														
 
															+    # combining dot above U+0307
														
 
															+    # combining diaeresis U+0308
														
 
															+    # combining ring above U+030A
														
 
															+    # combining double acute U+030B
														
 
															+    # combining caron (hachek) U+030C
														
 
															+    # combining candrabindu U+0310
														
 
															+    # combining dot below U+0323
														
 
															+    # combining comma below U+0326 (Romanian, Latvian, Livonian)
														
 
															+    # combining cedilla U+0327 (French, Turkish, Azeri)
														
 
															+    # combining ogonek (hook) U+0328 (Polish, Lithuanian)
														
 
															+    # combining left ligature U+FE20 (Cyrillic transliteration)
														
 
															+    # combining right ligature U+FE21 (Cyrillic transliteration)
														
 
															+    # soft sign/prime (spacing) U+02B9(Cyrillic transliteration)
														
 
															+    # hard sign/double prime (spacing) U+02BA (Cyrillic transliteration)
														
 
															+    # ayn(spacing) U+02BB (Semitic and Caucasian languages)
														
 
															+    # alif (spacing) U+02BC (Semitic languages)
														
 
															+    # middle dot (space) U+00B7) (Catalan)
														
 
															+
														
 
															+    # REGULAR LATIN ALPHABETIC CHARACTERS TO BE CONVERTED
														
 
															+
														
 
															+    # CONVERSION OF "I/i" LIGATED TO "A/a" (all capitalization patterns)
														
 
															+    "I\uFE20A\uFE21": "\u042F"
														
 
															+    "I\uFE20a\uFE21": "\u042F"
														
 
															+    "i\uFE20a\uFE21": "\u044F"
														
 
															+    "i\uFE20A\uFE21": "\u044F"
														
 
															+
														
 
															+    # CONVERSION OF "A/a" WITH BREVE (0306)
														
 
															+    "A\u0306": "\u04D8"
														
 
															+    "a\u0306": "\u04D9"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARI LETTER "A/a" WITH BREVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"A\u0306": "\u04D2"
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARC LETTER "A/a" WITH BREVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"a\u0306": "\u04D3"
														
 
															+
														
 
															+    # REMAINING LONE "A/a"
														
 
															+
														
 
															+
														
 
															+    "V\u0307": "\u0474"
														
 
															+    "v\u0307": "\u0475"
														
 
															+
														
 
															+    "Gh": "\u0492"
														
 
															+    "GH": "\u0492"
														
 
															+    "gH": "U=0493"
														
 
															+    "gh": "U=0493"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "A" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"Gh": "\u0494"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "A" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"GH": "\u0494"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "a" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"gH": "\u0495"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "a" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"gh": "\u0495"
														
 
															+
														
 
															+    "G\u0301": "\u0494"
														
 
															+    "g\u0301": "\u0495"
														
 
															+    "G\u0307": "\u049C"
														
 
															+    "g\u0307": "\u049D"
														
 
															+    "G": "\u0413"
														
 
															+    "g": "\u0433"
														
 
															+
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "E/e", SOME WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "I\uFE20E\uFE21\u0304": "\u0464"
														
 
															+    "I\uFE20E\u0304\uFE21": "\u0464"
														
 
															+    "I\uFE20e\uFE21\u0304": "\u0464"
														
 
															+    "I\uFE20e\u0304\uFE21": "\u0464"
														
 
															+    "I\uFE20E\uFE21\u0328": "\u0468"
														
 
															+    "I\uFE20E\u0328\uFE21": "\u0468"
														
 
															+    "I\uFE20e\uFE21\u0328": "\u0468"
														
 
															+    "I\uFE20e\u0328\uFE21": "\u0468"
														
 
															+    "i\uFE20e\uFE21\u0304": "\u0465"
														
 
															+    "i\uFE20e\u0304\uFE21": "\u0465"
														
 
															+    "i\uFE20E\uFE21\u0304": "\u0465"
														
 
															+    "i\uFE20E\u0304\uFE21": "\u0465"
														
 
															+    "i\uFE20e\uFE21\u0328": "\u0469"
														
 
															+    "i\uFE20e\u0328\uFE21": "\u0469"
														
 
															+    "i\uFE20E\uFE21\u0328": "\u0469"
														
 
															+    "i\uFE20E\u0328\uFE21": "\u0469"
														
 
															+    "I\uFE20E\uFE21": "\u0462"
														
 
															+    "I\uFE20e\uFE21": "\u0462"
														
 
															+    "i\uFE20e\uFE21": "\u0463"
														
 
															+    "i\uFE20E\uFE21": "\u0463"
														
 
															+
														
 
															+    # CONVERSION OF "E/e" WITH MACRON (0304), DOT ABOVE (0307), DIAERESIS (0308), OGONEK (0328), & CARON (030C)
														
 
															+    "E\u030C": "\u0462"
														
 
															+    "E\u0304": "\u0404"
														
 
															+    "E\u0307": "\u042D"
														
 
															+    "E\u0308": "\u0401"
														
 
															+    "E\u0328": "\u0466"
														
 
															+    "e\u030C": "\u0463"
														
 
															+    "e\u0304": "\u0454"
														
 
															+    "e\u0307": "\u044D"
														
 
															+    "e\u0308": "\u0451"
														
 
															+    "e\u0328": "\u0467"
														
 
															+
														
 
															+    # CONVERSION OF REMAINING LONE "E/e"
														
 
															+
														
 
															+    "ZH": "\u0416"
														
 
															+    "Zh": "\u0416"
														
 
															+    "zH": "\u0436"
														
 
															+    "zh": "\u0436"
														
 
															+
														
 
															+
														
 
															+    # CONVERSION OF "T/t" LIGATED OR BLENDED WITH "H/h" (all capitalization patterns)
														
 
															+    "T\uFE20H\uFE21": "\u0498"
														
 
															+    "T\uFE20h\uFE21": "\u0498"
														
 
															+    "t\uFE20H\uFE21": "\u0499"
														
 
															+    "t\uFE20h\uFE21": "\u0499"
														
 
															+    "Th": "\u04AA"
														
 
															+    "TH": "\u04AA"
														
 
															+    "tH": "\u04AB"
														
 
															+    "th": "\u04AB"
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "O/o" WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "I\uFE20O\uFE21\u0328": "\u046C"
														
 
															+    "I\uFE20O\u0328\uFE21": "\u046C"
														
 
															+    "I\uFE20o\uFE21\u0328": "\u046C"
														
 
															+    "I\uFE20o\u0328\uFE21": "\u046C"
														
 
															+    "i\uFE20o\uFE21\u0328": "\u046D"
														
 
															+    "i\uFE20o\u0328\uFE21": "\u046D"
														
 
															+    "i\uFE20O\uFE21\u0328": "\u046D"
														
 
															+    "i\uFE20O\u0328\uFE21": "\u046D"
														
 
															+
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "U/u"
														
 
															+    "I\uFE20U\uFE21": "\u042E"
														
 
															+    "I\uFE20u\uFE21": "\u042E"
														
 
															+    "i\uFE20u\uFE21": "\u044E"
														
 
															+    "i\uFE20U\uFE21": "\u044E"
														
 
															+
														
 
															+
														
 
															+    # CONVERSION OF "I/i" WITH MACRON (0304), BREVE (0306), AND CANDRABINDU (0310)
														
 
															+    "I\u0304": "\u0406"
														
 
															+    "I\u0306": "\u0419"
														
 
															+    "I\u0310": "\u0408"
														
 
															+    "i\u0304": "\u0456"
														
 
															+    "i\u0306": "\u0439"
														
 
															+    "i\u0310": "\u0458"
														
 
															+
														
 
															+    # CONVERSION OF REMAINING LONE "I/i"
														
 
															+    "I": "\u0418"
														
 
															+    "i": "\u0438"
														
 
															+
														
 
															+    "J": "\u0496"
														
 
															+    "j": "\u0497"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF AZERI "J" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"J": "\u04B8"
														
 
															+    # DE-ACTIVATED CONVERSION OF AZERI "j" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"J": "\u04B9"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK "J" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"J": "\u04B6"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK "j" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"J": "\u04B7"
														
 
															+
														
 
															+
														
 
															+    "K\uFE20S\uFE21": "\u046E"
														
 
															+    "K\uFE20s\uFE21": "\u046E"
														
 
															+    "k\uFE20s\uFE21": "\u046F"
														
 
															+    "k\uFE20S\uFE21": "\u046F"
														
 
															+    "Q": "\u04A0"
														
 
															+    "q": "\u04A1"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF KHANTY "Q" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"Q": "\u04C3"
														
 
															+    # DE-ACTIVATED CONVERSION OF KHANTY "q" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"q": "\u04C4"
														
 
															+
														
 
															+
														
 
															+
														
 
															+    "N\uFE20G\uFE21": "\u04A2"
														
 
															+    "N\uFE20g\uFE21": "\u04A2"
														
 
															+    "n\uFE20G\uFE21": "\u04A3"
														
 
															+    "n\uFE20g\uFE21": "\u04A3"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "NG/ng" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"N\uFE20G\uFE21": "\u04A4"
														
 
															+    #"N\uFE20g\uFE21": "\u04A4"
														
 
															+    #"n\uFE20G\uFE21": "\u04A5"
														
 
															+    #"n\uFE20g\uFE21": "\u04A5"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF CHUKCHI AND EVENKI "NG/ng" DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"N\uFE20G\uFE21": "\u04C7"
														
 
															+    #"N\uFE20g\uFE21": "\u04C7"
														
 
															+    #"n\uFE20G\uFE21": "\u04C8"
														
 
															+    #"n\uFE20g\uFE21": "\u04C8"
														
 
															+
														
 
															+
														
 
															+    # CONVERION OF "O/o" WITH OR WITHOUT MACRON (0304), LIGATED TO "T/t"
														
 
															+    "O\u0304\uFE20T\uFE21": "\u047E"
														
 
															+    "O\u0304\uFE20t\uFE21": "\u047E"
														
 
															+    "O\uFE20\u0304T\uFE21": "\u047E"
														
 
															+    "O\uFE20\u0304t\uFE21": "\u047E"
														
 
															+    "O\uFE20T\uFE21": "\u047E"
														
 
															+    "O\uFE20t\uFE21": "\u047E"
														
 
															+    "o\u0304\uFE20t\uFE21": "\u047F"
														
 
															+    "o\u0304\uFE20T\uFE21": "\u047F"
														
 
															+    "o\uFE20\u0304t\uFE21": "\u047F"
														
 
															+    "o\uFE20\u0304T\uFE21": "\u047F"
														
 
															+    "o\uFE20t\uFE21": "\u047F"
														
 
															+    "o\uFE20T\uFE21": "\u047F"
														
 
															+
														
 
															+
														
 
															+    # CONVERSION OF "O/o" WITH MACRON(0304)
														
 
															+    "O\u0304": "\u04EA"
														
 
															+    "o\u0304": "\u04EB"
														
 
															+    # CONVERSION OF "O/o" WITH DOT ABOVE (0307) USED IN MOST CENTRAL ASIAN LANGUAGES
														
 
															+    "O\u0307": "\u04E8"
														
 
															+    "o\u0307": "\u04E9"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ, KOMI, AND MARI "O" WITH DOT ABOVE (0307)DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"O\u0307": "\u04E6"
														
 
															+    #"o\u0307": "\u04E7"
														
 
															+
														
 
															+    # CONVERSION OF REMAINING LONE "O/o"
														
 
															+
														
 
															+    "P\uFE20S\uFE21": "\u0470"
														
 
															+    "P\uFE20s\uFE21": "\u0470"
														
 
															+    "p\uFE20s\uFE21": "\u0471"
														
 
															+    "p\uFE20S\uFE21": "\u0471"
														
 
															+
														
 
															+
														
 
															+    "SHCH": "\u0429"
														
 
															+    "SHCh": "\u0429"
														
 
															+    "SHch": "\u0429"
														
 
															+    "Shch": "\u0429"
														
 
															+    "sHCH": "\u0449"
														
 
															+    "shCH": "\u0449"
														
 
															+    "shcH": "\u0449"
														
 
															+    "shch": "\u0449"
														
 
															+
														
 
															+    "sH": "\u0448"
														
 
															+
														
 
															+    "T\uFE20S\uFE21\u0307": "\u04B4"
														
 
															+    "T\uFE20S\u0307\uFE21": "\u04B4"
														
 
															+    "T\uFE20s\uFE21\u0307": "\u04B4"
														
 
															+    "T\uFE20s\u0307\uFE21": "\u04B4"
														
 
															+    "t\uFE20S\uFE21\u0307": "\u04B5"
														
 
															+    "t\uFE20S\u0307\uFE21": "\u04B5"
														
 
															+    "t\uFE20s\uFE21\u0307": "\u04B5"
														
 
															+    "t\uFE20s\u0307\uFE21": "\u04B5"
														
 
															+
														
 
															+    "T\uFE20S\uFE21": "\u0426"
														
 
															+    "T\uFE20s\uFE21": "\u0426"
														
 
															+    "t\uFE20s\uFE21": "\u0446"
														
 
															+    "t\uFE20S\uFE21": "\u0446"
														
 
															+
														
 
															+    # CONVERSION OF "U/u" WITH MACRON(0304), BREVE (0306), AND DOT ABOVE (0307)
														
 
															+    "U\u0304": "\u04B0"
														
 
															+    "u\u0304": "\u04B1"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK LETTER DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"U\u0304": "\u04EE"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK LETTER DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"U\u0304": "\u04EF"
														
 
															+
														
 
															+    "U\u0306": "\u040E"
														
 
															+    "u\u0306": "\u0454"
														
 
															+    "U\u0307": "\u04AE"
														
 
															+    "u\u0307": "\u04AF"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARI LETTER "O/o" WITH DOT ABOVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"U\u0307": "\u04E6"
														
 
															+    #"u\u0307": "\u04E7"
														
 
															+
														
 
															+    # CONVERSION OF ESKIMO AND KARAKALPAK "W/w" THAT MAPS TO THE SAME CHARACTERS AS "U/u" WITH BREVE
														
 
															+    "W": "\u040E"
														
 
															+    "w": "\u0454"
														
 
															+
														
 
															+
														
 
															+    "F\u0307": "\u0472"
														
 
															+    "f\u0307": "\u0473"
														
 
															+
														
 
															+    "cH": "\u0447"
														
 
															+
														
 
															+    # CONVERSION OF CYRILLIC PALOCHKA (ASPIRATION SIGN) USED IN MANY CENTRAL ASIAN LANGUAGES (NOT NORMALLY INITIALLY)
														
 
															+    "H\u0307": "\u04BA"
														
 
															+    "h\u0307": "\u04BB"
														
 
															+
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK AND UZBEK LETTER "H/h" WITH DOT ABOVE (0307) DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"H\u0307": "\u04B2"
														
 
															+    #"h\u0307": "\u04B3"
														
 
															+    # DE-ACTIVATED CONVERSION OF ARCHAIC LETTER "H/h" WITH DOT ABOVE (0307) DUE TO CONFLICTING ROMANIZATION
														
 
															+    #"H\u0307": "\u04FC"
														
 
															+    #"h\u0307": "\u04FD"
														
 
															+
														
 
															+    "Y\u0307": "\u04F8"
														
 
															+    "y\u0307": "\u04F9"
														
 
															+
														
 
															+    "Y": "\u042B"
														
 
															+    "y": "\u044B"
														
 
															+
														
 
															+    "\u0027": "\u044C"
														
 
															+    # this conversion is ambiguous - \u044C is also theoretically possible
														
 
															+    "\u02BA": "\u044A"
														
 
															+
														
 
															+script_to_roman:
														
 
															+  map:
														
 
															+    "\u044F": "i\uFE20a\uFE21"
														
 
															+    "\u04D8": "A\u0306"
														
 
															+    "\u04D9": "a\u0306"
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARI LETTER "A/a" WITH BREVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04D2": "A\u0306"
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARC LETTER "A/a" WITH BREVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04D3": "a\u0306"
														
 
															+    "\u0474": "V\u0307"
														
 
															+    "\u0475": "v\u0307"
														
 
															+    "\u0492": "Gh"
														
 
															+    "U": "0493=gh"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "A" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u0494": "Gh"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "a" WITH DIAERSIS DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u0495": "gh"
														
 
															+    "\u0494": "G\u0301"
														
 
															+    "\u0495": "g\u0301"
														
 
															+    "\u049C": "G\u0307"
														
 
															+    "\u049D": "g\u0307"
														
 
															+    "\u0413": "G"
														
 
															+    "\u0433": "g"
														
 
															+    # CONVERION OF "I/i" LIGATED TO "E/e", SOME WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "\u0464": "I\uFE20E\uFE21\u0304"
														
 
															+    "\u0468": "I\uFE20E\uFE21\u0328"
														
 
															+    "\u0465": "i\uFE20e\uFE21\u0304"
														
 
															+    "\u0469": "i\uFE20e\uFE21\u0328"
														
 
															+    "\u0462": "I\uFE20E\uFE21"
														
 
															+    "\u0463": "i\uFE20e\uFE21"
														
 
															+    # CONVERSION OF "E/e" WITH MACRON (0304), DOT ABOVE (0307), DIAERESIS (0308), OGONEK (0328), & CARON (030C)
														
 
															+    "\u0404": "E\u0304"
														
 
															+    "\u042D": "E\u0307"
														
 
															+    "\u0401": "E\u0308"
														
 
															+    "\u0466": "E\u0328"
														
 
															+    "\u0454": "e\u0304"
														
 
															+    "\u044D": "e\u0307"
														
 
															+    "\u0451": "e\u0308"
														
 
															+    "\u0467": "e\u0328"
														
 
															+    "\u0416": "Zh"
														
 
															+    "\u0436": "zh"
														
 
															+    # CONVERSION OF "T/t" LIGATED OR BLENDED WITH "H/h" (all capitalization patterns)
														
 
															+    "\u0498": "T\uFE20H\uFE21"
														
 
															+    "\u0499": "t\uFE20h\uFE21"
														
 
															+    "\u04AA": "Th"
														
 
															+    "\u04AB": "th"
														
 
															+    # CONVERION OF "I/i" LIGATED TO "O/o" WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "\u046C": "I\uFE20O\uFE21\u0328"
														
 
															+    "\u046D": "i\uFE20o\uFE21\u0328"
														
 
															+    # CONVERION OF "I/i" LIGATED TO "U/u"
														
 
															+    "\u044E": "i\uFE20u\uFE21"
														
 
															+    # CONVERSION OF "I/i" WITH MACRON (0304), BREVE (0306), AND CANDRABINDU (0310)
														
 
															+    "\u0406": "I\u0304"
														
 
															+    "\u0408": "I\u0310"
														
 
															+    "\u0456": "i\u0304"
														
 
															+    "\u0458": "i\u0310"
														
 
															+    # CONVERSION OF REMAINING LONE "I/i"
														
 
															+    "\u0418": "I"
														
 
															+    "\u0438": "i"
														
 
															+    "\u0496": "J"
														
 
															+    "\u0497": "j"
														
 
															+    # DE-ACTIVATED CONVERSION OF AZERI "J" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04B8": #"J"
														
 
															+    # DE-ACTIVATED CONVERSION OF AZERI "j" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04B9": #"J"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK "J" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04B6": #"J"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK "j" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04B7": #"J"
														
 
															+    "\u0445": "kh"
														
 
															+    "\u046E": "K\uFE20S\uFE21"
														
 
															+    "\u046F": "k\uFE20s\uFE21"
														
 
															+    "\u04A0": "Q"
														
 
															+    "\u04A1": "q"
														
 
															+    # DE-ACTIVATED CONVERSION OF KHANTY "Q" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04C3": "Q"
														
 
															+    # DE-ACTIVATED CONVERSION OF KHANTY "q" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04C4": "q"
														
 
															+    "\u04A2": "N\uFE20G\uFE21"
														
 
															+    "\u04A3": "n\uFE20g\uFE21"
														
 
															+    # DE-ACTIVATED CONVERSION OF YAKUT "NG/ng" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04A4": #"N\uFE20G\uFE21"
														
 
															+    "\u04A5": #"n\uFE20g\uFE21"
														
 
															+    # DE-ACTIVATED CONVERSION OF CHUKCHI AND EVENKI "NG/ng" DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04C7": #"N\uFE20G\uFE21"
														
 
															+    "\u04C8": #"n\uFE20g\uFE21"
														
 
															+    # CONVERION OF "O/o" WITH OR WITHOUT MACRON (0304), LIGATED TO "T/t"
														
 
															+    "\u047E": "O\u0304\uFE20T\uFE21"
														
 
															+    "\u047F": "o\u0304\uFE20t\uFE21"
														
 
															+    # CONVERSION OF "O/o" WITH MACRON(0304)
														
 
															+    "\u04EA": "O\u0304"
														
 
															+    "\u04EB": "o\u0304"
														
 
															+    # CONVERSION OF "O/o" WITH DOT ABOVE (0307) USED IN MOST CENTRAL ASIAN LANGUAGES
														
 
															+    "\u04E8": "O\u0307"
														
 
															+    "\u04E9": "o\u0307"
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ, KOMI, AND MARI "O" WITH DOT ABOVE (0307)DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04E6": #"O\u0307"
														
 
															+    "\u04E7": #"o\u0307"
														
 
															+    # CONVERSION OF REMAINING LONE "O/o"
														
 
															+    "\u0470": "P\uFE20S\uFE21"
														
 
															+    "\u0471": "p\uFE20s\uFE21"
														
 
															+    "\u04B4": "T\uFE20S\uFE21\u0307"
														
 
															+    "\u04B5": "t\uFE20s\uFE21\u0307"
														
 
															+    "\u0426": "T\uFE20S\uFE21"
														
 
															+    "\u0446": "t\uFE20s\uFE21"
														
 
															+    # CONVERSION OF "U/u" WITH MACRON(0304), BREVE (0306), AND DOT ABOVE (0307)
														
 
															+    "\u04B0": "U\u0304"
														
 
															+    "\u04B1": "u\u0304"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK LETTER DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04EE": #"U\u0304"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK LETTER DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04EF": #"U\u0304"
														
 
															+    "\u040E": "U\u0306"
														
 
															+    "\u0454": "u\u0306"
														
 
															+    "\u04AE": "U\u0307"
														
 
															+    "\u04AF": "u\u0307"
														
 
															+    # DE-ACTIVATED CONVERSION OF GAGAUZ AND MARI LETTER "O/o" WITH DOT ABOVE DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04E6": #"U\u0307"
														
 
															+    "\u04E7": #"u\u0307"
														
 
															+    # CONVERSION OF ESKIMO AND KARAKALPAK "W/w" THAT MAPS TO THE SAME CHARACTERS AS "U/u" WITH BREVE
														
 
															+    "\u040E": "W"
														
 
															+    "\u0454": "w"
														
 
															+    "\u0472": "F\u0307"
														
 
															+    "\u0473": "f\u0307"
														
 
															+    "\u0444": "f"
														
 
															+    "\u0427": "Ch"
														
 
															+    # CONVERSION OF CYRILLIC PALOCHKA (ASPIRATION SIGN) USED IN MANY CENTRAL ASIAN LANGUAGES (NOT NORMALLY INITIALLY)
														
 
															+    "\u04BA": "H\u0307"
														
 
															+    "\u04BB": "h\u0307"
														
 
															+    # DE-ACTIVATED CONVERSION OF TAJIK AND UZBEK LETTER "H/h" WITH DOT ABOVE (0307) DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04B2": "H\u0307"
														
 
															+    "\u04B3": "h\u0307"
														
 
															+    # DE-ACTIVATED CONVERSION OF ARCHAIC LETTER "H/h" WITH DOT ABOVE (0307) DUE TO CONFLICTING ROMANIZATION
														
 
															+    "\u04FC": "H\u0307"
														
 
															+    "\u04FD": "h\u0307"
														
 
															+    "\u04F8": "Y\u0307"
														
 
															+    "\u04F9": "y\u0307"
														
 
															+    "\u042B": "Y"
														
 
															+    "\u044B": "y"
														
 
															+    # this conversion is ambiguous - \u044C is also theoretically possible
														
 
															+    "\u044A": "\u02BA"
														
 
															+
														
--- a/transliterator/tables/data/bulgarian.yml
+++ b/transliterator/tables/data/bulgarian.yml
@@ -0,0 +1,55 @@
 
															+general:
														
 
															+  name: Bulgarian
														
 
															+  inherits: _cyrillic_base
														
 
															+
														
 
															+roman_to_script:
														
 
															+  map:
														
 
															+    "G": "\u0413"
														
 
															+    "g": "\u0433"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "ZH": "\u0416"
														
 
															+    "Zh": "\u0416"
														
 
															+    "zh": "\u0436"
														
 
															+    "I\uFE20E\uFE21": "\u0462"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "I\uFE20e\uFE21": "\u0462"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "I": "\u0418"
														
 
															+    "i\uFE20e\uFE21": "\u0463"
														
 
															+    "i": "\u0438"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "SHT": "\u0429"
														
 
															+    "Sht": "\u0429"
														
 
															+    "sht": "\u0449"
														
 
															+    "T\uFE20S\uFE21": "\u0426"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "T\uFE20s\uFE21": "\u0426"
														
 
															+    "t\uFE20s\uFE21": "\u0446"
														
 
															+    "U\u0310": "\u046A"
														
 
															+    "u\u0306": "\u044A"
														
 
															+    "u\u0310": "\u046B"
														
 
															+    # this conversion is ambiguous - \u042A is also theoretically possible
														
 
															+    "\u02BA": "\u044A"
														
 
															+
														
 
															+script_to_roman:
														
 
															+  map:
														
 
															+    "\u044C": ""
														
 
															+    "\u042C": ""
														
 
															+    "\u044A": ""
														
 
															+    "\u042A%": "u\u0306"
														
 
															+    "\u042A": ""
														
 
															+    "\u0413": "G"
														
 
															+    "\u0433": "g"
														
 
															+    "\u0416": "Zh"
														
 
															+    "\u0436": "zh"
														
 
															+    "\u0462": "I\uFE20E\uFE21"
														
 
															+    "\u0418": "I"
														
 
															+    "\u0463": "i\uFE20e\uFE21"
														
 
															+    "\u0438": "i"
														
 
															+    "\u0429": "Sht"
														
 
															+    "\u0449": "sht"
														
 
															+    "\u0426": "T\uFE20S\uFE21"
														
 
															+    "\u0446": "t\uFE20s\uFE21"
														
 
															+    "\u046A": "U\u0310"
														
 
															+    "\u046B": "u\u0310"
														
--- a/transliterator/tables/data/church_slavonic.yml
+++ b/transliterator/tables/data/church_slavonic.yml
@@ -0,0 +1,209 @@
 
															+general:
														
 
															+  name: Church Slavonic
														
 
															+  inherits: _cyrillic_base
														
 
															+
														
 
															+roman_to_script:
														
 
															+  map:
														
 
															+    # CONVERSION OF "I/i" LIGATED TO "A/a" (all capitalization patterns)
														
 
															+    "i\uFE20A\uFE21": "\u044F"
														
 
															+
														
 
															+    "V\u0307": "\u0474"
														
 
															+    "v\u0307": "\u0475"
														
 
															+
														
 
															+    "G\u0301": "\u0494"
														
 
															+    "g\u0301": "\u0495"
														
 
															+    "G": "\u0413"
														
 
															+    "g": "\u0433"
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "E/e", SOME WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "I\uFE20E\uFE21\u0304": "\u0464"
														
 
															+    "I\uFE20E\u0304\uFE21": "\u0464"
														
 
															+    "I\uFE20e\uFE21\u0304": "\u0464"
														
 
															+    "I\uFE20e\u0304\uFE21": "\u0464"
														
 
															+    "I\uFE20E\uFE21\u0328": "\u0468"
														
 
															+    "I\uFE20E\u0328\uFE21": "\u0468"
														
 
															+    "I\uFE20e\uFE21\u0328": "\u0468"
														
 
															+    "I\uFE20e\u0328\uFE21": "\u0468"
														
 
															+    "i\uFE20e\uFE21\u0304": "\u0465"
														
 
															+    "i\uFE20e\u0304\uFE21": "\u0465"
														
 
															+    "i\uFE20E\uFE21\u0304": "\u0465"
														
 
															+    "i\uFE20E\u0304\uFE21": "\u0465"
														
 
															+    "i\uFE20e\uFE21\u0328": "\u0469"
														
 
															+    "i\uFE20e\u0328\uFE21": "\u0469"
														
 
															+    "i\uFE20E\uFE21\u0328": "\u0469"
														
 
															+    "i\uFE20E\u0328\uFE21": "\u0469"
														
 
															+    "I\uFE20E\uFE21": "\u0462"
														
 
															+    "I\uFE20e\uFE21": "\u0462"
														
 
															+    "i\uFE20e\uFE21": "\u0463"
														
 
															+    "i\uFE20E\uFE21": "\u0463"
														
 
															+
														
 
															+    # CONVERSION OF "E/e" WITH MACRON (0304), DOT ABOVE (0307), DIAERESIS (0308), OGONEK (0328), & CARON (030C)
														
 
															+    "E\u030C": "\u0462"
														
 
															+    "E\u0304": "\u0404"
														
 
															+    "E\u0307": "\u042D"
														
 
															+    "E\u0308": "\u0401"
														
 
															+    "E\u0328": "\u0466"
														
 
															+    "e\u030C": "\u0463"
														
 
															+    "e\u0304": "\u0454"
														
 
															+    "e\u0307": "\u044D"
														
 
															+    "e\u0308": "\u0451"
														
 
															+    "e\u0328": "\u0467"
														
 
															+
														
 
															+    "ZH": "\u0416"
														
 
															+    "Zh": "\u0416"
														
 
															+    "zH": "\u0436"
														
 
															+    "zh": "\u0436"
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "O/o" WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "I\uFE20O\uFE21\u0328": "\u046C"
														
 
															+    "I\uFE20O\u0328\uFE21": "\u046C"
														
 
															+    "I\uFE20o\uFE21\u0328": "\u046C"
														
 
															+    "I\uFE20o\u0328\uFE21": "\u046C"
														
 
															+    "i\uFE20o\uFE21\u0328": "\u046D"
														
 
															+    "i\uFE20o\u0328\uFE21": "\u046D"
														
 
															+    "i\uFE20O\uFE21\u0328": "\u046D"
														
 
															+    "i\uFE20O\u0328\uFE21": "\u046D"
														
 
															+
														
 
															+    # CONVERION OF "I/i" LIGATED TO "U/u"
														
 
															+    "i\uFE20U\uFE21": "\u044E"
														
 
															+
														
 
															+    # CONVERSION OF "I/i" WITH MACRON (0304) AND BREVE (0306)
														
 
															+    "I\u0304": "\u0406"
														
 
															+    "i\u0304": "\u0456"
														
 
															+
														
 
															+    # CONVERSION OF REMAINING LONE "I/i"
														
 
															+    "I": "\u0418"
														
 
															+    "i": "\u0438"
														
 
															+
														
 
															+    "kH": "\u0445"
														
 
															+
														
 
															+    "K\uFE20S\uFE21": "\u046E"
														
 
															+    "K\uFE20s\uFE21": "\u046E"
														
 
															+    "k\uFE20s\uFE21": "\u046F"
														
 
															+    "k\uFE20S\uFE21": "\u046F"
														
 
															+
														
 
															+    # CONVERION OF "O/o" WITH OR WITHOUT MACRON (0304), LIGATED TO "T/t"
														
 
															+    "O\u0304\uFE20T\uFE21": "\u047E"
														
 
															+    "O\u0304\uFE20t\uFE21": "\u047E"
														
 
															+    "O\uFE20\u0304T\uFE21": "\u047E"
														
 
															+    "O\uFE20\u0304t\uFE21": "\u047E"
														
 
															+    "O\uFE20T\uFE21": "\u047E"
														
 
															+    "O\uFE20t\uFE21": "\u047E"
														
 
															+    "o\u0304\uFE20t\uFE21": "\u047F"
														
 
															+    "o\u0304\uFE20T\uFE21": "\u047F"
														
 
															+    "o\uFE20\u0304t\uFE21": "\u047F"
														
 
															+    "o\uFE20\u0304T\uFE21": "\u047F"
														
 
															+    "o\uFE20t\uFE21": "\u047F"
														
 
															+    "o\uFE20T\uFE21": "\u047F"
														
 
															+
														
 
															+    # CONVERSION OF "O/o" WITH MACRON(0304) AND OGONEK (0328)
														
 
															+    "O\u0328": "\u046A"
														
 
															+    "o\u0328": "\u046B"
														
 
															+    "O\u0304": "\u0460"
														
 
															+    "o\u0304": "\u0461"
														
 
															+
														
 
															+    "P\uFE20S\uFE21": "\u0470"
														
 
															+    "P\uFE20s\uFE21": "\u0470"
														
 
															+    "p\uFE20s\uFE21": "\u0471"
														
 
															+    "p\uFE20S\uFE21": "\u0471"
														
 
															+
														
 
															+    "SHT": "\u0429"
														
 
															+    "SHt": "\u0429"
														
 
															+    "Sht": "\u0429"
														
 
															+    "sHT": "\u0449"
														
 
															+    "shT": "\u0449"
														
 
															+    "sht": "\u0449"
														
 
															+
														
 
															+    "sH": "\u0448"
														
 
															+
														
 
															+    "T\uFE20S\uFE21": "\u0426"
														
 
															+    "T\uFE20s\uFE21": "\u0426"
														
 
															+    "t\uFE20s\uFE21": "\u0446"
														
 
															+    "t\uFE20S\uFE21": "\u0446"
														
 
															+
														
 
															+    "U\u0304": "\u0478"
														
 
															+    "u\u0304": "\u0479"
														
 
															+
														
 
															+    "F\u0307": "\u0472"
														
 
															+    "f\u0307": "\u0473"
														
 
															+
														
 
															+    "cH": "\u0447"
														
 
															+
														
 
															+    "Y\u0307": "\u0476"
														
 
															+    "y\u0307": "\u0477"
														
 
															+    "Y": "\u042B"
														
 
															+    "y": "\u044B"
														
 
															+
														
 
															+    # this conversion is ambiguous - \u042C is also theoretically possible
														
 
															+    "\u0027": "\u044C"
														
 
															+    # this conversion is ambiguous - \u044C is also theoretically possible
														
 
															+    "\u02BA": "\u044A"
														
 
															+
														
 
															+script_to_roman:
														
 
															+  map:
														
 
															+    # CONVERSION TO "I/i" LIGATED TO "A/a"
														
 
															+    "\u0474": "V\u0307"
														
 
															+    "\u0475": "v\u0307"
														
 
															+    "\u0494": "G\u0301"
														
 
															+    "\u0495": "g\u0301"
														
 
															+    "\u0413": "G"
														
 
															+    "\u0433": "g"
														
 
															+    # CONVERION TO "I/i" LIGATED TO "E/e" WITH DIACRITICS
														
 
															+    "\u0464": "I\uFE20E\uFE21\u0304"
														
 
															+    "\u0468": "I\uFE20E\uFE21\u0328"
														
 
															+    "\u0465": "i\uFE20e\uFE21\u0304"
														
 
															+    "\u0469": "i\uFE20e\uFE21\u0328"
														
 
															+    # CONVERSION TO "E/e" WITH MACRON (0304), DOT ABOVE (0307), DIAERESIS (0308), OGONEK (0328), & CARON (030C)
														
 
															+    "\u0462": "E\u030C"
														
 
															+    "\u0404": "E\u0304"
														
 
															+    "\u042D": "E\u0307"
														
 
															+    "\u0401": "E\u0308"
														
 
															+    "\u0466": "E\u0328"
														
 
															+    "\u0463": "e\u030C"
														
 
															+    "\u0454": "e\u0304"
														
 
															+    "\u044D": "e\u0307"
														
 
															+    "\u0451": "e\u0308"
														
 
															+    "\u0467": "e\u0328"
														
 
															+    "\u0416": "Zh"
														
 
															+    "\u0436": "zh"
														
 
															+    # CONVERION T0 "I/i" LIGATED TO "O/o" WITH MACRON (0304) AND OGONEK (0328)
														
 
															+    "\u046C": "I\uFE20O\uFE21\u0328"
														
 
															+    "\u046D": "i\uFE20o\uFE21\u0328"
														
 
															+    # CONVERION TO "I/i" LIGATED TO "U/u"
														
 
															+    # CONVERSION TO "I/i" WITH MACRON (0304) AND BREVE (0306)
														
 
															+    "\u0406": "I\u0304"
														
 
															+    "\u0456": "i\u0304"
														
 
															+    # CONVERSION TO LONE "I/i"
														
 
															+    "\u0418": "I"
														
 
															+    "\u0438": "i"
														
 
															+    "\u046E": "K\uFE20S\uFE21"
														
 
															+    "\u046F": "k\uFE20s\uFE21"
														
 
															+    # CONVERION TO "O/o" WITH MACRON (0304) LIGATED TO "T/t"
														
 
															+    "\u047E": "O\uFE20\u0304t\uFE21"
														
 
															+    "\u047F": "o\uFE20\u0304t\uFE21"
														
 
															+    # CONVERSION TO "O/o" WITH MACRON(0304) AND OGONEK (0328)
														
 
															+    "\u046A": "O\u0328"
														
 
															+    "\u046B": "o\u0328"
														
 
															+    "\u0460": "O\u0304"
														
 
															+    "\u0461": "o\u0304"
														
 
															+    # CONVERSION TO LONE "O/o"
														
 
															+    "\u0470": "P\uFE20S\uFE21"
														
 
															+    "\u0471": "p\uFE20s\uFE21"
														
 
															+    "\u0429": "Sht"
														
 
															+    "\u0449": "sht"
														
 
															+    "\u0426": "T\uFE20S\uFE21"
														
 
															+    "\u0446": "t\uFE20s\uFE21"
														
 
															+    "\u0478": "U\u0304"
														
 
															+    "\u0479": "u\u0304"
														
 
															+    "\u0472": "F\u0307"
														
 
															+    "\u0473": "f\u0307"
														
 
															+    "\u0476": "Y\u0307"
														
 
															+    "\u0477": "y\u0307"
														
 
															+    # Uppercase hard sign (ambiguously maps to one Latin character)
														
 
															+    "\u042A": "\u02BA"
														
 
															+    # Lowercase hard sign (ambiguously maps to one Latin character)
														
 
															+    "\u044A": "\u02BA"
														
 
															+    # Uppercase soft sign (ambiguously maps to one Latin character)
														
 
															+    # Lowercase soft sign (ambiguously maps to one Latin character)
														
 
															+    "\u042B": "Y"
														
 
															+    "\u044B": "y"
														
--- a/transliterator/tables/data/index.yml
+++ b/transliterator/tables/data/index.yml
@@ -1,16 +1,29 @@
 
															 # Map index file.
														
 
															 #
														
 
															-# Add all mapping files meant to be used in the app here.
														
 
															+# Configurations not listed here will not show in the UI drop-down menu or
														
 
															+# in the `/languages` endpoint, but can still be used in the `trans` endpoint.
														
 
															 #
														
 
															 # The entry key is the file name without the `.yml` extension, and the `name`
														
 
															 # key within the entry is the human-readable label that can be used in a
														
 
															 # multiple-choice menu.
														
 
															+asian_cyrillic:
														
 
															+  name: Asian Cyrillic
														
 
															+  description: >
														
 
															+    Multi-purpose transliteration for non-Slavic Cyrillic script: Abaza, Abkhaz, Adygei, Aisor, Altai, Avar, Azeri, Balkar, Bashkir, Buryat, Chechen, Chukchi, Chuvash, Dargwa, Dungan, Eskimo, Even, Evenki, Gagauz, Ingush, Inuit, Kabardian, Kalmyk, Karachay, Karachay-Balkar, Karakalpak, Karelian, Kazakh, Khakass, Khanty, Komi, Komi-Permyak, Koryak, Kumyk, Kyrgyz, Lak, Lapp, Lezghian, Lithuanian, Mansi, Mari, Moldovan, Molodstov, Mongolian, Mordvin, Nanai, Nenets, Nivkh, Nogai, Ossetic, Permyak, Romanian, Romany, Selkup, Shor, Tabasaran, Tajik, Tat, Tatar, Turkmen, Tuva, Udekhe, Udmurt, Uzbek, Yakut.
														
 
															 belarusian:
														
 
															   name: Belarusian
														
 
															+bulgarian:
														
 
															+  name: Bulgarian
														
 
															 chinese:
														
 
															   name: Chinese (Hanzi)
														
 
															+church_slavonic:
														
 
															+  name: Church Slavonic
														
 
															+greek:
														
 
															+  name: Greek (classic)
														
 
															 russian:
														
 
															   name: Russian
														
 
															+serbian_macedonian:
														
 
															+  name: Serbian and Macedonian
														
 
															 ukrainian:
														
 
															   name: Ukrainian
														
--- a/transliterator/tables/data/serbian_macedonian.yml
+++ b/transliterator/tables/data/serbian_macedonian.yml
@@ -0,0 +1,82 @@
 
															+general:
														
 
															+  name: Serbian and Macedonian
														
 
															+  inherits: _cyrillic_base
														
 
															+
														
 
															+roman_to_script:
														
 
															+  map:
														
 
															+    "G\u0301": "\u0403"
														
 
															+    "G": "\u0413"
														
 
															+    "g\u0301": "\u0453"
														
 
															+    "g": "\u0433"
														
 
															+    "\u0110": "\u0402"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "DZ\u030C": "\u040F"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "DZ": "\u0405"
														
 
															+    "Dz\u030C": "\u040F"
														
 
															+    "Dz": "\u0405"
														
 
															+    "\u0111": "\u0452"
														
 
															+    "dz\u030C": "\u045F"
														
 
															+    "dz": "\u0455"
														
 
															+    "Z\u030C": "\u0416"
														
 
															+    "z\u030C": "\u0436"
														
 
															+    "z": "\u0437"
														
 
															+    "I": "\u0418"
														
 
															+    "i": "\u0438"
														
 
															+    "J": "\u0408"
														
 
															+    "j": "\u0458"
														
 
															+    "K\u0301": "\u040C"
														
 
															+    "H": "\u0425"
														
 
															+    "k\u0301": "\u045C"
														
 
															+    "h": "\u0445"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "LJ": "\u0409"
														
 
															+    "Lj": "\u0409"
														
 
															+    "lj": "\u0459"
														
 
															+    # this conversion shouldn't be needed, but does no harm
														
 
															+    "NJ": "\u040A"
														
 
															+    "Nj": "\u040A"
														
 
															+    "nj": "\u045A"
														
 
															+    "S\u030C": "\u0428"
														
 
															+    "s\u030C": "\u0448"
														
 
															+    "C\u0301": "\u040B"
														
 
															+    "C\u030C": "\u0427"
														
 
															+    "C": "\u0426"
														
 
															+    "c\u0301": "\u045B"
														
 
															+    "c\u030C": "\u0447"
														
 
															+    "c": "\u0446"
														
 
															+
														
 
															+script_to_roman:
														
 
															+  map:
														
 
															+    "\u0403": "G\u0301"
														
 
															+    "\u0413": "G"
														
 
															+    "\u0453": "g\u0301"
														
 
															+    "\u0433": "g"
														
 
															+    "\u0402": "\u0110"
														
 
															+    "\u0452": "\u0111"
														
 
															+    "\u0416": "Z\u030C"
														
 
															+    "\u0436": "z\u030C"
														
 
															+    "\u0405": "Dz"
														
 
															+    "\u0455": "dz"
														
 
															+    "\u0418": "I"
														
 
															+    "\u0438": "i"
														
 
															+    "\u0408": "J"
														
 
															+    "\u0458": "j"
														
 
															+    "\u040C": "K\u0301"
														
 
															+    "\u0425": "H"
														
 
															+    "\u045C": "k\u0301"
														
 
															+    "\u0445": "h"
														
 
															+    "\u0409": "Lj"
														
 
															+    "\u0459": "lj"
														
 
															+    "\u040A": "Nj"
														
 
															+    "\u045A": "nj"
														
 
															+    "\u0428": "S\u030C"
														
 
															+    "\u0448": "s\u030C"
														
 
															+    "\u040B": "C\u0301"
														
 
															+    "\u0426": "C"
														
 
															+    "\u045B": "c\u0301"
														
 
															+    "\u0446": "c"
														
 
															+    "\u0427": "C\u030C"
														
 
															+    "\u0447": "c\u030C"
														
 
															+    "\u040F": "Dz\u030C"
														
 
															+    "\u045F": "dz\u030C"
														
--- a/transliterator/trans.py
+++ b/transliterator/trans.py
@@ -163,8 +163,8 @@ def transliterate(src, lang, r2s=False):
 
															             # No match found. Copy non-mapped character (one at a time).
														
 
															             logger.info(
														
 
															-                f"Token {src[ctx.cur]} at position {ctx.cur} is not mapped."
														
 
															-            )
														
 
															+                    f"Token {src[ctx.cur]} (\\u{hex(ord(src[ctx.cur]))[2:]})"
														
 
															+                    f"at position {ctx.cur} is not mapped.")
														
 
															             ctx.dest_ls.append(src[ctx.cur])
														
 
															             ctx.cur += 1
														
 
															         else: