Browse Source

Fix FKR119.

scossu 1 year ago
parent
commit
3986680b70
2 changed files with 230 additions and 227 deletions
  1. 225 224
      scriptshifter/hooks/korean/data.yml
  2. 5 3
      scriptshifter/hooks/korean/romanizer.py

+ 225 - 224
scriptshifter/hooks/korean/data.yml

@@ -4203,230 +4203,231 @@ fkr118:
   - "희종"
 
 fkr119:
-  - "사우디아라비아"
-  - "오스트레일리아"
-  - "투르크메니스탄"
-  - "리히텐슈타인"
-  - "마다가스카르"
-  - "미크로네시아"
-  - "부르키나파소"
-  - "세인트루시아"
-  - "아랍에미리트"
-  - "아제르바이잔"
-  - "아프가니스탄"
-  - "앤티가바부다"
-  - "우즈베키스탄"
-  - "코트디부아르"
-  - "키르기즈스탄"
-  - "파푸아뉴기니"
-  - "기니비사우"
-  - "나이지리아"
-  - "라이베리아"
-  - "룩셈부르크"
-  - "리투아니아"
-  - "마케도니아"
-  - "말레이시아"
-  - "모리타니아"
-  - "몬테네그로"
-  - "바베이도스"
-  - "방글라데시"
-  - "베네주엘라"
-  - "스와질랜드"
-  - "스코틀랜드"
-  - "슬로바키아"
-  - "슬로베니아"
-  - "시에라리온"
-  - "아르메니아"
-  - "아르헨티나"
-  - "아이슬란드"
-  - "에리트레아"
-  - "에스토니아"
-  - "에티오피아"
-  - "엘살바도르"
-  - "오세아니아"
-  - "오스트리아"
-  - "우크라이나"
-  - "인도네시아"
-  - "카보베르데"
-  - "카자흐스탄"
-  - "코스타리카"
-  - "크로아티아"
-  - "타지키스탄"
-  - "가이아나"
-  - "과테말라"
-  - "그레나다"
-  - "그루지야"
-  - "나미비아"
-  - "네덜란드"
-  - "노르웨이"
-  - "뉴질랜드"
-  - "니카라과"
-  - "도미니카"
-  - "라트비아"
-  - "루마니아"
-  - "모리셔스"
-  - "모잠비크"
-  - "바누아투"
-  - "벨로루시"
-  - "보스니아"
-  - "보츠와나"
-  - "볼리비아"
-  - "불가리아"
-  - "브루나이"
-  - "산마리노"
-  - "세르비아"
-  - "소말리아"
-  - "스리랑카"
-  - "시베리아"
-  - "아메리카"
-  - "아일랜드"
-  - "아프리카"
-  - "알바니아"
-  - "에콰도르"
-  - "온두라스"
-  - "우루과이"
-  - "유라시아"
-  - "이스라엘"
-  - "이탈리아"
-  - "잉글랜드"
-  - "자메이카"
-  - "짐바브웨"
-  - "캄보디아"
-  - "콜롬비아"
-  - "쿠웨이트"
-  - "키리바시"
-  - "키프로스"
-  - "타일랜드"
-  - "탄자니아"
-  - "파라과이"
-  - "파키스탄"
-  - "포르투갈"
-  - "감비아"
-  - "고구려"
-  - "고조선"
-  - "그리스"
-  - "나우루"
-  - "니게르"
-  - "대가야"
-  - "덴마크"
-  - "라오스"
-  - "러시아"
-  - "레바논"
-  - "레소토"
-  - "르완다"
-  - "리비아"
-  - "말라위"
-  - "멕시코"
-  - "모나코"
-  - "모로코"
-  - "몰도바"
-  - "몰디브"
-  - "미얀마"
-  - "바레인"
-  - "바하마"
-  - "베트남"
-  - "벨기에"
-  - "벨리즈"
-  - "부룬디"
-  - "브라질"
-  - "사모아"
-  - "세네갈"
-  - "세이셸"
-  - "소가야"
-  - "솔로몬"
-  - "수리남"
-  - "스웨덴"
-  - "스위스"
-  - "스페인"
-  - "시리아"
-  - "싱가폴"
-  - "아시아"
-  - "아이티"
-  - "안도라"
-  - "알제리"
-  - "앙골라"
-  - "요르단"
-  - "우간다"
-  - "웨일즈"
-  - "이라크"
-  - "이집트"
-  - "잠비아"
-  - "지부티"
-  - "카메룬"
-  - "카타르"
-  - "캐나다"
-  - "코모로"
-  - "투발루"
-  - "튀니지"
-  - "티모르"
-  - "파나마"
-  - "팔라우"
-  - "폴란드"
-  - "프랑스"
-  - "핀란드"
-  - "필리핀"
-  - "헝가리"
-  - "코리아"
-  - "코리안"
-  - "코리언"
-  - "가나"
-  - "가봉"
-  - "가야"
-  - "고려"
-  - "기니"
-  - "네팔"
-  - "대만"
-  - "독일"
-  - "동양"
-  - "말리"
-  - "말타"
-  - "몽고"
-  - "몽골"
-  - "미국"
-  - "발해"
-  - "백제"
-  - "베냉"
-  - "부탄"
-  - "북한"
-  - "서양"
-  - "소련"
-  - "신라"
-  - "영국"
-  - "예멘"
-  - "유럽"
-  - "일본"
-  - "조선"
-  - "중국"
-  - "차드"
-  - "체코"
-  - "칠레"
-  - "케냐"
-  - "콩고"
-  - "쿠바"
-  - "태국"
-  - "터키"
-  - "토고"
-  - "통가"
-  - "페루"
-  - "피지"
-  - "한국"
-  - "호주"
-
-fkr119_suffix:
-  - "말"
-  - "인"
-  - "제"
-  - "어"
-  - "학"
-  - "사"
-  - "식"
-  - "산"
-  - "령"
-  - "행"
-  - "군"
-  - "계"
-  - "화"
-  - "적"
+  word:
+    - "사우디아라비아"
+    - "오스트레일리아"
+    - "투르크메니스탄"
+    - "리히텐슈타인"
+    - "마다가스카르"
+    - "미크로네시아"
+    - "부르키나파소"
+    - "세인트루시아"
+    - "아랍에미리트"
+    - "아제르바이잔"
+    - "아프가니스탄"
+    - "앤티가바부다"
+    - "우즈베키스탄"
+    - "코트디부아르"
+    - "키르기즈스탄"
+    - "파푸아뉴기니"
+    - "기니비사우"
+    - "나이지리아"
+    - "라이베리아"
+    - "룩셈부르크"
+    - "리투아니아"
+    - "마케도니아"
+    - "말레이시아"
+    - "모리타니아"
+    - "몬테네그로"
+    - "바베이도스"
+    - "방글라데시"
+    - "베네주엘라"
+    - "스와질랜드"
+    - "스코틀랜드"
+    - "슬로바키아"
+    - "슬로베니아"
+    - "시에라리온"
+    - "아르메니아"
+    - "아르헨티나"
+    - "아이슬란드"
+    - "에리트레아"
+    - "에스토니아"
+    - "에티오피아"
+    - "엘살바도르"
+    - "오세아니아"
+    - "오스트리아"
+    - "우크라이나"
+    - "인도네시아"
+    - "카보베르데"
+    - "카자흐스탄"
+    - "코스타리카"
+    - "크로아티아"
+    - "타지키스탄"
+    - "가이아나"
+    - "과테말라"
+    - "그레나다"
+    - "그루지야"
+    - "나미비아"
+    - "네덜란드"
+    - "노르웨이"
+    - "뉴질랜드"
+    - "니카라과"
+    - "도미니카"
+    - "라트비아"
+    - "루마니아"
+    - "모리셔스"
+    - "모잠비크"
+    - "바누아투"
+    - "벨로루시"
+    - "보스니아"
+    - "보츠와나"
+    - "볼리비아"
+    - "불가리아"
+    - "브루나이"
+    - "산마리노"
+    - "세르비아"
+    - "소말리아"
+    - "스리랑카"
+    - "시베리아"
+    - "아메리카"
+    - "아일랜드"
+    - "아프리카"
+    - "알바니아"
+    - "에콰도르"
+    - "온두라스"
+    - "우루과이"
+    - "유라시아"
+    - "이스라엘"
+    - "이탈리아"
+    - "잉글랜드"
+    - "자메이카"
+    - "짐바브웨"
+    - "캄보디아"
+    - "콜롬비아"
+    - "쿠웨이트"
+    - "키리바시"
+    - "키프로스"
+    - "타일랜드"
+    - "탄자니아"
+    - "파라과이"
+    - "파키스탄"
+    - "포르투갈"
+    - "감비아"
+    - "고구려"
+    - "고조선"
+    - "그리스"
+    - "나우루"
+    - "니게르"
+    - "대가야"
+    - "덴마크"
+    - "라오스"
+    - "러시아"
+    - "레바논"
+    - "레소토"
+    - "르완다"
+    - "리비아"
+    - "말라위"
+    - "멕시코"
+    - "모나코"
+    - "모로코"
+    - "몰도바"
+    - "몰디브"
+    - "미얀마"
+    - "바레인"
+    - "바하마"
+    - "베트남"
+    - "벨기에"
+    - "벨리즈"
+    - "부룬디"
+    - "브라질"
+    - "사모아"
+    - "세네갈"
+    - "세이셸"
+    - "소가야"
+    - "솔로몬"
+    - "수리남"
+    - "스웨덴"
+    - "스위스"
+    - "스페인"
+    - "시리아"
+    - "싱가폴"
+    - "아시아"
+    - "아이티"
+    - "안도라"
+    - "알제리"
+    - "앙골라"
+    - "요르단"
+    - "우간다"
+    - "웨일즈"
+    - "이라크"
+    - "이집트"
+    - "잠비아"
+    - "지부티"
+    - "카메룬"
+    - "카타르"
+    - "캐나다"
+    - "코모로"
+    - "투발루"
+    - "튀니지"
+    - "티모르"
+    - "파나마"
+    - "팔라우"
+    - "폴란드"
+    - "프랑스"
+    - "핀란드"
+    - "필리핀"
+    - "헝가리"
+    - "코리아"
+    - "코리안"
+    - "코리언"
+    - "가나"
+    - "가봉"
+    - "가야"
+    - "고려"
+    - "기니"
+    - "네팔"
+    - "대만"
+    - "독일"
+    - "동양"
+    - "말리"
+    - "말타"
+    - "몽고"
+    - "몽골"
+    - "미국"
+    - "발해"
+    - "백제"
+    - "베냉"
+    - "부탄"
+    - "북한"
+    - "서양"
+    - "소련"
+    - "신라"
+    - "영국"
+    - "예멘"
+    - "유럽"
+    - "일본"
+    - "조선"
+    - "중국"
+    - "차드"
+    - "체코"
+    - "칠레"
+    - "케냐"
+    - "콩고"
+    - "쿠바"
+    - "태국"
+    - "터키"
+    - "토고"
+    - "통가"
+    - "페루"
+    - "피지"
+    - "한국"
+    - "호주"
+
+  suffix:
+    - "말"
+    - "인"
+    - "제"
+    - "어"
+    - "학"
+    - "사"
+    - "식"
+    - "산"
+    - "령"
+    - "행"
+    - "군"
+    - "계"
+    - "화"
+    - "적"
 
 fkr120:
   - "로스앤젤레스"

+ 5 - 3
scriptshifter/hooks/korean/romanizer.py

@@ -236,7 +236,6 @@ def _romanize_oclc_auto(kor):
     kor = kor.replace("^", " GLOTTAL ")
 
     rom_ls = []
-    # breakpoint()
     for word in kor.split(" "):
         rom_ls.append(_kor_rom(word))
     rom = " ".join(rom_ls)
@@ -403,8 +402,11 @@ def _kor_rom(kor):
             # FKR118
             orig in KCONF["fkr118"] or
             # FKR119
-            orig in KCONF["fkr119"] or
-            orig.endswith(tuple(KCONF["fkr119_suffix"])) or
+            orig in KCONF["fkr119"]["word"] or
+            (
+                orig[:-1] in KCONF["fkr119"]["word"] and
+                orig.endswith(tuple(KCONF["fkr119"]["suffix"]))
+            ) or
             # FKR120
             orig.endswith(tuple(KCONF["fkr120"]))):
         rom = rom[0].upper() + rom[1:]