한글-한자(漢字) 변환사전의 오류를 확인하다, 처음으로 리브레오피스(LibreOffice)에 기여(寄與)/공헌(貢獻)[Contribution]을 하였습니다.

저는 2018년 5월 19일, LibreOffice프로젝트에 소스코드에 기여을 해보았습니다.

올해 초, 저는 Apache Foundation(아파치 재단) Open Office(오픈오피스)와 TDF(The Document Foundation, 문서재단)의 Libre Office(리브레오피스)에 탑재된 한글-한자(漢字)변환 목록의 내용에 상당히 잘못된 내용이 들어갔다는 것을 인지하였습니다.

안녕(安寧)하세요(means “Hello” in Korean, reads “annyeonghaseyo” in Korean)의 ()이 “암”에 들어가는 것을 확인하였습니다.

즉, ‘(an)’으로 읽는 한자 ‘(), 岸(),(),(),(),(),(), (),(), (),(), (), (), 喭(안), (),(), (), ()’에 대한 음이 LibreOffice에서는 ‘암(am)’으로 처리되고 있었다는 심각한 문제를 발견하였습니다.

LibreOffice에서 “녕(寧)하세요”의 ‘안(安, an)’의 한자 변환시 오류가 있음을 확인. ‘안(an)’음에 대한 한자 목록이 아예 존재하지 않음.
LibreOffice에서 “녕(寧)하세요”의 ‘안(安, an)’이 ‘암(am)’음으로 들어간 오류를 확인. ‘안(an)’음에 대한 한자들이 ‘암(am)’음으로 들어감을 확인하였음.

그리고 “선(Seon)”으로 읽는 한자들이 “긍(Geung)”으로 들어가는 경우도 보았습니다.

실제로 읽는 한자음들 목록 (),(),(),(), (),(),(),(), ()

예시) 생님(生님) — means ’teacher’, reads ‘seon-shaeng-nim’ in Korean.
경부(京釜) — means ‘Railway line from Seoul to Busan in Korea.’ reads ‘Gyeongbuseon’ in Korean.
(朝) — means ‘Korea’, reads ‘Joseon’ in Korean
칠요주(七曜周) means ‘ Revolution of seven yaos’, reads ‘chil-yo-ju-seon’ in Korean. etc.

LibreOffice에서 ‘선(Seon)’에 대한 한자음 목록이 없음을 확인하였습니다.

LibreOffice에서 “생(生)님”의 ‘()’의 한자 변환시 오류가 있음을 확인. ‘(seon)’음에 대한 한자 목록이 아예 존재하지 않음.

현재의 LibreOffice에서 ‘선(Seon)’이라는 음을 가진 한자가 긍(先), 긍(線), 긍(鮮), 긍(仙), 긍(善), 긍(船), 긍(選), 긍(宣), 긍(旋) 으로 변하는 것을 확인하였습니다.

LibreOffice에서 “선생(先生)님”의 ‘선(先, Seon)’이 ‘긍(Geung)’음으로 들어간 오류를 확인. ‘선(Seon)’음에 대한 한자들이 ‘긍(Geung)’음으로 들어감을 확인하였음.

추가로, (), (), (),()이란 한자가 ‘’으로 읽는 경우가 있습니다.

우(于)

[] — 출처: http://encykorea.aks.ac.kr/Contents/Item/E0032595

갈월여귀재(曷月予歸哉)

위와 같이 한자음이 여러 개가 존재하는 경우에 대한 내용도 추가를 하였습니다. 그리고 측(昃)이 ‘치’로 적혀있는 오류도 수정하였습니다.

일월영(日月盈)

LibreOffice에서 “측(昃, Cheuk)” 한자 변환시 오류가 있음을 확인. ‘측(Cheuk)’ 한자 목록에 ‘’이 존재하지 않고 ‘치(Chi)’에 존재함을 확인.

추가로 조선 개국공신, 여진족(女眞族)/만주족(滿洲族) 출신, 이지란(李之蘭)의 여진족(女眞族)/만주족(滿洲族) 이름인 퉁두란(佟豆蘭/佟豆蘭帖木兒)의 퉁(佟)도 없는 것도 확인하였습니다.

추가로, 즙(汁)에 대한 한자음 누락도 확인하였습니다.

LibreOffice에서 “즙(汁)” 한자 변환시 오류가 있음을 확인. ‘즙’ 한자 목록에 汁이 존재하지 않음.

다음은 즙(汁)에 대한 한자낱말 예시입니다.

(液)
(무)
(밤)
(잣)
(茶)
물(물)

‘즙’에 대한 음을 가진 한자 누락도 추가하였습니다.

그리고 Windows 와 libhangul에서 사용하는 한자 목록을 참고로 누락한 한자음을 추가하였습니다.

한글-한자(漢字)변환 목록확인 LibreOffice의 commit 로그를 확인해보니

First commit: 2003/06/05 18:43:02 khong 1.2.20.1: #110060# add tow characters in Hangul/Hanja conversion (Rüdiger Timm committed on 12 Jun 2003 )

2003년에 khong이라는 닉네임을 사용하는 분께서 최초의 커밋을 하였다고 나와있습니다.

커밋 링크: https://gerrit.libreoffice.org/gitweb?p=core.git;a=commitdiff;h=f6457669fad023cdf1f7d5f249e29c2eb6b41bb9

즉 2003년도에 잘못된 내용이 들어간 커밋내용이, 2018년 현재까지 적용되는 것을 확인하였습니다.

저는 2018년 1월 부터 5월 19일까지 한국 한자음 목록이 잘못된걸 검사를 하였습니다.

그러면서, 2018년 4월 21일 토요일, 친구결혼식으로 서울(Seoul, Korea)청량리역(淸凉里驛)에서 경상북도 안동시(慶尙北道 安東市, Andong city, Gyeongsangbuk-do Province, Korea)의 안동역(安東驛)가는 기차에서 한자(漢字)목록 오류를 열심히 수정하기도 하였습니다.

2018년 4월 21일 토요일, 청량리역(淸凉里驛)에서 안동역(安東驛)까지 가는 열차 안에서 열심히 한자(漢字) 목록을 수정

몇 개월간 수정 작업한 결과, 최종본 작업 완료를 하였습니다.

작업한 내용을 바탕으로 LibreOffice의 소스코드에 제출을 하였습니다.

소스 코드 제출 내용: https://gerrit.libreoffice.org/#/c/54562/

Add and fixed missing Korean Hanja sound Updated Hangul/Hanja conversion dictionary on LibreOffice

ref1: 韓国の人名用漢字表のテキスト版 https://srad.jp/~yasuoka/journal/589283/

ref2: Proposal to add kKoreanName and kKoreanNameVariant to the Unihan Database https://www.unicode.org/L2/L2017/17084-korean-name-var.pdf

ref3: Libhangul’s hanja.txt(Hangul-Hanja conversion char&words dictionary) https://github.com/choehwanjin/libhangul/blob/master/data/hanja/hanja.txt

수정된 파일 비교: https://gerrit.libreoffice.org/#/c/54562/2/i18npool/source/textconversion/data/hhc_char.dic

LibreOffice Gerrit 화면 (QA완료) https://gerrit.libreoffice.org/#/c/54562/

LibreOffice Gerrit 화면 (QA완료) https://gerrit.libreoffice.org/#/c/54562/

다음의 링크는 기존 LibreOffice의 한글-한자 변환사전과 제가 수정한 한글-한자 변환 사전의 비교입니다.

This link is diff between LibreOffice’s hangul-hanja conversion dictionary file with existing errors (Left) and I fixed it(Right). https://www.diffchecker.com/sNeNdLEe

— — — — — — — — — — — — — -

한국 한자음(韓國漢字音)에 대해 참고한 내용은 다음과 같습니다.

韓国の人名用漢字表のテキスト版(한국의 인명용한자의 텍스트판) https://srad.jp/~yasuoka/journal/589283/

Proposal to add kKoreanName and kKoreanNameVariant to the Unihan Database https://www.unicode.org/L2/L2017/17084-korean-name-var.pdf

Libhangul’s hanja.txt(Hangul-Hanja conversion char&words dictionary) https://github.com/choehwanjin/libhangul/blob/master/data/hanja/hanja.txt

LibreOffice Korean Team

LibreOffice Korean Team News

DaeHyun Sung(성대현,成大鉉,ソン・デヒョン)

Written by

LibreOffice Korean Team,GNU,KDE Contributor,GNOME Foundation Member, My native language is Korean(한국어) My hobby is Learning Language(English,中國語(繁體中文,简体中文),日本語)

LibreOffice Korean Team

LibreOffice Korean Team News

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade