687__ 파파고, 딮엘(DeepL), 챗GPT 번역기 비교


687__파파고, 딮엘, L(DeepL), GPT 번역기 ---16ok

뚱보강사 이기성



    687__ 파파고, 딮엘(DeepL), GPT 번역기 비교



페북 친구 Masaya Kobatake 교수에게 질문을 했다. 페이스북의 일본어-한국어 번역이 이상해서였다. 페이스북에서 해준 코바타케 교수의 일본어 글을 한국어로 번역한 문장에 난데없는 매미가 등장했기 때문이다. Would you please, teach me... Which translation is right? number(1) or number(2)? (1)번은 facebook's interpretation이다. Masaya Kobatake “仮住まい坂川沿いに見頃2023.3.21.)。내가 사는 강가에 피어있는 매미를 본 때(2023.3.21.).이 번역 문장을 일본어로 바꾸어 보면 んでいる川沿いにいている’(2023.3.21.)라는 다른 문장이 된다When I saw the cicadas along the river where I live (2023.3.21.).


(2)번은 독일 업체의 번역기인 딮L(deepl)의 번역이다. “仮住まい坂川沿いに見頃2023.3.21..” 가설주택의 사카가와 강변의 벚꽃이 절정(2023.3.21.). Cherry blossoms along the Saka River at the temporary residence (2023.3.21.) L의 번역문에는 매미가 안 나온다. 페이스북의 일본어-한국어 번역이 잘못되었던 것이다. 기계 번역을 사용하면 반드시 사후 번역된 문장(용어 및 문맥)을 확인을 하여야 한다. 엉뚱한 실수가 종종 나타나기 때문이다.



     “DeepL이 할 수 있는 것


[ITWORLD]Andrea Modersohn, Jasmin Nesbigall2023411, <<COMPUTERWOCHE>>“DeepL이 할 수 있는 것, 전성기 맞은 기계 번역의 가능성과 한계에 대한 글을 썼다. 기계 번역(Machine Translation)이 신기술은 아니다. 이미 1960년대부터 논의되어 온 주제이다. 초기에는 주로 연구 분야에서 다루어지다가, 구글 번역이 등장해 종종 의도치 않게 재미있는 결과를 만들어 내면서 미디어에서도 관심을 두게 됐다. 그리고 2016년에 신경망 기계 번역을 적용할 수 있는 획기적인 발전이 이루어졌고, 대상 언어와 서비스 등 여러 요소가 빠르게 발전했다. 사용자는 무료로 제공되는 기계 번역 시스템에 어떤 텍스트라도, 심지어 오피스 파일 형식이나 아래아-한글 문장을 입력하고, 몇 초 안에 결과를 받을 수 있다. 기계 번역은 국제적인 프로세스를 간소화하고 콘텐츠를 전 세계에 빠르게 배포하기 위해 다양한 비즈니스 시스템에 통합되고 있다.

--- 기계 번역의 함정... 기계 번역을 하고는 반드시 사후 편집필요... "영어라면, DeepL이면 충분합니다." 시간과 비용을 고려해야 하는 기업은 이제 공식적인 업무 커뮤니케이션에도 이런 번역 툴을 사용한다. 하지만 현재까지 프레젠테이션과 문서, 기술이나 제품 관련 텍스트를 오류 없이 일관성 있게 번역하는 데 성공한 기계 번역 시스템은 아직 없다. 따라서 이들 툴을 도구를 사용하는 데는 몇 가지 위험이 따른다.

많은 사용자가 잘 알고 있는 영어도 마찬가지지만, 특히 모르는 언어, 즉 확인할 수 없는 언어로 작성된 텍스트에는 더욱 위험하다. 심각한 오역이 발생할 수 있다. 애플리케이션과 프로덕션에서 발생하는 오류의 확실한 원인이 되기도 한다. 기계 번역의 주요 함정은 다음과 같다. 작고, 때로는 미묘한 실수. 생략된 부정사나 잘못된 참조, 번역되지 않거나 판타지 용어로 전달되는 알 수 없는 단어. 이런 실수는 흔히 바로 드러나지 않지만, 문맥과 의미가 달라지게 만든다. 때때로 문장의 일부가 생략되거나 텍스트가 마음대로 추가되는데, 특히 완전히 생소한 외국어에서는 눈에 띄지 않는 경우가 있다. 원본의 텍스트에서는 바로 알아볼 수 없는 강제 줄바꿈. 하지만 기계 번역 시스템에서는 문맥이 바뀐다. 기계 번역 시스템은 텍스트의 각 부분을 의미 있는 방식으로 번역하려고 시도한다.

데이터 보호 규칙의 의도치 않은 무시. 사용자는 무료로 제공되는 기계 번역 시스템에 모든 것을 무심코 입력한다. 하지만 이렇게 입력된 텍스트는 재교육과 학습에 사용될 수 있도록 저장된다. 그러나, 내부 정보, 연구 결과, 특허 출원 등의 경우에는 심각해질 수 있다. 텍스트에 특정 기술 용어가 많이 포함될수록 일반 기계 번역 시스템에는 적합하지 않다. 물론, 일부 시스템에서는 용어집 형태로 용어 명세를 구현할 수 있지만, 용어를 준비해야 하고, 무엇보다도 처음부터 구체적인 명세가 필요하다. 대부분 시스템은 단순히 "학습된 대로" 번역하기 때문에 기업의 기대에 부응하지 못할 수도 있다. 전문용어는 반드시 확인해야 한다. 재현성 부족. 무료 기계 번역 시스템은 지속적으로 학습하기 때문에 오늘과 내일의 번역이 다르다. 따라서 6개월 후 개정으로 인해 다시 번역이 필요할 때 기업의 문서가 다르게 출력될 수 있다. 언어별 차이. 기계 번역 시스템은 일부 언어에 대해서는 좋은 결과를 제공하지만, 어떤 언어에는 거의 사용할 수 없다. 학습 말뭉치의 크기(사용 가능한 학습 데이터의 양)와 언어의 복잡성에 따라 기계 번역 솔루션 업체마다 다른 결과를 생성할 수 있다.

기계 번역은 원본 텍스트에 모호한 부분이 있으면, 입력 텍스트에 대해 통계적으로 가장 가능성이 높은 번역을 제공한다. , 추측한다. 영어로 성 중립적인 단어인 Teacher의 경우, 독일어 번역을 위해서는 남성형 Lehrer와 여성형 Lehrerin을 구분해야 한다. 초등학교라면 Lehrerin, 중고등학교는 Lehrer를 선택하는 것이 보통인데, 이런 식의 성 편향이나 전통적인 역할 모델, 차별은 다양성과 개방성을 중시하는 기업에서는 상당한 문제 요소가 된다.



     딮엘(DeepL)과 시스트랜(Systran)


기계 번역 솔루션인 DeepLSystran을 비교한다. DeepL은 비교 평가 대부분에서 1위를 차지했다. DeepL은 빠르게 학습하며 기본 버전을 무료로 사용할 수 있다. 현재 2개의 영어와 2개의 포르투갈어(각각 영국과 미국, 포르투갈과 브라질용)를 포함하여 29개 언어를 지원하며, 유럽에 서버를 둔 독일 업체이다. 데이터 보안은 유료 구독 방식인 프로 버전에서만 보장된다.

Systran 번역기는 40년 동안 지속적으로 발전해 온 솔루션으로, '전문가를 위한 번역 툴'로 자리매김하고 있다. 시스트랜은 중계 언어인 영어를 제외한 다양한 언어를 지원하며, 사용자는 개별적으로 학습을 시키거나 특정 주제 텍스트로 학습된 영역 특화 기계 번역을 이용할 수 있다. 시스트랜과 비슷한 솔루션으로는 칸탄MT, 글로벌리즈, 텍스트셔틀, 틸드 등이 있다. 기존 번역 업계에서 등장한 기계 번역 시스템도 있다. 이들 시스템은 주요 CAT(Computer-Aided Translation) 툴에 직접 통합해 전 세계의 번역가가 바로 사용할 수 있는 것이 특징이다.



     파파고, 딮엘, GPT 비교


독일의 딮엘(deepL) 번역기, 네이버의 파파고(papago) 번역기, 미국의 인공지능 개발사 오픈에이아이(OpenAI)가 개발한 대화 전문 인공지능 챗봇인 챗GPT에 간단한 한글 문장을 입력시키고 번역 결과를 받아보았다. 입력된 문장은 월간 <<뉴스메이커>> 20236월호의 <2023 한국을 이끄는 혁신리더> 부분이었다.


--- 한글 입력... <2023 한국을 이끄는 혁신리더>-20236

이기성 한국전자출판교육원 원장

정체성 살린 출판학계의 발전을 선도하다

월간 <<뉴스메이커>> 20236월호


첫째 줄 ‘2023 한국을 이끄는 혁신리더-1. 딮엘 번역기는 <2023 Korea's Innovation Leaders>, -2. 네이버의 파파고는 <2023 Innovation Leader Leading Korea>, -3. GPT<2023 Leading Innovation in Korea>로 번역했다.

둘째 줄 이기성 한국전자출판교육원 원장-1. 딮엘 번역기는 고유명사 이기성(Lee ‘Ki’-sung)Lee ‘Ji’-sung으로. ‘(Ki)’‘Ji’로 번역했음. 고유명사 한국전자출판교육원 원장(Director of eBook Academy)’‘President of Korea Electronic Publishing Education Center’로 번역. -2. 파파고는 ‘Lee Ki-sung, director of the Korea Electronic Publishing Education Center’, -3. GPT‘Lee Ki-sung, Director of Korea Electronic Publishing Education Institute’로 번역함.


셋째 줄 정체성 살린 출판학계의 발전을 선도하다-1. 딮엘 번역기는 ‘Leading the development of publishing academia with identity’로 번역. -2. 파파고는 ‘lead the development of publishing academia by utilizing one's identity’, -3. GPT‘Leading the development of an identity-oriented publishing industry’로 번역했다.

-1. 딮엘 번역기 <2023 딮엘 번역기는> - June 2023

Lee Ji-sung, President of Korea Electronic Publishing Education Center

Leading the development of publishing academia with identity

Monthly <<Newsmaker>> June 2023


-2. 파파고 <2023 Innovation Leader Leading Korea> - June 2023

Lee Ki-sung, director of the Korea Electronic Publishing Education Center lead the development of publishing academia by utilizing one's identity Monthly <<News Maker>> June 2023 Issue


-3. GPT에 입력. “아래 문장을 영어로 번역해주시면 감사하겠습니다.”

<2023 Leading Innovation in Korea> - June 2023

Lee Ki-sung, Director of Korea Electronic Publishing Education Institute Leading the development of an identity-oriented publishing industry. Monthly Magazine 'News Maker' June 2023 issue


--- 한글 입력... [첫째 문단] ‘2의 한글 창제한 한국 출판역사의 산 증인’. -1. 딮엘 번역기는 A living witness to Korea's publishing history who created the second Hangul language.-2. 네이버의 파파고는 Living Witness of Korean Publishing History Created by the Second Hangeul.-3. GPTWitness to the Birth of the Second Hangul and the Living Testimony of Korea's Publishing History.로 번역했다.


[둘째 문단] ‘이기성 한국전자출판교육원장의 행보가 재조명되고 있다. 이기성 원장은 전자출판이라는 획기적인 기술의 도입으로 한국 출판계의 새로운 시대를 연 인물이다. ‘전자출판은 학술용어로 ‘CAP: Computer Aided Publishing’인데, 통역기 3개 모두 ‘electronic publishing’으로 잘못 번역하고 있다. -1. 딮엘 번역기는 The life of Lee Ki-sung, director of the Korea Electronic Publishing Education Center, is being revisited. Dr. Lee started a new era in Korean publishing with the introduction of the groundbreaking technology of electronic publishing.으로 번역. -2. 네이버의 파파고는 Lee Ki-sung, head of the Korea Electronics Publishing Education Center, is re-examining his moves. Director Lee Ki-sung opened a new era in the Korean publishing industry with the introduction of a groundbreaking technology called "electronic publishing."으로 번역. -3. GPTLee Ki-sung, the director of Korea Electronic Publishing Education Institute, is gaining renewed recognition for his achievements. Director Lee is a figure who has ushered in a new era in the Korean publishing industry through the introduction of a groundbreaking technology called "electronic publishing."으로 번역했다.


[셋째 문단] ‘국내 출판계와 인쇄계가 일본 기술의 식민지에서 벗어나도록 한국식 전자출판 시스템 프로그램을 발명했다.’ -1. 딮엘 번역기는 He invented the Korean e-publishing system program to help the Korean publishing and printing industry break free from the colonization of Japanese technology. 로 번역했다. -2. 네이버의 파파고는 The Korean electronic publishing system program was invented so that the domestic publishing and printing industries could escape the Japanese technology colony. -3. GPT‘He invented the Korean-style electronic publishing system program to help the domestic publishing and printing industries break free from the colonization of Japanese technology.’로 번역했다.


[넷째 문단] “이 원장은 전자출판 교육에 중추적 역할을 담당한 전자출판학계의 살아있는 전설이자 한국 출판 역사의 산 증인으로, 출판·인쇄 분야의 한글처리표준코드와 한글통신표준코드의 제정 및 보급을 이끌어내며 제2의 한글을 창제했다는 평가를 받고 있다.” -1. 딮엘 번역기는 Lee is a "living legend" in the field of e-publishing who played a pivotal role in e-publishing education and is a living witness to the history of Korean publishing, and is credited with creating a second Hangul by leading the establishment and dissemination of the Hangul Processing Standard Code and Hangul Communication Standard Code in the publishing and printing fields. 라고 번역했다.

-2. 네이버의 파파고는

Director Lee is a "living legend" of the electronic publishing industry and living witness of Korean publishing history, who played a pivotal role in electronic publishing education, and is said to have created a second Hangul by leading to the establishment and distribution of Hangul processing standard codes and Hangeul communication standard codes in the field of publishing and printing.로 번역. -3. GPTDirector Lee is regarded as a "living legend" in the field of electronic publishing education and a witness to the history of Korean publishing. He is credited with leading the establishment and dissemination of Korean processing standard codes and Korean communication standard codes in the publishing and printing fields, and he has been praised for creating the second Hangul.로 번역했다.


--- 한글 입력... ③​ 1971년 장왕사 편집부 이기성은 동경 TBDC에서 출판연수코오스를 마치고 귀국하여, 출판협회(KOREAN PUBLISHERS ASSOCIATION) 주최로 출판경영자 세미나를 열고서, 일본에서는 이미 대형 컴퓨터를 이용한 CTS 출판 시스템(Computerized Typesetting System Publishing)이 개발되었으니, 우리 한국 출판계도 본격적으로 컴퓨터 공부를 하고 컴퓨터의 도움을 받는 출판 CAP(Computer Aided Publishing) 시스템을 개발하여야 한다고 발표했다.


-3. GPT의 번역 결과이다. In 1971, Lee Ki-sung from the editing department of Changwangsa Publishing returned home after completing publishing training at the Tokyo Book Development Center (TBDC). He then organized a publishing management seminar sponsored by the Korean Publishers Association and declared that since Japan had already developed the Computerized Typesetting System Publishing (CTS) using large computers, the Korean publishing industry should actively study computers and develop a Computer-Aided Publishing (CAP) system that utilizes computer assistance.



[참고] 마사야 코바타케


[참고] 딮엘(deepL), https://www.deepl.com/translator

[참고] Andrea Modersohn, Jasmin Nesbigall, <<COMPUTERWOCHE>>



[참고] 파파고, https://papago.naver.com/

[참고] GPT, https://chat.openai.com/

[참고] <<뉴스메이커>> 20236월호, Monthly Magazine 'News Maker' June 2023 issue.



1,137개의 글
