기계 번역의 정의

category 카테고리 없음 2022. 8. 31. 11:44
728x90
반응형

기계 번역이란?

기계 번역은 인공 지능을 사용하여 사람의 개입 없이 한 언어에서 다른 언어로 텍스트를 자동으로 번역하는 프로세스이다. 현대적 기계 번역은 단순한 단어 대 단어 번역을 넘어 원래 언어 텍스트의 전체 의미를 대상 언어로 전달한다.

 


기계 번역 이점

자동 번역 지원

기계 번역은 전문적인 번역가들에게 좋은 출발점을 제공한다. 번역을 자동으로 실행한 다음, 사후 편집을 위해 번역가에게 보내는 설정이 있다.

속도와 번역량

기계 번역은 거의 즉각적으로 수백만 개의 단어를 번역하면서 매우 빠르게 작동한다. 실시간 채팅이나 대규모 법률 사례와 같은 대량의 데이터를 번역할 수 있다.

다양한 언어 선택

많은 주요 기계 번역 공급자는 50~100개 이상의 언어를 지원한다.

경제적인 번역

기계 번역은 기본적이지만 가치 있는 번역을 제공하여 제공 비용과 시간을 모두 줄이므로 프로세스에 대한 인적 개입이 적게 만든다.


기계 번역 사례

내부 커뮤니케이션

프레젠테이션, 회사 게시판 및 기타 일반적인 커뮤니케이션을 번역하는 데 사용할 수 있다.

외부 커뮤니케이션

예를 들어 글로벌 파트너와 고객을 위해 중요한 문서를 다른 언어로 번역할 수 있으며 여러 국가에서 온라인 스토어를 운영하는 경우 기계 번역을 통해 제품 리뷰를 번역하여 고객이 모국어로 읽게 할 수 있다.

데이터 분석

일부 기계 번역 유형의 경우 사용자가 작성한 수백만 개의 댓글을 처리하고 단시간 내에 매우 정확한 결과를 제공할 수 있다.

온라인 고객 서비스

브랜드는 기계 번역을 통해 사용하는 언어에 관계없이 전 세계 고객과 상호 작용할 수 있다.

  • 전 세계 고객의 요청을 정확하게 번역
  • 라이브 채팅 규모 확대 및 고객 서비스 이메일 자동화
  • 직원을 추가로 고용하지 않고도 고객 경험 향상

법률 정보의 조사

법무 부서는 다른 나라에서 법률 문서를 준비하기 위해 기계 번역을 사용한다.

 

기계 번역의 역사

인간의 언어를 번역하는 데 컴퓨터를 사용하자는 아이디어는 1950년대 초에 처음 등장하였고 초기 시스템의 능력을 뛰어넘는 엄청난 데이터 처리 성능과 스토리지가 필요했다.
2000년대 초, 컴퓨터 소프트웨어, 데이터, 하드웨어의 발달로 기본적인 기계 번역이 가능해졌으며 초기 개발자들은 텍스트를 번역하도록 컴퓨터를 훈련시키는 데 여러 언어의 통계적 데이터베이스를 사용했다.

 

기계 번역 접근방식

기계 번역에서 원본 텍스트 또는 언어를 소스 언어라고 하며,  번역본을 만들려는 대상 언어를 타겟 언어라고 합니다. 기계 번역은 기본적인 2단계 프로세스에 따라 작동한다.

  1. 원본 텍스트의 소스 언어 의미 디코딩
  2. 의미를 타겟 언어로 인코딩

규칙 기반 기계 번역

언어 전문가들이 특정 산업이나 주제에 맞는 내장된 언어 규칙과 2개국어 언어 사전을 개발한다.

  1. 기계 번역 소프트웨어가 입력 텍스트를 구문 분석하고 전환 표현 생성
  2. 문법 규칙과 사전을 참조로 사용하여 표현을 타겟 언어로 변환

장점과 단점

규칙 기반 기계 번역은 특정 산업 또는 주제에 맞게 사용자 지정할 수 있다.
예측 가능하며 양질의 번역을 제공합니다. 하지만 소스 텍스트에 오류가 있거나 내장된 사전에 없는 단어가 사용된 경우 결과가 좋지 않다. 이를 개선하는 유일한 방법은 사전을 정기적으로 수동으로 업데이트하는 방법이 있다.

통계적 기계 번역

통계적 기계 번역은 언어 규칙에 의존하는 대신 기계 학습을 사용하여 텍스트를 번역한다.
기계 학습 알고리즘은 이미 존재하는 많은 양의 인간 번역을 분석하고 통계적 패턴을 찾는다.
그리고 새로운 소스 텍스트를 번역하라는 요청을 받으면 소프트웨어가 지능적으로 추론한다.
특정 단어나 구가 타겟 언어에서 다른 단어나 구와 함께 있을 것이라는 통계적 확률에 기초하여 예측한다.

구문 기반 기계 번역

구문 기반 기계 번역은 통계적 기계 번역의 하위 범주이다.
문법적 규칙을 사용하여 통사 단위를 번역한다.
문장을 분석하여 구문 규칙을 통계 번역 모델에 통합한다.

장점과 단점

통계적 방법에서는 모든 언어 쌍에 대해 수백만 개의 단어를 훈련해야 한다.
하지만 데이터가 충분하면 기계 번역이 정확하다.

신경망 기계 번역

신경망 기계 번역은 인공 지능을 사용하여 언어를 배우고 신경망이라는 특정 기계 학습 방법을 사용하여 지식을 지속적으로 개선한다.
통계적 번역 방법과 함께 작동하는 경우가 많다.

신경망

신경망은 인간의 뇌를 본떠 만든 서로 연결된 일련의 노드로 이루어져 있다.
입력 데이터가 서로 연결된 여러 노드를 통과하면서 출력을 생성하는 정보 시스템이다.
신경망 기계 번역 소프트웨어는 신경망을 사용하여 방대한 데이터 세트를 처리한다.
각 노드는 출력 노드에서 최종 결과를 제공할 때까지 소스 텍스트를 타겟 텍스트로 한 번씩 변경한다.

신경망 기계 번역 vs 다른 번역 방법

신경망은 출력 문장을 생성할 때 각 단계에서 전체 입력 문장을 분석한다.
반면 다른 기계 번역 모델의 경우 입력 문장을 단어와 구 세트로 분할하여 대상 언어의 단어 또는 문장에 매핑한다.
신경망 기계 번역 시스템은 다른 방법의 많은 한계를 해결할 수 있으며 더 나은 품질의 번역을 생산하는 경우가 많다.

하이브리드 기계 번역

하이브리드 기계 번역 도구는 단일 소프트웨어에서 두 개 이상의 기계 번역 모델을 사용합니다. 하이브리드 방식을 사용하여 단일 변환 모델의 효과를 개선할 수 있다. 
이 기계 번역 프로세스에서는 일반적으로 규칙 기반 및 통계적 기계 번역 하위 시스템을 사용한다. 최종 번역 출력은 모든 하위 시스템의 출력을 조합한 것이다.

장점과 단점

하이브리드 기계 번역 모델은 단일 번역 방법과 관련된 문제를 극복하여 번역 품질을 효과적으로 개선한다.

728x90
반응형