본문 바로가기

Parsing to BBC News

BBC를 크롤링하여 웹사이트에 뿌리고, 파파고를 이용하여 번역하는 사이트를 만들어보자.

728x90

본인은 영어를 그리 잘하지 못하지만 영어 공부에는 관심이 많다.

코딩을 하다보면 생기는 문제들에 대한 대부분의 답은 영어로 찾을 수 있고, 그나마 찾은 답을 해석하다가 사소한 부분에서 오역이 발생하면 한참을 더 헤매야 하기 때문이다.

 

이때문에 매일 영어 공부를 하고 있는데 주로 듀오링고 를 이용하여 공부하고 있다.

www.duolingo.com/learn

 

무료로 외국어를 배우세요.

게임을 통해 영어를 비롯한 다양한 언어를 배워보세요. 100% 무료로 제공되는, 게임처럼 재미있고 과학적으로 효과가 검증된 언어 학습 앱입니다.

www.duolingo.com

 

 

듀오링고는 단순하다.

영어 문장을 해석하거나, 한글로 된 문장을 영작하는것을 무한하게 반복하는것.

 

물론 번역기와는 차원이 다른 퀄리티에, 하나의 문장을 여러 방식으로 해석할 수 있어 괜히 유료버전이 존재하는것이 아니다.

 

그러나 이것도 어언

 

 

244일째

슬슬 질린다.

영어 공부 자체는 계속 하고 싶지만 질린다.

 

이때문에 조금이나마 재미있게 영어공부를 하고 싶어 웹 어플리케이션을 만들게되었다.

 

이름하야 DuouOLinGo(이상 두오링고)

 

두오링고의 목적은 아래와 같다.

1. 재미있는 문장을 웹에서 가져와 번역함으로써 문장 해석에 재미를 느낄 수 있도록 한다.

2. 국내에서는 보기 힘든 이슈들을 그나마 정기적이고 연속적으로 볼 수 있도록 한다.

 

재미있는 문장은 내 기준으로 이렇다.

1. 4chan 같은 외국의 유머 사이트

2. Reddit javascript section의 Programing Issue

 

즉 두오링고의 요구조건은 아래와 같다.

1. 외국 사이트에서 문장을 크롤링(사실 파싱이 맞다)하여 화면에 표시(파싱)

2. 가져온 문장을 Papago API를 이용하여 번역 후 표시(번역)

3. 번역한 문장을 셔플하여 사용자가 주체적으로 해석할 수 있도록 하는 기능(셔플)

4. 기타 추가적인 기능들은 추후 구현하면 된다.

 

 

우선 이렇게 설계를 하고,

 

무엇을 통해 구현할지는 다음에 써보도록 한다.

 

 

 

 

728x90