대학원 생활을 하며, 필수적으로 많은 논문들을 접하게 되었습니다.

 

대부분의 논문은 PDF형식으로 제공되었고, 대개의 경우 스캔하여 제공하는 이미지를 PDF로 변환한 형식이었기 때문에 이를 인용하는데는 많은 애를 먹을 수 밖에 없었습니다.

 

처음 대학원에 입학했을 때는 효율성이란 생각할 수 없었기에 논문을 다운 받아 프린트해서 읽기에 급급했고, 정리하기 위해서는 한글이나 워드를 이용하여 일일히 타이핑할 수 밖에 없었습니다.

 

일명 '노가다'라고 불릴 수 밖에 없는 작업이긴 하지만, 더디가더라도 단단히 딛어보고 가야한다는 생각에 많은 시간을 여기에 쏟았습니다.

 

하지만 처음 대학원을 입학한 뒤 지금까지 6년여의 시간이 지났고, 이제 다음 달이면 7년째가 됩니다. 이에 따라 논문을 읽는 방식도 많이바뀌었습니다.

처음에 프린트해서 읽었던 논문도 이제는 태블릿을 이용하여 편하게 읽을 수 있게되었습니다.

그래도 오랜 시간이 지난 뒤라 나름의 효율성을 생각하게 된 것입니다.

 

하지만 여전히 골치 아픈 것이 있습니다. 바로 'OCR'입니다. 최근 제공되는 논문들은 OCR작업이 되어 있는 경우가 있지만, 오래전에 나온 논문의 경우에는 위에 말씀드린바와 같이 스캔한 이미지로 PDF를 만든 것이기 때문에 논문을 읽기 위해서는 별도로 OCR작업을 해주는 것이 필수 아닌 필수작업이 되었습니다.

 

OCR이란?

 

그래서 인터넷에서 블로그와 카페를 뒤져가며 여러 후기를 읽은 끝에 OCR로 유명한 프로그램으로 만나게 된 것이 바로 "ABBYY FineReader"입니다. 

 

ABBYY FineReader는 OCR, ICR, 데이터 / 문서 캡처 솔루션 전문 기업으로 유명한 러시아 ABBYY사에서 만든 프로그램으로, 다국어로 작성된 파일도 설정을 통해 완벽하게 OCR작업을 할 수 있습니다.

(제품을 만든 곳의 본사가 해외라 접근이 어려울 거라는 고민도 있었지만, 다행히 국내에서는 (주)ReTIA를 통해서 만나볼 수 있습니다.)

 

 

 

또한 반갑게도 올해 초에 ABBYY FineReader 14버전이 출시되었고, 이는 올인원 컨셉으로 OCR프로그램에 접목되어 이미지의 텍스트를 편집할 수 있을 뿐 아니라 스캔 PDF를 포함한 모든 PDF를 편집할 수 있는 도구를 제공하고 있습니다.

(관련 링크: ‘ABBYY FineReader’, 새 버전 출시)

 

솔직히 프로그램을 다루는데 익숙치 않은 저였지만, ABBYY FineReader 14은 이용방법이 매우 간단해서 두렵지 않았습니다.

 

ABBYY FineReader 14을 접한 것은 'ABBYY FineReader 14 무료 시험판'버전을 통해서였습니다.

 

30일간 사용할 수 있기때문에, 처음 접하는 사람도 충분히 익숙하게 사용할 수 있는 기간이라 생각합니다.

 

아래의 이미지를 클릭하시면, (주)레티아에서 제공하는 'ABBYY FineReader 14 무료 시험판'을 체험해 보실 수 있습니다.

(더불어 제품에 대한 상세 설명도 있으니, 꼼꼼한 정독도 좋을 것 같습니다. 처음 접하시는 분은 신세계를 경험하실지도...)

 

 

 

서론이 길었지만, 포스팅의 제목과 같이 PDF파일을 엑셀로 변환하는 작업을 예시로 ''ABBYY FineReader 14'에 대해 소개해보려 합니다.

 

다음은 논문 중 일부 표입니다. 보시는 바와 같이 OCR작업이 되어 있지 않아 클릭했을때 전체가 모두 선택된 것을 알 수 있습니다.

(첨부한 모든 이미지는 클릭해서 보시면 커집니다)

 

 

 

''ABBYY FineReader 14"을 실행하면 다음과 같은 화면이 나타납니다.

 

 

이중 문서 변환 항목을 확대하면 아래의 사진과 같습니다. 이를 보면 엑셀(Excel)뿐만 아니라 Word 등의 다른 프로그램으로도 변환 가능한 것을 알 수 있으며, OCR작업만 진행할 수 도 있습니다.

 

 

 

 

이중 'Microsoft Excel로 변환' 항목을 클릭하고, 다음과 같이 변환할 PDF파일을 선택하는 창이 뜹니다.

 

 

이후 파일을 선택해주면, 다음의 그림처럼 바뀌는데 여기서 일부 설정해야 할 부분이 있습니다.

 

 

 

 

제가 엑셀로 변환하려는 파일에서 표의 제목은 한글로, 내용은 한문으로 기재되어 있기 때문에 ①의 'OCR언어'에서는 '중국어 번체'와 '한국어(한글)'을 선택했습니다. ''ABBYY FineReader 14"는 190개의 언어를 지원하기때문에 어떠한 언어로 기재된 PDF파일도 변환할 수 있습니다.

 

그리고 ② 'Excel로 변환' 항목을 클릭하면, 변환이 진행되고, 엑셀파일로 저장할 수 있게 됩니다. 드디어 PDF파일과 엑셀 파일의 비교!!

 

 

 

 

일부 몇 글자가 차이는 있지, 거의 그대로 엑셀로 변환되어 옮겨간 것을 볼 수 있습니다. 그나마 몇 글자 오류가 있었던 것도 아마 해상도의 문제였다고 생각되는데, 해상도만 높았다면 충분히 오타없이 진행되었을 것이라 생각합니다.

 

 

그리고 또 하나 더!!! 프로그램을 여는 것마저 시간이 걸린다. 급하다! 시간이 없다!! 하시는 분도 있으리라 생각합니다.

그때는 아래와 같이 변환하고자 하는 파일에 커서를 위치하고, 마우스 오른쪽 버튼을 클릭하면 "'ABBYY FineReader를 통해 변환"이란 내역이 보이고 여기에 커서를 위치하면 손쉽게 엑셀파일로 변환가능합니다.

 

 

 

물론 내역을 보시면 아시겠지만, 다른 기능도 손쉽게 이용가능합니다~^^

 

 

 

다른 기능을 이용하시고 싶다면, 앞에서 제시했던 첫 페이지에서 'OCR편집기에서 열기'를 클릭하시면, OCR작업이 진행됩니다.

 

 

(사진 파일은 클릭하시면 커집니다)

 

그리고 이를 저장하고 싶을때 위의 항목 중 '저장'부분을 클릭하면 다음과 같이 여러 형식의 파일로 변환후 저장이 가능하다는 것을 알 수 있습니다.

 

 보시는 바와 같이 '검색 가능한 PDF', '이미지 전용 PDF', 'Word', 'Excel', 'EPUB', 'HTML'등 다양한 양식으로 저장및 보내기가 가능한 것을 알 수 있습니다.

 

 

혹시나 저의 포스팅을 보시고도 이해가 되지 않는다!! 좀 더 설명이 필요하다!! 하시는 분은 아래에 '레티아(ReTIA)'에서 운영하는 블로그 주소와 레티아에서 제공하는 "ABBYY FineReader 14 사용법 동영상" 링크를 첨부하니 방문하셔서 많은 정보 얻어가시기바랍니다.

(위의 PDF파일을 엑셀로 변환하는 것 이외에도 'PDF 텍스트 편집&수정', 'PDF 파일 표(테이블) 추출하기', 'PDF 본문 검색', 'PDF 문서에 메모 남기기' 등 여러 기능에 대한 정보를 얻으실 수 있습니다~^^)

 

"ABBYY FineReader"은 컴퓨터 파일을 자주 다루는 직장인들은 물론, 저처럼 대학원에 다니는 학생, 교수님들께 강추하는 프로그램임을 믿어 의심치 않습니다.

 

 

레티아 티스토리 블로그(http://retia.tistory.com/),

 

레티아 네이버 블로그(http://blog.naver.com/retiaocr),

 

레티아 공식 홈페이지(http://www.retia.co.kr/main.html)

 

ABBYY FineReader 14 사용법 동영상(http://www.retia.co.kr/cnt/products/products.html?category=1&uid=46&name=finereader-14&tab=7)

 

 

관심이 생기신다면, 지금 바로 무료로 체험해 보시기 바랍니다.↓

 

 

 

Posted by 연어술사

한문과 내가 좋아하는 것들..채워갈 곳..
연어술사