OCR
OCR (Optical Character Recognition) 광학 문자 인식 이미지 형태의 데이터에서 글자를 인식하는 기술 이미지에서 글자 및 메타데이터들을 텍스트형태의 데이터로 변경해주는 기술 과정- 이미지 전처리 : 문서 상태에 따라 배경제거, 노이즈 제거, 명암, 색체, 워터마크등을 제거하는 과정- 문자 감지 : 전처리된 이미지에서 문자가 존재하는 부분만을 감지하는 과정- 문자 인지 : 감지된 영역안의 문자를 텍스트 데이터로 변경하는 과정, 필기 방식에 따라 인쇄체, 필기체로 구분하는 방식으로 나뉨- 후처리 : 잘못 인지된 텍스트를 수정하는 작업, 단어의 앞뒤 문맥에 따라 어색한 부분을 자연스럽게 변경하는 자연어 후처리 작업 다양한 포맷의 문서(pdf, word, ppt, excel등)에 대해..