본문 바로가기

OCR4

AI기반 OCR프로젝트 마지막 - 후처리 알고리즘 https://junyealim.tistory.com/127 AI기반 OCR프로젝트 2 - 모델 선정 및 학습 https://junyealim.tistory.com/126 AI기반 OCR 프로젝트_주제선정 웹개발 프로젝트와 자연어 처리 프로젝트가 끝나고, 이어서 진행이 된 OCR 프로젝트. 총 5명의 구성으로 팀을 짜서 진행을 하게 되었다. 프 junyealim.tistory.com ✅ 모델 선정 : YOLOv5s 사용 ✅ 데이터 선정 및 정제 : 현실적인 시간과 컴퓨터 리소스 문제로 데이터 선정 및 정제 ✅ 시스템 및 프론트 구성 : 과적차량 탐지 ▶️ 번호판 위치 인식 ▶️ 번호판 읽어오기 1. 서버 구축 우선 우리팀이 목표하는 시스템은 도로 위의 과속 단속 카메라를 이용한다는 가정하에, 실시간으로 .. 2024. 3. 12.
AI기반 OCR프로젝트 2 - 모델 선정 및 학습 https://junyealim.tistory.com/126 AI기반 OCR 프로젝트_주제선정 웹개발 프로젝트와 자연어 처리 프로젝트가 끝나고, 이어서 진행이 된 OCR 프로젝트. 총 5명의 구성으로 팀을 짜서 진행을 하게 되었다. 프로젝트는 AI 기반이지만 당시 수업 진도는 CV(computer vision junyealim.tistory.com ✅ 주제 선정 : 과적 차량을 자동으로 감지하고 기록하는 시스템 ✅ 활용 데이터 : 과적차량 도로위험 데이터 ▶️ 과적 차량 탐지 가능 자동차 차종/연식/번호판 인식용 영상 ▶️ 번호판 위치 탐지 가능 ✅ OCR모델 테스트 : 번호판 위치에서 perspective로 확대 후 번호 읽어올 수 있음을 확인 ▶️ Paddle 모델 선정 1. 모델 선정(YOLO) 과.. 2024. 3. 12.
OCR 1. OCR( Optical Character Recognition ) 광학 문자 인식(OCR)은 광학적 또는 전자적 장치를 사용하여 이미지의 문자를 컴퓨터가 이해할 수 있는 텍스트로 변환하는 프로세스입니다. 이 프로세스는 다음과 같은 주요 단계로 이루어집니다. 이미지 획득: OCR 프로세스의 첫 번째 단계는 문서나 사진 등의 이미지를 디지털 형식으로 획득하는 것입니다. 이를 위해 스캐너, 디지털 카메라 또는 이미지 스캔 앱과 같은 장치를 사용합니다. 전처리: 획득된 이미지에는 종종 노이즈, 왜곡, 그림자 또는 회전된 문자와 같은 문제가 있을 수 있습니다. 전처리 과정에서는 이미지를 정제하고 보정하여 후속 단계에서 문자를 올바르게 인식할 수 있도록 합니다. 문자 인식: 문자 인식 단계에서는 전처리된 이미.. 2024. 2. 27.
영상의 변환/ 적응형 이진화/ 유사도 1. 적응형 이진화 적응형 이진화는 노이즈를 제거한 후 Otsu 이진화를 적용하는 방법입니다. 이를 통해 영상을 여러 영역으로 나눈 뒤, 해당 영역의 주변 픽셀 값만을 활용하여 임계값을 도출합니다. cv2.adaptiveTreshold(영상, 임계값을 만족하는 픽셀에 적용할 값, 임계값 결정 방법, Threshold 적용방법, 블록사이즈, 가감할 상수) 임계값 결정 방법 cv2.ADAPTIVE_THRESH_MEAN_C: 이웃 픽셀의 평균으로 결정합니다. 선명하지만 잡티가 많아질 수 있습니다. cv2.ADAPTIVE_THRESH_GAUSSIAN_C: 가우시안 분포에 따른 가중치의 합으로 결정합니다. 선명도는 조금 떨어지지만 잡티가 적습니다. 블록사이즈: 이 매개변수는 이미지를 작은 블록들로 나누는 데 사용.. 2024. 2. 25.