프로젝트+스터디8 [논문요약] Arbitrary Shape Scene Text Detection with Adaptive Text Region Representation Introduction & Related work 장면 텍스트 감지는 컴퓨터 비전 분야에서 중요한 연구 주제로, 다양한 응용 프로그램에서 활용되고 있습니다. 예를 들어, 실시간 텍스트 번역, 시각 장애인 보조, 로봇 감지 등이 있습니다. 기존의 방법들은 수평 및 기울어진 텍스트 감지에 초점을 맞추었지만, 곡선 텍스트와 같은 불규칙한 형태의 텍스트 감지는 여전히 도전 과제로 남아 있습니다.이 논문에서는 적응형 텍스트 영역 표현을 활용한 새로운 장면 텍스트 감지 방법을 제안합니다. 입력 이미지를 받으면, 먼저 텍스트 영역 제안 네트워크를 통해 텍스트 제안을 추출하고, 이후 정제 네트워크를 통해 이 제안들을 검증하고 보완합니다. 정제 네트워크는 텍스트/비텍스트 분류, 경계 상자 보정, 그리고 순환 신경망(RN.. 2024. 10. 31. 파이썬 병렬처리(@BACKGROUND) 모델 알고리즘을 짜다 보면 한 프로세스가 동작하는 중간에 다른 프로세스를 병렬로 동시에 처리해야 할 때가 있다. 예를 들어, 실시간 영상에서 프레임을 처리하다가 중간에 OCR, I/O 등 시간이 소요되는 작업을 해야 할 때 가 있다. 이러한 작업을 동기적으로 처리하면 전체 프로세스가 지연될 수 있기 때문에, 적절한 병렬 처리 기법을 사용하여 효율적으로 처리하는 것이 중요하다.파이썬은 기본적으로 동기적으로 동작하는 프로그래밍 언어이며, 이는 한 번에 하나의 작업만 처리하는 구조를 의미한다. 파이썬의 전역 인터프리터 락(GIL, Global Interpreter Lock) 때문에 진정한 병렬 처리를 구현하는 데 어려움이 있다. GIL은 여러 스레드가 동시에 파이썬 객체에 접근하는 것을 방지하기 위해 존재하는.. 2024. 9. 25. [논문리뷰] Attention Is All You Need https://arxiv.org/abs/1706.03762 Attention Is All You Need The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new arxiv.org 들어가기 전에, 제목에 Attention 메커니즘이 나오는만큼, Attention 메커니즘에 대해 알고 시작하면 도움이 될 것 같다.. 2024. 4. 4. ML 스터디_1일 ▶️ 머신러닝에서의 학습? 1. 지도 학습(supervised learning) - 문제와 정답을 함께 학습하여 예측 또는 분류하는 방식입니다. - 데이터의 정답에 영향을 미치는 특성들을 입력 변수/독립 변수(x)라고 하고, 레이블(정답)을 출력 변수/종속 변수(y)라고 합니다. - 연속형 출력 변수의 경우에는 회귀 기술을 사용하고, 범주형 출력 변수의 경우에는 분류 기술을 사용합니다. 2. 비지도 학습(Unsupervised Learning) - 출력 변수(y)가 없고, 입력 변수(x) 간의 관계를 모델링합니다. - 클러스터링과 같은 군집 분석이나 association과 같이 데이터의 패턴이나 구조를 파악하는데 이용, PCA와 같이 차원을 줄이는 분석기법입니다. 3. 강화 학습(Reinforcement.. 2024. 3. 22. 자연어 처리 챗봇 프로젝트 _ 챗쪽이 자연어 처리를 배우면서 진행하게 된 챗봇 프로젝트 1. 주제 선정 주제를 선정하면서 내가 집중한 것은 gpt와 같은 성능이 좋은 챗봇이 많은 지금, "굳이 내가 만든 앱을 사용해보고 싶은 이유"를 만들기였다. 한달이 안되는 시간 안에 두명이서 데이터를 작성하고 모델 학습과 서버 구축을 완료해야 했다. 강사님께서 짧은 시간안에 챗봇의 높은 정확도를 기대하기는 어렵다고 조언을 해주셨기 때문에 성능보다는 흥미를 자극하는 주제를 생각해보았다. 그렇게 후보로 간추려진 세가지 주제 > 시간 여행자 컨셉으로 역사적 시기를 지정하면 해당 시대의 사람과 대화하는 챗봇 > 반려동물의 행동을 얘기하면 훈련이나 질병 관련 조언을 주는 챗봇 > 나와 배우자의 성격을 입력하면 그에 기반하는 아이성격을 생성해서 대화해볼 수 있는 .. 2024. 3. 15. AI기반 OCR프로젝트 마지막 - 후처리 알고리즘 https://junyealim.tistory.com/127 AI기반 OCR프로젝트 2 - 모델 선정 및 학습 https://junyealim.tistory.com/126 AI기반 OCR 프로젝트_주제선정 웹개발 프로젝트와 자연어 처리 프로젝트가 끝나고, 이어서 진행이 된 OCR 프로젝트. 총 5명의 구성으로 팀을 짜서 진행을 하게 되었다. 프 junyealim.tistory.com ✅ 모델 선정 : YOLOv5s 사용 ✅ 데이터 선정 및 정제 : 현실적인 시간과 컴퓨터 리소스 문제로 데이터 선정 및 정제 ✅ 시스템 및 프론트 구성 : 과적차량 탐지 ▶️ 번호판 위치 인식 ▶️ 번호판 읽어오기 1. 서버 구축 우선 우리팀이 목표하는 시스템은 도로 위의 과속 단속 카메라를 이용한다는 가정하에, 실시간으로 .. 2024. 3. 12. 이전 1 2 다음