분류 전체보기129 deep-text-recognition-benchmark 모델 ONNX 변환 triton Inference server에 모델들을 경량화 해서 올리다가text recognition 모델을 onnx로 변환하는 과정에서 겪은 어려움이 있었어서 기록해두고자 한다.Deep Text Recognition Benchmark 모델 구조Deep Text Recognition Benchmark는 유연하게 모델을 구성할 수 있는 OCR(Open Character Recognition) 프레임워크로, 여러 단계에서 다양한 옵션을 조합하여 최적의 성능을 내는 구조를 설계할 수 있다.1️⃣ Transformation (TPS / None)Transformation 단계는 입력 이미지를 모델이 학습하기 좋은 형태로 변환하는 역할TPS (Thin Plate Spline Transformation)왜곡된 이.. 2024. 12. 24. 파이썬의 얕은 복사와 깊은 복사 파이썬에서 데이터를 복사할 때 얕은 복사(Shallow Copy)와 깊은 복사(Deep Copy)의 차이를 명확히 이해하는 것은 중요한 개념입니다. 두 방식은 특히 리스트나 딕셔너리 같은 가변 객체(Mutable Object)를 다룰 때 데이터 처리의 동작 방식을 크게 좌우합니다. 이 글에서는 이 두 복사 방식의 동작 원리, 차이점, 그리고 올바르게 사용하는 방법에 대해 알아보겠습니다.1. 객체의 복사란 무엇인가?객체를 복사한다는 것은 특정 데이터의 새로운 사본을 생성하는 것을 의미합니다. 복사의 목적은 원본 데이터를 변경하지 않고 독립적으로 사용하거나, 특정 작업을 수행한 뒤 원본과 복사본을 비교하려는 경우가 많습니다.2. 얕은 복사(Shallow Copy)얕은 복사는 가장 바깥쪽 객체만 복사하고, 내.. 2024. 11. 21. [논문요약] Arbitrary Shape Scene Text Detection with Adaptive Text Region Representation Introduction & Related work 장면 텍스트 감지는 컴퓨터 비전 분야에서 중요한 연구 주제로, 다양한 응용 프로그램에서 활용되고 있습니다. 예를 들어, 실시간 텍스트 번역, 시각 장애인 보조, 로봇 감지 등이 있습니다. 기존의 방법들은 수평 및 기울어진 텍스트 감지에 초점을 맞추었지만, 곡선 텍스트와 같은 불규칙한 형태의 텍스트 감지는 여전히 도전 과제로 남아 있습니다.이 논문에서는 적응형 텍스트 영역 표현을 활용한 새로운 장면 텍스트 감지 방법을 제안합니다. 입력 이미지를 받으면, 먼저 텍스트 영역 제안 네트워크를 통해 텍스트 제안을 추출하고, 이후 정제 네트워크를 통해 이 제안들을 검증하고 보완합니다. 정제 네트워크는 텍스트/비텍스트 분류, 경계 상자 보정, 그리고 순환 신경망(RN.. 2024. 10. 31. 파이썬 병렬처리(@BACKGROUND) 모델 알고리즘을 짜다 보면 한 프로세스가 동작하는 중간에 다른 프로세스를 병렬로 동시에 처리해야 할 때가 있다. 예를 들어, 실시간 영상에서 프레임을 처리하다가 중간에 OCR, I/O 등 시간이 소요되는 작업을 해야 할 때 가 있다. 이러한 작업을 동기적으로 처리하면 전체 프로세스가 지연될 수 있기 때문에, 적절한 병렬 처리 기법을 사용하여 효율적으로 처리하는 것이 중요하다.파이썬은 기본적으로 동기적으로 동작하는 프로그래밍 언어이며, 이는 한 번에 하나의 작업만 처리하는 구조를 의미한다. 파이썬의 전역 인터프리터 락(GIL, Global Interpreter Lock) 때문에 진정한 병렬 처리를 구현하는 데 어려움이 있다. GIL은 여러 스레드가 동시에 파이썬 객체에 접근하는 것을 방지하기 위해 존재하는.. 2024. 9. 25. paddle OCR 학습 학습데이터 생성: TextRecognitionDataGenerator학습데이터 변환: TRDG2DTRB모델 학습 및 배포: Deep-Text-Recognition-Benchmark GitHub - clovaai/deep-text-recognition-benchmark: Text recognition (optical character recognition) with deep learning methods, IText recognition (optical character recognition) with deep learning methods, ICCV 2019 - clovaai/deep-text-recognition-benchmarkgithub.com기존에 위의 세가지 단계를 거쳐서 easyOCR 모델을 .. 2024. 8. 29. 반복문 반복문은 코드 블록을 여러 번 실행하기 위해 사용됩니다. for문과 while문은 가장 흔히 사용되는 두 가지 반복문입니다.1. For 문 for문은 반복 횟수가 명확히 정해져 있을 때 주로 사용됩니다.선언은 반복문에서 사용할 변수를 초기화하는 데 사용됩니다. 조건이 참인 동안 코드가 반복 실행됩니다. 증감은 각 반복이 끝날 때마다 반복 변수를 증가하거나 감소시킵니다.// 반복문 Forfor (선언;조건;증감) { ... 수행 명령 ...}참고.IntelliJ 에서는 fori 만 적고 엔터하면 기본 틀 자동 완성!// 나코 매장System.out.println("어서오세요. 나코입니다.");// 또다른 손님이 들어오면?System.out.println("어서오세요. 나코입니다.");System.ou.. 2024. 6. 17. 이전 1 2 3 4 ··· 22 다음