전체 글(26)
-
PDF 시험지에서 문제별로 이미지 자동 자르기 - 이미지 기반 (PyMuPDF + OpenCV + pytesseract)
OCR 인식률을 개선하기 위해 문제 단위로 이미지를 자동 분할하는 스크립트를 만들었습니다.https://choddu.tistory.com/27 PDF 시험지에서 문제별로 이미지 자동 자르기 - 텍스트 기반 (PyMuPDF + OpenCV)프로젝트를 진행하면서 수식이 포함된 시험 문제의 경우, 전체 페이지 단위로 OCR을 적용하면 인식 정확도가 떨어진다는 점을 알게 되었습니다.특히 수식이 많을수록 잘못 인식되거나 문장 구조choddu.tistory.com 지난 게시물에서는 텍스트 기반 PDF를 처리하는 스크립트를 소개했는데, 이번에는 이미지 기반 PDF를 대상으로 한 스크립트를 정리했습니다.이미지 기반 PDF는 Python에서 직접 텍스트를 추출할 수 없기 때문에, OCR 기술을 활용해 다른 방식으로 접근..
2025.06.04 -
PDF 시험지에서 문제별로 이미지 자동 자르기 - 텍스트 기반 (PyMuPDF + OpenCV)
프로젝트를 진행하면서 수식이 포함된 시험 문제의 경우, 전체 페이지 단위로 OCR을 적용하면 인식 정확도가 떨어진다는 점을 알게 되었습니다.특히 수식이 많을수록 잘못 인식되거나 문장 구조가 깨지는 경우가 많았습니다.이 문제를 해결하기 위해, PDF를 문제 단위로 나눠 OCR을 적용해본 결과,문제별로 분할된 이미지에서 수식을 인식할 때 LaTeX 변환 정확도가 훨씬 높아지는 것을 확인했습니다.그래서 전체 페이지에서 문제 단위로 이미지를 잘라주는 스크립트를 직접 만들기로 했습니다. page 단위, 문제 단위 필요 라이브러리 설치pip install pymupdf opencv-python PyMuPDF (fitz): PDF에서 텍스트와 좌표 추출OpenCV: 이미지 자르기 및 저장전체 코드1. PDF 열기..
2025.06.03 -
PyKoSpacing으로 OCR 텍스트 후처리 : 한국어 띄어쓰기 보정 라이브러리 활용 예시
PyKoSpacing은 띄어쓰기가 누락된 한국어 문장을 보정해주는 딥러닝 기반의 Python 라이브러리입니다. https://github.com/haven-jeon/PyKoSpacing GitHub - haven-jeon/PyKoSpacing: Automatic Korean word spacing with PythonAutomatic Korean word spacing with Python . Contribute to haven-jeon/PyKoSpacing development by creating an account on GitHub.github.com 설치 방법pip install git+https://github.com/haven-jeon/PyKoSpacing.gitPyKoSpacing 라이브러..
2025.06.03 -
[react native_ ios 빌드 오류]Implicit instantiation of undefined template 'std::basic_string<char, std::char_traits<char>, std::allocator<char> >'
문제 상황 expo run:ios 실행 시, 빌드가 실패하면서 위 오류가 발생했다. Implicit instantiation of undefined template 'std::char_traits' 검색해보니 std::char_traits을 사용하는 C++ 코드가 iOS 런타임에서 제대로 처리되지 못해 생기는 오류라고 한다. 해결과정1. 캐시삭제npm run --reset-cache캐시삭제를 하면 된다는 글이 있어 실행해봤지만 해결 안되었다. 2. 시뮬레이터 직접 지정해서 실행xcrun simctl list devices사용할 수 있는 시뮬레이터를 보여주는 명령어다. 사용할 기기의 번호를 확인하고 ios 앱을 실행시킬 수도 있다. npx expo run:ios --device "9AA7D0ED-545..
2025.05.30 -
[expo 오류 해결] expo 실행 시 Welcome to Expo 화면만 나올 때 해결법 (app/index.tsx 문제)
문제 상황expo 실행했는데 갑자기 Welcome to Expo 화면이 떳다.알고 보니 app/index.tsx 파일을 못 잡아서 생기는 오류였고, 검색해보니까 Expo SDK 51부터 react-native-dotenv가 expo-router랑 호환되지 않는다는 내용이 있었다.내가 며칠 전에 환경변수 쓰려고 react-native-dotenv를 설치하고 Babel 플러그인 설정까지 했었는데, 그 설정 때문에 expo-router가 내부적으로 사용하는 환경변수들이 덮어씌워졌고, 그 결과 app/index.tsx를 못 찾은 거다.내 환경은 현재 Expo SDK 52고, 이 버전은 react-native-dotenv를 공식적으로 지원하지 않아서 생긴 문제였다. 참고글:https://stackoverflow...
2025.04.26 -
Mac에서 Spring Boot + JDK 17 + IntelliJ Community 개발환경 세팅
Spring Boot 프로젝트를 시작하기 위해 필요한 JDK와 IntelliJ 설치부터 개발 환경을 설정하는 과정까지 간단하게 정리해보았습니다.JDK 설치// 실행brew install openjdk@17For the system Java wrappers to find this JDK, symlink it with sudo ln -sfn /opt/homebrew/opt/openjdk@17/libexec/openjdk.jdk /Library/Java/JavaVirtualMachines/openjdk-17.jdk // 심볼릭 링크 추가sudo ln -sfn /opt/homebrew/opt/openjdk@17/libexec/openjdk.jdk /Library/Java/JavaVirtualMachines/..
2025.04.24