종이없는 삶을 위한 문서 관리 프로젝트 Paperless-ngx

안녕하세요. 달소입니다.

오늘 소개해드릴 오픈소스 프로젝트는 해외 레딧에서도 유명하고 국내에도 아마 사용하고계실분들이 있을법한 Paperless-ngx 라는 프로젝트입니다.

이름그대로 우리가 일반적으로 사용하는 문서들을 온라인 아카이브(스캔본)형태로 보관해서 검색 및 관리가 용이하도록 도와주는 프로젝트입니다.

예를들어 공과금 명세서를 관리한다거나,, 병원 진료비 영수증을 보관한다거나 파일들을 보관하는데 태그 및 OCR 인식을 톻애 관리의 용이성까지 부여한것이라고 보시면 되겠습니다.

최초에는 Paperless라는 프로젝트가 있었고 그다음 ng 그다음 ngx 까지 꾸준하게 유지관리 되고있는 오픈소스 프로젝트입니다.

image.png.jpg

특징

Paperless의 주요 기능은 다음과 같습니다.

  • 태그, 통신자, 유형 등을 사용하여 스캔한 문서를 정리하고 색인화하세요.
  • 문서에 OCR을 수행하고, 이미지 전용 문서에 선택 가능한 텍스트를 추가하고, 문서에 태그, 통신원 및 문서 유형을 추가합니다.
  • PDF 문서, 이미지, 일반 텍스트 파일 및 Office 문서(Word, Excel, Powerpoint 및 LibreOffice 등가물)를 지원합니다.
  • Office 문서 지원은 선택 사항이며 Apache Tika에서 제공됩니다( 구성 참조 ).
  • Paperless는 문서를 디스크에 그대로 저장합니다. 파일명과 폴더는 페이퍼리스 방식으로 관리되며, 형식도 자유롭게 구성할 수 있습니다.
  • 단일 페이지 애플리케이션 프런트 엔드.
  • 기본 통계를 표시하고 문서 업로드 기능이 있는 대시보드가 ​​포함되어 있습니다.
  • 태그, 대응자, 유형 등을 기준으로 필터링합니다.
  • 사용자 정의 가능한 보기를 저장하고 대시보드에 표시할 수 있습니다.
  • 전체 텍스트 검색은 필요한 내용을 찾는 데 도움이 됩니다.
  • 자동 완성은 문서에서 관련 단어를 제안합니다.
  • 결과는 검색어와의 관련성을 기준으로 정렬됩니다.
  • 강조 표시는 문서의 어느 부분이 쿼리와 일치하는지 보여줍니다.
  • 유사한 문서 검색("비슷한 문서 더 보기")
  • 이메일 처리: Paperless는 이메일 계정의 문서를 추가합니다.
  • 각 계정에 대해 여러 계정과 필터를 구성합니다.
  • 메일에서 문서를 추가할 때 Paperless는 이러한 메일을 새 폴더로 이동하고, 읽음으로 표시하고, 중요한 것으로 표시하거나 삭제할 수 있습니다.
  • 기계 학습 기반 문서 매칭.
  • Paperless-ngx는 문서에서 학습하고 몇 개의 문서를 종이 없는 상태로 저장하면 문서에 태그, 통신자 및 유형을 자동으로 할당할 수 있습니다.
  • 멀티 코어 시스템에 최적화: Paperless-ngx는 여러 문서를 병렬로 사용합니다.
  • 통합된 온전성 검사기는 문서 아카이브의 상태가 양호한지 확인합니다.
image.png.jpg

홈페이지 / 깃허브

Paperless-ngxdocs.paperless-ngx.com GitHub - paperless-ngx/paperless-ngx: A community-supported supercharged version of paperless: scan, index and archive all your physical documentsgithub.comA community-supported supercharged version of paperless: scan, index and archive all your physical documents - GitHub - paperless-ngx/paperless-ngx: A community-supported supercharged version of pa...

테스트를 위한 데모페이지도 지원합니다.

https://demo.paperless-ngx.com/

활용 가이드