PDF를 무료로 텍스트로 변환하려고합니다. 텍스트로 변환하고 싶습니다. 무료 응용 프로그램을

OSX를 사용하고 있으며 pdf 파일을 텍스트로 변환하고 싶습니다.

무료 응용 프로그램을 사용하고 싶습니다. 일부 응용 프로그램이 있어야합니다.



답변

Homebrew를 통해 xpdf를 설치하고 사용하는 단계는 다음과 같습니다.

  1. Homebrew의 종속성을 설치하십시오.

    xcode-select --install
    
  2. 웹 사이트에서 Homebrew를 설치하십시오.

    /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
    
  3. Homebrew 설치를 완료하라는 메시지를 표시하십시오.

  4. Homebrew가 만족스럽고 사양대로 작동하는지 확인하십시오.

    brew doctor
    
  5. 다음 xpdf 및 해당 종속성을 설치하십시오.

    brew install Caskroom/cask/xquartz
    
    brew install xpdf
    
  6. 마지막으로 xpdf 제품군과 함께 제공되는 패키지 인 pdftotext를 사용하십시오.

    pdftotext Some_Document.pdf Some_Document.txt
    

첫 번째 파일 이름은 기존 PDF입니다. 두 번째는 목적지입니다. 그 결과는 (아마도 구식) 버전의 Adobe Acrobat보다 훨씬 낫습니다. 편집 : 새로운 (2019) 버전의 Adobe Acrobat에서 비슷한 결과가 나왔습니다.


답변

여러 방법.

  1. Google 문서를 사용 합니다 (Google 계정이 필요합니다)

  2. Automator 사용 (일부 작업 필요)

Automator를 사용하여 PDF에서 텍스트를 추출하여 텍스트 또는 RTF 문서로 저장할 수있는 워크 플로를 만들 수 있습니다.

또는 App Store의 앱 (예 : PDF to Text)


답변

xpdf 포트와 함께 설치했습니다.

port install xpdf

포함한다 :

xpdf-pdftotext

이미지가 아닌 텍스트 파일에서 오는 PDF 파일에 대해 원하는 작업을 수행합니다.

xpdf-pdftotext PDF_file text_file

답변

Adobe Reader (11.0.09) 의 현재 버전은 파일 메뉴에 “다른 이름으로 저장”항목이 있습니다.

옵션 중 하나는 Text 입니다.

앱은 무료이며 텍스트 파일을 출력하는 적절한 작업을 수행합니다. 새 문서의 모든 이미지는 .txt 형식으로 손실됩니다.


답변

텍스트를 복사하여 다른 문서에 붙여 넣을 수 있어야한다고 생각합니다. 모든 텍스트를 선택하려면

“미리보기”에서 PDF를 열고

  • “편집 | 모두 선택”을 선택하십시오
  • “편집 | 복사”를 선택하십시오

“텍스트 편집”이라고 말한 다른 앱으로 이동

  • “편집 | 붙여 넣기”를 선택하십시오.

이 작업을 시도하고 텍스트를 붙여 넣지 않고 빈 줄만 있으면 PDF를 새 PDF로 먼저 인쇄하십시오.

  • 미리보기에서 “파일 | 인쇄”를 선택하십시오.
  • 오른쪽 하단에서 “PDF | PDF로 저장”을 선택하십시오.
  • 새 PDF를 내 보냅니다.

이제이 새로운 PDF로 위의 과정을 시도하십시오. 나를 위해 일했다!

추신 : Microsoft Word를 사용하는 경우 PDF를 단어 수 있습니다


답변

다음 파이썬 스크립트는 PDF 문서의 텍스트를 .txt 파일로 출력합니다. (참고 : 데이터가 PDF 형식으로 유지되는 방식으로 인해 텍스트가 반드시 ‘논리적 인’사람이 읽을 수있는 순서로 보장되는 것은 아닙니다.)

스크립트는 (예를 들어, 명령 줄에 인수로 제공 한 PDF 파일의 텍스트 파일을 만듭니다 pdf2txt.py myPDF.pdf), 또는 당신의 쉘 타입 설정, 자동화의 “실행 쉘 스크립트”작업에 사용할 수있는 파이썬패스 입력을 “인수로”에 . 그런 다음 빠른 작업 또는 DropApp으로 사용할 수 있습니다.

#!/usr/bin/python
# coding: utf-8

import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
NSUTF8StringEncoding = 4

def pdf2txt():
    for filename in sys.argv[1:]:
        inputfile =filename.decode('utf-8')
        shortName = os.path.splitext(filename)[0]
        outputfile = shortName+" text.txt"
        pdfURL = NSURL.fileURLWithPath_(inputfile)
        pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
        if pdfDoc :
            pdfString = NSString.stringWithString_(pdfDoc.string())
            pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)

if __name__ == "__main__":
   pdf2txt()