OSX를 사용하고 있으며 pdf 파일을 텍스트로 변환하고 싶습니다.
무료 응용 프로그램을 사용하고 싶습니다. 일부 응용 프로그램이 있어야합니다.
답변
Homebrew를 통해 xpdf를 설치하고 사용하는 단계는 다음과 같습니다.
-
Homebrew의 종속성을 설치하십시오.
xcode-select --install
-
웹 사이트에서 Homebrew를 설치하십시오.
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
-
Homebrew 설치를 완료하라는 메시지를 표시하십시오.
-
Homebrew가 만족스럽고 사양대로 작동하는지 확인하십시오.
brew doctor
-
다음 xpdf 및 해당 종속성을 설치하십시오.
brew install Caskroom/cask/xquartz brew install xpdf
-
마지막으로 xpdf 제품군과 함께 제공되는 패키지 인 pdftotext를 사용하십시오.
pdftotext Some_Document.pdf Some_Document.txt
첫 번째 파일 이름은 기존 PDF입니다. 두 번째는 목적지입니다. 그 결과는 (아마도 구식) 버전의 Adobe Acrobat보다 훨씬 낫습니다. 편집 : 새로운 (2019) 버전의 Adobe Acrobat에서 비슷한 결과가 나왔습니다.
답변
여러 방법.
-
Google 문서를 사용 합니다 (Google 계정이 필요합니다)
-
Automator 사용 (일부 작업 필요)
Automator를 사용하여 PDF에서 텍스트를 추출하여 텍스트 또는 RTF 문서로 저장할 수있는 워크 플로를 만들 수 있습니다.
또는 App Store의 앱 (예 : PDF to Text)
답변
xpdf
포트와 함께 설치했습니다.
port install xpdf
포함한다 :
xpdf-pdftotext
이미지가 아닌 텍스트 파일에서 오는 PDF 파일에 대해 원하는 작업을 수행합니다.
xpdf-pdftotext PDF_file text_file
답변
Adobe Reader (11.0.09) 의 현재 버전은 파일 메뉴에 “다른 이름으로 저장”항목이 있습니다.
옵션 중 하나는 Text 입니다.
앱은 무료이며 텍스트 파일을 출력하는 적절한 작업을 수행합니다. 새 문서의 모든 이미지는 .txt 형식으로 손실됩니다.
답변
텍스트를 복사하여 다른 문서에 붙여 넣을 수 있어야한다고 생각합니다. 모든 텍스트를 선택하려면
“미리보기”에서 PDF를 열고
- “편집 | 모두 선택”을 선택하십시오
- “편집 | 복사”를 선택하십시오
“텍스트 편집”이라고 말한 다른 앱으로 이동
- “편집 | 붙여 넣기”를 선택하십시오.
이 작업을 시도하고 텍스트를 붙여 넣지 않고 빈 줄만 있으면 PDF를 새 PDF로 먼저 인쇄하십시오.
- 미리보기에서 “파일 | 인쇄”를 선택하십시오.
- 오른쪽 하단에서 “PDF | PDF로 저장”을 선택하십시오.
- 새 PDF를 내 보냅니다.
이제이 새로운 PDF로 위의 과정을 시도하십시오. 나를 위해 일했다!
답변
다음 파이썬 스크립트는 PDF 문서의 텍스트를 .txt 파일로 출력합니다. (참고 : 데이터가 PDF 형식으로 유지되는 방식으로 인해 텍스트가 반드시 ‘논리적 인’사람이 읽을 수있는 순서로 보장되는 것은 아닙니다.)
스크립트는 (예를 들어, 명령 줄에 인수로 제공 한 PDF 파일의 텍스트 파일을 만듭니다 pdf2txt.py myPDF.pdf
), 또는 당신의 쉘 타입 설정, 자동화의 “실행 쉘 스크립트”작업에 사용할 수있는 파이썬 과 패스 입력을 “인수로”에 . 그런 다음 빠른 작업 또는 DropApp으로 사용할 수 있습니다.
#!/usr/bin/python
# coding: utf-8
import os, sys
from Quartz import PDFDocument
from CoreFoundation import (NSURL, NSString)
NSUTF8StringEncoding = 4
def pdf2txt():
for filename in sys.argv[1:]:
inputfile =filename.decode('utf-8')
shortName = os.path.splitext(filename)[0]
outputfile = shortName+" text.txt"
pdfURL = NSURL.fileURLWithPath_(inputfile)
pdfDoc = PDFDocument.alloc().initWithURL_(pdfURL)
if pdfDoc :
pdfString = NSString.stringWithString_(pdfDoc.string())
pdfString.writeToFile_atomically_encoding_error_(outputfile, True, NSUTF8StringEncoding, None)
if __name__ == "__main__":
pdf2txt()