プログラム 技術

PowerShellでファイル読み込み(PDF)

PDFファイルを読み込んでみる

読み込むファイルの種類

今回、紹介するファイル読み込みは以下の拡張子が対象です
・PDFファイル(.pdf)

前提条件

PDFファイルを今回は「itextsharp」というライブラリを使用して読み込んでいます

実際に読み込む

PDFファイルを開く

対象となるPDFファイルを読み込む

$reader = New-Object iTextSharp.text.pdf.PdfReader("PDFファイルパス")

PDFファイル内を読み込む

PDFファイルの最大ページ数を取得し、1ページずつテキストを読み込んでいます

$pages = $reader.NumberOfPages
for($page = 1; $page -le $pages; $page++){
    $text = [iTextSharp.text.pdf.parser.PdfTextExtractor]::GetTextFromPage($reader, $page)
    $lines = $text -split "\n"
    foreach($line in $lines){
        Write-Host $line
    }
}

開いたPDFを閉じる

開いたPDFファイルを閉じています

$reader.Close()
$reader.Dispose()

最後に

今回はPDF内テキスト読み込みをしてみました
全体のコードはGitHubにアップしているので参考になれば

サンプル
BlogSampleCodeProjects/PowerShell_FileLoad/PdfFileLoad.ps1 at main · nasuton/BlogSampleCodeProjects · GitHub
BlogSampleCodeProjects/PowerShell_FileLoad/PdfFileLoad.ps1 at main · nasuton/BlogSampleCodeProjects · GitHub

Project for sample code used in the blog.(Blogで記載しているサンプルコード ...

続きを読む

会社紹介

私が所属しているアドバンスド・ソリューション株式会社(以下、ADS)は一緒に働く仲間を募集しています

会社概要
「技術」×「知恵」=顧客課題の解決・新しい価値の創造

この方程式の実現はADSが大切にしている考えで、技術を磨き続けるgeekさと、顧客を思うloveがあってこそ実現できる世界観だと思っています
この『love & geek』の精神さえあれば、得意不得意はno problem!
技術はピカイチだけど顧客折衝はちょっと苦手。OKです。技術はまだ未熟だけど顧客と知恵を出し合って要件定義するのは大好き。OKです
凸凹な社員の集まり、色んなカラーや柄の個性が集まっているからこそ、常に新しいソリューションが生まれています

ミッション
私たちは、テクノロジーを活用し、業務や事業の生産性向上と企業進化を支援します

ホームページ
アドバンスド・ソリューション株式会社
アドバンスド・ソリューション株式会社

アドバンスド・ソリューションは主にMicrosoft製品を使用して、企業の生産性向上に取り組んでいます。要件定義から導入 ...

サイトへ移動

お問い合わせ
お問い合わせ  | アドバンスド・ソリューション株式会社
お問い合わせ | アドバンスド・ソリューション株式会社

お問い合わせはこちら

-プログラム, 技術
-,