PDFファイルをPythonで扱いたい【最終：複数のPDFファイルを結合する】

Pythonで複数のPDFファイルを結合する方法
PyPDF2を使って複数のPDFファイルを結合するコード
1. コードの解説
まとめ

Pythonで複数のPDFファイルを結合する方法

pythonで複数のPDFファイルを結合するには、すべてのPDFファイルを取得したあと、PDFファイルのリストをfor文で回してPDFファイルを読み込みます。読み込んだPDFファイルは1ページずつwriterオブジェクトに追加していきます。PDFオブジェクトの流れに関しては以下の記事を参考にしてください↓

PyPDF2を使って複数のPDFファイルを結合するコード

結合と書いてますが、実際にはpdfファイルをwriterオブジェクトに格納してそれを新しいpdfファイルとして保存しているだけです。以下のコードは指定のディレクトリに含まれる全てのpdfファイルを取得したあとそれを結合して新たなpdfファイルとして保存するコードです。

import PyPDF2, os

# カレントディレクトリを設定（必要に応じてコメントを解除して適切なディレクトリに設定してください）
# os.chdir('/path/to/your/directory')

pdf_files = []
pdf_writer = PyPDF2.PdfFileWriter()

# カレントディレクトリ内のすべてのPDFファイルをリストに追加する
for filename in os.listdir():
    if filename.endswith('.pdf'):
        pdf_files.append(filename)

# 全てのPDFファイルをループで回す
for filename in pdf_files:
    pdf_file_obj = open(filename, 'rb')
    pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)

    # ページを追加する
    for page_num in range(1, pdf_reader.numPages):
        page_obj = pdf_reader.getPage(page_num)
        pdf_writer.addPage(page_obj)
 
# 結合したPDFファイルの保存
pdf_output = open('mixpdf.pdf', 'wb')
pdf_writer.write(pdf_output)
pdf_output.close()