PDFからページを抽出する4つの簡単なステップ

PDFからページを抽出する4つの簡単なステップ

大きなPDFから数ページだけを共有したいことがあります。例えば、本の特定の章や、レポートの単一のグラフなどです。

必要なページを印刷するのは簡単ですが、これらのページを新しいPDFファイルに分割してメールなどで共有するのは少し難しくなります。PDFの全体を見せたくない場合や、受信者の時間を節約したい場合には、これが煩わしいものになります。

Foxit PDF EditorのようなPDFエディターは、この作業を簡単にしてくれます。わずか数回のクリックで、PDF Editorは必要なページだけを含む新しいPDFファイルを作成してくれます。

見てみましょう。

1. まず、PDF Editorを起動し、抽出したいPDFファイルを開きます。この例では、国連のレポートから数ページを抜き出したいとします。

PDF Editorでファイルを開くと、次のような画面が表示されます:

report-1

2. 次に、抽出したいPDFのページ番号を見つける必要があります。少し簡単にするために、このボタンをクリックして表示を「ページ全体を表示」に変更します:

これによりページビューが変更されます:

report-2

この例では、不平等の削減に関する2ページを抽出したいとします。そのために、対応するPDFファイルのページ番号を見つける必要があります。

PDFのページ番号と文書のページ番号は同じではない場合があることに注意してください。そのため、希望するページまでスクロールし、画面下部に表示されるPDFのページ番号をメモする必要があります。

この場合、持続可能な開発に関するセクションがページ42に表示されており、これはPDF Editorウィンドウの下部で確認できます:

2番目のページ、つまり私の場合の最後のページのページ番号は43です。

3. つまり、PDFのページ42からページ43を抽出したいということです。これは簡単に行えます:PDF Editorで、リボンからページ編集タブを選択し、抽出をクリックします:

organize-extract

次のダイアログボックスで、抽出したいページ範囲を指定します:

extract-pages

OKをクリックします。PDF Editorが新しいファイルを作成します。下の例のように「抽出元_(元のファイル名)」というタブが表示されることに気づくでしょう:

extracted-pages-from

4. 最後のステップは、抽出したページを保存することです。ファイル、保存をクリックし、ファイル名を選択します:

save-the-pages

再度保存をクリックすれば完了です。

これは、必要なページを正確に送信する簡単な方法で、PDFが長く複雑な文書の場合に非常に便利です。選択したページを印刷するのと同じくらい良い方法で、環境にも優しいです。ぜひ試してみてください!

Google検索がPDFを処理する方法

Google検索がPDFを処理する方法
Google検索がPDFを処理する方法

Google自身が述べているように、世界中の情報を整理し、すべての人がアクセスできるようにすることに取り組んでいます。もちろん、Googleはこの長期的な取り組みの中で、スプレッドシート、プレゼンテーション、PDFなど、HTMLではないファイルに遭遇します。そのような場合、適切なコンテンツを見つけて検索結果用にインデックス化することに取り組みます。当然ながら、これらのファイル形式はインデックス化が困難な場合があります。どのようなガイドラインに従うべきでしょうか?Googleにインデックス化させたくない場合はどうすればよいのでしょうか?

Googleは、PDFインデックス化に関して最もよく寄せられる質問をまとめており、以下が彼らの回答です:

Q. GoogleはPDFファイルをインデックス化できますか?

A: Googleは一般的に、PDFファイルからあらゆる言語で書かれたテキストコンテンツをインデックス化できます。ただし、パスワード保護や暗号化されていない必要があります。GoogleはOCRアルゴリズムを使用して、テキストが埋め込まれた画像を処理できます。PDF文書から標準的なテキスト文書にコピーできるテキストは、Googleがインデックス化できるはずです。

Q. PDF文書内のリンクはどのように扱われますか?

A: PDFファイル内のリンクはPageRankやその他のインデックス化シグナルを渡すことができ、Googleはファイルをクロールした後にそれらをたどる可能性があります。現在、PDFファイル内にnofollowハイパーリンクを埋め込むことはできません。

Q. PDFファイルが検索結果に表示されないようにするにはどうすればよいですか?

A: PDF文書が検索結果に表示されないようにするのは簡単です。これを行うには、ファイルを提供するHTTPヘッダーにX-Robots Tag: noindexを追加します。PDF文書が既にインデックス化されている場合、X-Robots-Tagをnoindexディレクティブと一緒に使用すると、時間の経過とともに消失します。より高速な削除には、Google Webmaster ToolsのURL削除ツールも使用できます。

Q. PDFファイルは検索結果で高くランク付けされることがありますか?

A: もちろんです!他のウェブサイトと同様にランク付けされます。Google検索エンジンによって返されるすべてのPDF文書は、そのコンテンツと、他のページにどのように埋め込まれ、リンクされているかによって高くランク付けされます。

Q. HTMLとPDFの両方でページを持っている場合、重複コンテンツになりますか?

A: Googleは、可能な限りコンテンツのコピーを1つだけ提供することを推奨しています。それができない場合は、優先バージョンを指定してください。これは、サイトマップにURLを含めるか、HTTPヘッダーまたはPDFリソースのHTMLで正規バージョンを指定することで行えます。

Q. 検索結果に表示されるPDF文書のタイトルを変更するにはどうすればよいですか?

A: Googleは表示されるタイトルを決定するために2つの要素を使用します:ファイルに含まれるタイトルメタデータと、PDFファイルを指すリンクのアンカーテキストです。Googleは、アルゴリズムに正しいタイトルについて強力なシグナルを与えるために、両方を更新することを推奨しています。

PDFでのフォント処理をコントロールする方法

PDFでのフォント処理をコントロールする方法

PDFを作成する際は、フォントを埋め込むことが重要です。これにより、誰かが文書を表示または印刷する際に、使用したフォントが正しく表示されることが保証されます。デバイスに同じフォントがインストールされていない人とPDFを共有する場合、PDFが表示時に意図した通りに見えない可能性があるからです。

PDFファイルにフォントが埋め込まれていない場合はどうなりますか?

PDFにフォントを含めていない場合、PDF文書を表示する人で必要なフォントを持っていない人は、代わりに標準システムフォントが使用されるという警告を受け取ります。

フォント置換は、文書の外観、ページの流れ、レイアウト、可読性を変更する可能性があります。テキストが画像と重なったり、意図した場所から移動したりする原因となることがあります。

プロフェッショナル印刷用にファイルを準備する際、これは人々がフォントを含んだPDFとして送信を求める最も一般的な理由の1つです。

すべてのフォントを埋め込むか、サブセットフォントを埋め込むか?

PDFにフォントを含める際には、いくつかの選択肢があります。すべてのフォント、非標準フォントのみ、特定のフォントリスト、またはフォントを全く含めないことができます。

非標準フォントのみ、または現在使用している特定のフォントリストのみを埋め込むことを選択できます。多くの場合、一般的なシステムフォントを埋め込まないか、PDFで現在使用しているフォントの埋め込みサブセットを選択することで、ファイルサイズを縮小できます。

または、すべてのフォントを埋め込むことを選択することもできます。これは印刷に最適です。すべてのフォントを埋め込むとファイルサイズは増加しますが、書式を保持し、文書を編集可能に保ちます。

埋め込みはフォント置換を回避する最も簡単な解決策です

PDF文書を作成する際に受信者側でフォント置換が発生する可能性を回避するには、ファイルにフォントを埋め込む必要があります。すべてのフォントを含めるか、サブセットのみを含めるか、どちらのオプションを選択しても、フォントを埋め込むことでそれらのフォント置換は発生しません。ユーザーは文書で使用したのと同じフォントを見ることができ、意図した通りに見え、流れ、印刷されます。

Foxit PDF Editorを使用すると、これが簡単なプロセスになります。PDFにフォントを埋め込む方法は以下の通りです。

Windows版Foxit PDF EditorでPDF文書にフォントを埋め込む方法

Foxit PDF Editorでは、PDFファイル内でテキストを追加または編集する際に、すべてのフォントを自動的に埋め込むことができます。また、既存のPDFファイルをフォントを含んだ新しいPDFファイルに変換することもサポートしています。

PDF文書にフォントを埋め込むための異なるアプローチは以下の通りです:

  • 非PDFファイルをフォントが埋め込まれたPDF文書に変換する
  • 既存のPDFファイルをフォントが埋め込まれた新しいPDFファイルに変換する
  • PDFファイル内でテキストを追加または編集する際に自動的にフォントを埋め込む

以下、これらの各シナリオに取り組みましょう。

非PDFファイルをフォントが埋め込まれたPDF文書に変換する

  1. PDFに変換したいファイルを適切なプログラムで開きます。
  2. ファイルメニューに移動し、印刷コマンドを選択し、プリンターリストでFoxit PDFプリンターを選択します。
  3. プリンターのプロパティをクリックし、設定タブの編集ボタンをクリックします。
  4. ポップアップダイアログボックスでフォントを選択し、すべてのフォントを埋め込むを選択してから、画面オプションに従って変更を行います。

既存のPDFファイルをフォントが埋め込まれた新しいPDFファイルに変換する

  1. Foxit PDF Editorファイル > 環境設定に移動するか、Ctrl + Kを押して環境設定ウィンドウを開きます。印刷タブを見つけ、テキストを図形として印刷(フォントの埋め込みを無視)オプションのチェックを外し、OKをクリックして変更を適用します。
  2. Foxit PDF EditorでPDFを開き、ファイル > 印刷をクリックして印刷ダイアログボックスを開き、Foxit PDF Editorプリンターを選択します。
  3. プロパティをクリックしてFoxit PDFプリンターのプロパティウィンドウを開き、設定タブの編集ボタンをクリックします。
  4. ポップアップダイアログボックスでフォントを選択し、すべてのフォントを埋め込むを選択してから、画面オプションに従って変更を行います。
  5. 印刷ダイアログボックスで画像として印刷オプションにチェックを入れないことを確認します。OKボタンをクリックして、開いているPDFファイルを新しいPDF文書に印刷します。

PDFでテキストを追加または編集するたびにフォントを埋め込む

PDFファイル内でテキストを変更する際に、このプロセスから手動作業と精神的負担を取り除くには、テキストを更新して保存した場合はいつでも自動でフォントを埋め込むオプションを使用します。方法は以下の通りです:

(このオプションはFoxit PDF Editorバージョン12.0以降で利用可能です。以前のFoxit PDF Editorバージョンでは、PDFファイルはすべてのテキストオブジェクトがパスモードに配置された新しいPDFに変換されます。)

Foxit PDF Editorで、ファイルタブ > 環境設定 > 文書に移動し、テキストを更新して保存した場合はいつでも自動でフォントを埋め込むオプションにチェックを入れ、OKをクリックして設定を保存します。

ご覧の通り、最も優れた点は、PDFでテキストが編集または変更された際の自動フォント埋め込みにより、あなたや文書を編集する他の誰もが、これを覚えておく必要がなく、フォントと埋め込み全体を手動で実行する必要がないことです。

埋め込まれたフォントを削除する必要がある場合はどうしますか?

Foxit PDF EditorのPDF最適化ダイアログボックスの埋め込み解除パネルを使用してください。

このパネルには、フォント用の2つのリストが含まれています:埋め込み解除可能なフォントと、埋め込みを解除するフォントです。文書内のフォントの埋め込みを解除するには、以下を行います:

1. 最初にパネルのチェックボックスを選択します。

2. 埋め込みを解除したい1つ以上のフォントを選択します。

埋め込まれたフォントリストで埋め込み解除ボタンをクリックして、フォントを埋め込みを解除するフォントリストに追加します。文書で使用されている文字のみ(フォントのサブセット)を埋め込みたい場合は、サブセット形式ですべてのフォントを埋め込むオプションを選択します。

3. 埋め込み解除リストから追加されたフォントを削除(オプション)

埋め込みを解除するフォントリストから追加されたフォントを削除するには、フォントを選択して保持ボタンをクリックします。文書内のフォントの埋め込みを一切解除したくない場合は、フォントの埋め込みを解除しないを選択します。

PDFでのフォント埋め込みは、デザインに依存して情報を伝える任意のタイプの文書にとって重要なステップです。これらの簡単な手順に従うことで、PDFが意図した通りに見え、印刷され、読まれることを確保できます。