Dify:ワークフロー (PDFファイルの要約)

チャットボットやチャットフローが対話的な作業に適しているのに対して、ワークフローは、時間のかかるタスクを自動化するのに向いています。

最初のワークフロー

最初のワークフローとして、論文の要約処理を自動化してみます。

  • 複数のpdfファイルを読み込む
  • テキストを抽出する
  • 日本語の要約と、引用文献を出力する
開始

開始時に複数のファイル入力を必須とします。

イテレーション

複数のファイルリストを一つづつ処理をするために、イテレーションを用います。

イテレーションの入力は開始ブロックのdocsの配列、出力はLLMブロックのtextの配列となります。

テキスト抽出ツール

txt以外のドキュメントを受け付けるために、テキスト抽出ツールを使います。

LLM

モデルを設定して、プロンプトで処理を指示します。今回は、単純なテキスト処理なので、gpt-4o-miniを使います。

終了

イテレーションのoutputを出力して終了します。

実行結果

アプリケーションとして実行した結果は、以下のようになります。

まとめ

複数のファイルを一括処理する場合などは、チャットフローではなくワークフローを使うと便利です。

なお、ワークフローの場合には、アプリケーションとして使うのではなく、APIを呼び出す形にすることで、所定のフォルダのファイルを読み取ったり、結果をExcelファイルにまとめたりと、自動化を進めることができます。

目次