画像処理の自動化(n8n)

n8nは、Difyと同様に非エンジニアでもAIを使った自動実行が実現できるツールです。Difyよりも使えるツールが多く、業務の自動実行を考えるのであれば、こちらも良い選択肢かと思います。

ただ、チャットボットのような対話的な使い方は想定されていないので、あくまでも「自動化=Automation」のためのツールだと考え、使い分けをすると良いかと思います。

今回は、n8nを使って、Googleドライブ上にある写真の説明をGoogleシートに出力する処理を自動化してみます。

目次

n8n

n8nはDifyと同様にオープンソースとして公開されています。クラウドサービスとして提供されているものを使うこともできますが、個人のパソコンや、自社サーバにインストールして使うこともできます。自動化のためには、各種認証情報などを設定することも多いので、気になる場合は、パソコン、もしくは自社サーバで使う方が良いかと思います。

基本的な使い方

基本的な操作方法は、直感的にわかるようになっています。

新規のワークフローを作成したら、nodeを追加し、繋げていきます。

nodeをクリックすると、nodeの設定画面になります。左のINPUTから入力となるオブジェクトをドラッグして、nodeに設定することができます。

図の例では、INPUTになる「List File in Folder」の”id”をドラッグして、Fileに設定したところです。

右上の「Test step」をクリックすると、このnodeがテスト実行されます。

ワークフロー

今回作成したワークフローは以下のようになっています。

トリガー:ワークフローを起動するきっかけです。この例では、「Test workflow」をクリックしたときに実行します。そのほかにも、アプリケーションのイベント発生(メールの受信など)や、決められた日時など、様々な条件で起動することができます。

Googleドライブ:Googleドライブの処理は2段階で行います。まず、「List Files in Folder」で所定のフォルダにあるファイルをリスト化し出力します。次にリスト化されたファイルをAIに渡すためにダウンロードします。

AI Node:AI Nodeは生成AIを使うためのノードです。プロンプトを書いて、AIに対する指示を行います。AI Nodeにも様々ありますが、「Basic LLM Chain」を使いました。また、画像の説明文を出力するモデルとして、GoogleのGeminiを使っています。

出力:出力も2段階で行います。まず、「Format fot Sheet」では、シートの各列に記入する変数を定義します。次の「Append to Google Sheet」で、書き込むシートを設定します。

Credentials

外部のツールを使う場合に、認証情報(Credentials)の設定が必要になります。今回のケースでは、以下の3つの設定が必要です。

Google関連のツールの場合には、Client IDと、Client Secretとを設定し、その後に、Sign in with Googleからサインインする必要があります。

Google Cloud コンソールで、使用するAPIを「有効化」すると、認証情報タグから、クライアントIDを取得することができます。また、対象となるクライアントを選択すると、クライアントシークレットを取得することができます。

実行結果

imagesフォルダに、6つの写真を配置して実行した結果を以下に示します。

結果のGoogleシート

このように、写真をテキスト化することによって、検索や分類が容易になるかと思います。

まとめ

n8nはDifyとは異なるアプローチでAIを使った自動実行アプリを実現できます。確かにノンコードで設定はできますが、Credentialsの設定など、多少の技術的知識が必要かと思います。

また、ツール独特のフロー構築にも多少のなれば必要かもしれません。とはいえ、用意されているnodeは大変充実しており、慣れれば業務効率化に大きく貢献できるものと思います。

最初は、Templateからやりたいことに近いものを探してきて、それを修正すると良いかと思います。

今回は、シンプルな画像認識を生成AIで実行しましたが、ラベル付けや分類などを組み合わせてもいいかもしれません。
また、画像ではなく、大量のコメントを、一気に分類したり要約して、Googleシートに貼り付けることもできるかと思います。

目次