Geminiを主役にした配当明細OCRで、GAS版を残した理由

Geminiを主役にした配当明細OCRで、GAS版を残した理由
目次

― Geminiを主役にしても、GAS版を残した理由 ―

前回の記事では、外国税額控除を前提に、配当明細OCRの主役をGemini(BananaPro などの高精度OCR)に切り替えた話を書きました。
今回はその続きとして、「それでもGAS版を残している理由」を、事実ベースで整理します。

結論は非常にシンプルです。

個人の金融データを、 そのままクラウド側に残す設計を一本化したくなかった。

これが理由のほぼすべてです。


問題にしたのは「AI」ではなく「データの残り方」

最初に、はっきりさせておきます。

  • AIが危険だから使わない
  • Geminiが信用できない

という話ではありません。

実際、私はGeminiを使っていますし、
配当明細OCRとしては主役に据えています。

それでも設計を分けた理由は、
個人の金融データがクラウド側にどう残るか
この一点だけでした。


GAS版とGemini版の違いは「精度」ではなく「データ保持」

今の構成では、GAS版とGemini版は
役割も思想もはっきり分かれています。

GAS版

  • Google Drive上のPDFを対象に処理する
  • クラウドは通る
  • やっているのは計算処理・整理処理だけ
  • 処理後に、データを保持しない

つまり、

クラウドを使うが、データを「残す」設計ではない

という位置づけです。


Gemini版

  • 配当明細PDFをそのままAIに渡す
  • 表構造や文脈を理解した高精度OCRが可能
  • ただし、クラウド側にデータが残り得る
  • 利用者が明示的に消さない限り、履歴が残る可能性がある

精度は圧倒的に高い。
その代わり、

データが「その場限り」ではなくなる

という違いがあります。


「通る」と「残る」は、設計としてまったく別物

ここは混同されがちですが、重要なポイントです。

  • GAS版もクラウドを通る
  • Gemini版もクラウドを使う

ただし設計上は、

  • GAS版:処理だけして消える
  • Gemini版:処理結果や元データが残り得る

という、決定的な違いがあります。

私はここで、
どちらか一方に一本化するべきかを考えました。


仕分けはしていない。比較した結果、Geminiを採用した

ここは誤解されやすいので、はっきり書きます。

  • GAS版は、AIに渡す前のフィルターではありません
  • 仕分け処理もしていません

最初は、

  • GAS版
  • Gemini版

同じ配当明細PDFに対して、同じOCR処理を行い、結果を比較していました。

その結果、

Geminiの方が明らかに優秀だった

ため、
OCRの主役をGeminiに切り替えました。

設計思想を先に決めたのではなく、
結果を見て判断したという順番です。


それでもGAS版を消さなかった理由

Geminiを主役にした時点で、
GAS版を完全に削除することも可能でした。

それでも残した理由は、ただ一つです。

GAS版は、計算処理だけで完結する 「安全側の代替ルート」だから。

  • 精度は落ちる
  • できることは少ない
  • でも、データをAIに渡さない

このルートを残しておくことで、

  • 設計を一本化しすぎずに済む
  • リスクの所在を明確にできる
  • 自分自身が納得できる

という状態を保てました。


主役はGemini。でも一本化しなかった

繰り返しますが、

  • OCRの主役はGemini
  • 精度も速度も圧倒的

です。

ただし、

「主役」と「唯一」は別

だと考えました。

  • 高精度だがデータが残る可能性があるルート
  • 精度は低いがデータを残さないルート

この二つを並べて残すことで、
設計の逃げ道を残したというだけです。



次に書くこと

ここまでで、

  • なぜGeminiを主役にしたのか
  • なぜそれでもGAS版を消さなかったのか

という判断の背景は、だいたい出揃いました。

次の記事では、
実際にGemini版で使っているプロンプトをそのまま紹介します。

  • 外国税額控除を前提に
  • 表構造を崩さず
  • 計算をAIに任せない

そのために、
どんな指示をGeminiに出しているのか。

設計思想が、
どんなプロンプトに落ちたのかを
具体例として書く予定です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

目次