― Geminiを主役にしても、GAS版を残した理由 ―
前回の記事では、外国税額控除を前提に、配当明細OCRの主役をGemini(BananaPro などの高精度OCR)に切り替えた話を書きました。
今回はその続きとして、「それでもGAS版を残している理由」を、事実ベースで整理します。
結論は非常にシンプルです。
個人の金融データを、 そのままクラウド側に残す設計を一本化したくなかった。
これが理由のほぼすべてです。
問題にしたのは「AI」ではなく「データの残り方」
最初に、はっきりさせておきます。
- AIが危険だから使わない
- Geminiが信用できない
という話ではありません。
実際、私はGeminiを使っていますし、
配当明細OCRとしては主役に据えています。
それでも設計を分けた理由は、
個人の金融データがクラウド側にどう残るか
この一点だけでした。
GAS版とGemini版の違いは「精度」ではなく「データ保持」
今の構成では、GAS版とGemini版は
役割も思想もはっきり分かれています。
GAS版
- Google Drive上のPDFを対象に処理する
- クラウドは通る
- やっているのは計算処理・整理処理だけ
- 処理後に、データを保持しない
つまり、
クラウドを使うが、データを「残す」設計ではない
という位置づけです。
Gemini版
- 配当明細PDFをそのままAIに渡す
- 表構造や文脈を理解した高精度OCRが可能
- ただし、クラウド側にデータが残り得る
- 利用者が明示的に消さない限り、履歴が残る可能性がある
精度は圧倒的に高い。
その代わり、
データが「その場限り」ではなくなる
という違いがあります。
「通る」と「残る」は、設計としてまったく別物
ここは混同されがちですが、重要なポイントです。
- GAS版もクラウドを通る
- Gemini版もクラウドを使う
ただし設計上は、
- GAS版:処理だけして消える
- Gemini版:処理結果や元データが残り得る
という、決定的な違いがあります。
私はここで、
どちらか一方に一本化するべきかを考えました。
仕分けはしていない。比較した結果、Geminiを採用した
ここは誤解されやすいので、はっきり書きます。
- GAS版は、AIに渡す前のフィルターではありません
- 仕分け処理もしていません
最初は、
- GAS版
- Gemini版
同じ配当明細PDFに対して、同じOCR処理を行い、結果を比較していました。
その結果、
Geminiの方が明らかに優秀だった
ため、
OCRの主役をGeminiに切り替えました。
設計思想を先に決めたのではなく、
結果を見て判断したという順番です。
それでもGAS版を消さなかった理由
Geminiを主役にした時点で、
GAS版を完全に削除することも可能でした。
それでも残した理由は、ただ一つです。
GAS版は、計算処理だけで完結する 「安全側の代替ルート」だから。
- 精度は落ちる
- できることは少ない
- でも、データをAIに渡さない
このルートを残しておくことで、
- 設計を一本化しすぎずに済む
- リスクの所在を明確にできる
- 自分自身が納得できる
という状態を保てました。
主役はGemini。でも一本化しなかった
繰り返しますが、
- OCRの主役はGemini
- 精度も速度も圧倒的
です。
ただし、
「主役」と「唯一」は別
だと考えました。
- 高精度だがデータが残る可能性があるルート
- 精度は低いがデータを残さないルート
この二つを並べて残すことで、
設計の逃げ道を残したというだけです。
次に書くこと
ここまでで、
- なぜGeminiを主役にしたのか
- なぜそれでもGAS版を消さなかったのか
という判断の背景は、だいたい出揃いました。
次の記事では、
実際にGemini版で使っているプロンプトをそのまま紹介します。
- 外国税額控除を前提に
- 表構造を崩さず
- 計算をAIに任せない
そのために、
どんな指示をGeminiに出しているのか。
設計思想が、
どんなプロンプトに落ちたのかを
具体例として書く予定です。

コメント