🔧 阿川の電商水電行
Shopify 顧問、維護與客製化
💡
小任務 / 單次支援方案
單次處理 Shopify 修正/微調
⭐️
維護方案
每月 Shopify 技術支援 + 小修改 + 諮詢
🚀
專案建置
Shopify 功能導入、培訓 + 分階段交付

感謝您打開這篇文章!
目前我正在利用 GitHub Copilot,致力於開發能提升業務效率的 Web 應用程式。

前一篇文章在這裡
【應用開發】希望減少手動輸入經費申請的新手,嘗試了 OCR,結果竟然能自動化 80%
本篇文章為上述應用的更新篇

在本篇文章中,我將分享提升 OCR 精度和重新檢視申請流程的過程,並介紹如何將「人也難以辨識的超長收據」進化為能瞬間填寫表單的應用程式!
還有影片,歡迎您看到最後喔!

目錄

  1. 改善的背景與本次主題
  2. Cloud Vision API × Gemini 重新檢視 OCR
  3. AI 重新檢視後的效果
  4. 申請流程的改善與 UI 的整理
  5. 最後

改善的背景與本次主題

在之前的篇章中,透過 OCR 我們已經能將經費申請自動化約 80% ,但實際運行後,我感受到現場使用還有很多改善的空間。

  • OCR 的誤讀
  • 表單反映的偏差
  • 差回時的混亂
    等問題,使得實際運用中顯得困難。

因此這次我們專注於改善以下兩點:

  • 讓 AI 重新檢視 OCR 結果的方式
  • 申請流程的 UI/UX 改善

Cloud Vision API × Gemini 重新檢視 OCR

在之前的架構中,OCR 處理與表單的反映是以以下方式進行的!

OCR.space API + 瀏覽器預處理(裁切 / 二值化) → 使用正則表達式提取金額・日期・商店候補

這種方法雖然可自動化約 80% ,但對於格式的變化不夠穩健,常會發生商店名稱和金額的誤讀。

因此這次我們切換為Cloud Vision API × Gemini API的組合,更加重視精度與彈性。

  • Cloud Vision API 負責「從圖片提取文字」
  • Gemini API 負責「理解結果的文脈並重新構建」

這是一個二段式的方式!

AI 重新檢視後的效果

我們讓 AI 再次閱讀那些之前無法順暢識別的超長收據。

實際的操作影片請看這裡
OCR前半.gif

【實際上傳的圖片】
圖片

透過 Vision × Gemini 的組合,即使是模糊的字符串,也能以文脈來補充正確的店名、金額和日期,形成的數據可達到人為確認的水準並自動輸入到表單中!

這樣一來,我們能夠正確解析格式不同的收據,逐步接近「能讀取任何收據」的實用水平!

申請流程的改善與 UI 的整理

隨著 OCR 精度的穩定,
我們開始關注「人操作起來更便利的流程」。

之前的申請後流程幾乎沒做實作。

因此這次更新加入了以下功能...

  • 新增管理者畫面,能進行狀態變更
  • 強制填寫差回理由
  • 新增差回時的申請編輯畫面
  • 自動更新申請歷史
  • 支援列表畫面的過濾搜尋

這些功能的添加使申請到報帳的流程變得更加順暢!

實際的操作影片請看這裡
OCR後半.gif

隨著功能的增強,申請到報帳的流暢度也有所提升!

最後

透過 Gemini 的結合,我逐漸感受到這款應用程式在變得更具可用性!我深刻感受到思考 AI 如何發揮作用是非常重要的!

在向前輩展示這款應用程式時,
我們獲得了關於「圖片的驗證檢查」及「管理者登出時的彈出提示」等細節方面的反饋,希望能進一步打磨這些細節。

我們會持續進行這些改善,並持續進行更新!


原文出處:https://qiita.com/ishikawa_slj/items/d24b88966fbad0174162


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝17   💬4   ❤️6
557
🥈
我愛JS
📝1   💬4   ❤️2
47
🥉
酷豪
1
#5
1
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
🔧 阿川の電商水電行
Shopify 顧問、維護與客製化
💡
小任務 / 單次支援方案
單次處理 Shopify 修正/微調
⭐️
維護方案
每月 Shopify 技術支援 + 小修改 + 諮詢
🚀
專案建置
Shopify 功能導入、培訓 + 分階段交付