🔧 阿川の電商水電行

Shopify 顧問、維護與客製化

💡

小任務 / 單次支援方案

單次處理 Shopify 修正／微調

⭐️

維護方案

每月 Shopify 技術支援 + 小修改 + 諮詢

🚀

專案建置

Shopify 功能導入、培訓 + 分階段交付

👉 瞭解詳情 / 免費諮詢

小編精選 - 技術文章翻譯 · 11月10日

[續] 一位不願止步於 80% 自動化的新手，使用 OCR 和 Gemini 軟體，在「長收據」上實現了 3% 的誤讀率！

感謝您打開這篇文章！
目前我正在利用 GitHub Copilot，致力於開發能提升業務效率的 Web 應用程式。

前一篇文章在這裡
【應用開發】希望減少手動輸入經費申請的新手，嘗試了 OCR，結果竟然能自動化 80%
本篇文章為上述應用的更新篇！

在本篇文章中，我將分享提升 OCR 精度和重新檢視申請流程的過程，並介紹如何將「人也難以辨識的超長收據」進化為能瞬間填寫表單的應用程式！
還有影片，歡迎您看到最後喔！

改善的背景與本次主題

在之前的篇章中，透過 OCR 我們已經能將經費申請自動化約 80% ，但實際運行後，我感受到現場使用還有很多改善的空間。

OCR 的誤讀
表單反映的偏差
差回時的混亂
等問題，使得實際運用中顯得困難。

因此這次我們專注於改善以下兩點：

讓 AI 重新檢視 OCR 結果的方式
申請流程的 UI/UX 改善

Cloud Vision API × Gemini 重新檢視 OCR

在之前的架構中，OCR 處理與表單的反映是以以下方式進行的！

OCR.space API + 瀏覽器預處理（裁切 / 二值化） → 使用正則表達式提取金額・日期・商店候補

這種方法雖然可自動化約 80% ，但對於格式的變化不夠穩健，常會發生商店名稱和金額的誤讀。

因此這次我們切換為Cloud Vision API × Gemini API的組合，更加重視精度與彈性。

Cloud Vision API 負責「從圖片提取文字」
Gemini API 負責「理解結果的文脈並重新構建」

這是一個二段式的方式！

AI 重新檢視後的效果

我們讓 AI 再次閱讀那些之前無法順暢識別的超長收據。

實際的操作影片請看這裡
OCR前半.gif

【實際上傳的圖片】

透過 Vision × Gemini 的組合，即使是模糊的字符串，也能以文脈來補充正確的店名、金額和日期，形成的數據可達到人為確認的水準並自動輸入到表單中！

這樣一來，我們能夠正確解析格式不同的收據，逐步接近「能讀取任何收據」的實用水平！

申請流程的改善與 UI 的整理

隨著 OCR 精度的穩定，
我們開始關注「人操作起來更便利的流程」。

之前的申請後流程幾乎沒做實作。

因此這次更新加入了以下功能...

新增管理者畫面，能進行狀態變更
強制填寫差回理由
新增差回時的申請編輯畫面
自動更新申請歷史
支援列表畫面的過濾搜尋

這些功能的添加使申請到報帳的流程變得更加順暢！

實際的操作影片請看這裡
OCR後半.gif

隨著功能的增強，申請到報帳的流暢度也有所提升！

最後

透過 Gemini 的結合，我逐漸感受到這款應用程式在變得更具可用性！我深刻感受到思考 AI 如何發揮作用是非常重要的！

在向前輩展示這款應用程式時，
我們獲得了關於「圖片的驗證檢查」及「管理者登出時的彈出提示」等細節方面的反饋，希望能進一步打磨這些細節。

我們會持續進行這些改善，並持續進行更新！

原文出處：https://qiita.com/ishikawa_slj/items/d24b88966fbad0174162

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

0個讚 0留言 449瀏覽

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

🏆 本月排行榜

🥇

站長阿川

📝26 💬4

628

🥈

我愛JS

💬5

🥉

徐浩瑋

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次

🔧 阿川の電商水電行

Shopify 顧問、維護與客製化

💡

小任務 / 單次支援方案

單次處理 Shopify 修正／微調

⭐️

維護方案

每月 Shopify 技術支援 + 小修改 + 諮詢

🚀

專案建置

Shopify 功能導入、培訓 + 分階段交付

👉 瞭解詳情 / 免費諮詢

🔧 阿川の電商水電行

[續] 一位不願止步於 80% 自動化的新手，使用 OCR 和 Gemini 軟體，在「長收據」上實現了 3% 的誤讀率！

[續] 一位不願止步於 80% 自動化的新手，使用 OCR 和 Gemini 軟體，在「長收據」上實現了 3% 的誤讀率！

目錄

改善的背景與本次主題

Cloud Vision API × Gemini 重新檢視 OCR

AI 重新檢視後的效果

申請流程的改善與 UI 的整理

最後

小編精選 - 技術文章翻譯

🏆 本月排行榜

🔧 阿川の電商水電行