100%正确率识别票据从金融领域切入挖掘文字识别的巨大价值
如果自然語言處理是人工智能皇冠上的一顆明珠,那么文字識別就是這顆明珠下不可或缺的底座。
關鍵詞:人工智能、文字識別、人臉識別、花旗銀行、OCR識別技術、準確率逼近100%
一句話提煉:基于OCR識別技術快速抓取圖像中文字信息錄入系統,節約相關從業人員95%的重復工作時間。
20世紀70年代以來,『空間技術』、『能源技術』以及『人工智能』被稱為世界三大尖端技術,而隨著人工智能近三十年來的迅速發展,無論是理論還是實踐,人工智能已逐漸自成一體,并且在多個領域實現了完美的結合,推動產業實際的應用發展。
由于人類對世界的感知有約80%是通過眼睛來獲取。因此在這其中,視覺感知或許稱得上是話題最多,也是最被大眾熟知的分支之一,典型的技術包括圖像識別、人臉識別以及視頻監控等等。
然而人們了解、學習這個社會更多的還是通過文字,但是文字識別技術卻一直沒有得到應有的關注,所謂的文字識別指的是利用計算機自動識別字符的技術。業界將自然語言處理譽為人工智能皇冠上的一顆明珠,那么文字識別則是這顆明珠下不可或缺的底座,沒有文字識別技術將紙張或圖片上的文字提取出來,機器也就無法進行后續的語義理解。
事實上,從上個世紀80、90年代開始,文字識別就已經在國外的表單名片識別、郵政編碼及自動分揀、票據自動處理等領域得到了廣泛的應用,大大降低了人力成本以及人工所導致的高誤差率。
也正是在文字識別技術高速發展的時期,『微模式』創始人陳友斌從清華大學博士畢業,隨后便赴美國科羅拉多州立大學繼續深造,并在之后的2、30年間專注于自動目標識別、圖像識別、機器視覺等領域的研究。
陳友斌博士告訴我們,『當時我帶領團隊主持研發的英文票據自動化識別系統,一度做到了世界第一,占領了歐美很大的市場份額,被花旗、匯豐、Bank of America等多家知名銀行應用。』
『美國平均每年會產生約50億張支票,且歐美國家人力成本普遍偏高,因此他們從90年代就開始大量使用機器進行相關的票據處理了。反觀國內的發展,甚至到了今天還有很大一部分企業依然在沿用人工錄入信息的方式,更別提10到20年前的中國了。』
愛國情懷這個詞,平時說起來或許顯得虛無縹緲了些,但當真正身處異國他鄉時,便是真真切切的思念與愛護。『出了國之后,尤其不愿意聽到別人說中國落后,或者說中國偷了他們的知識產權。當我們把票據識別做到世界領先時,我首先想到的是中國還很缺乏這樣的技術,那么我能不能回來填補這樣的空白,如果我帶領一支團隊在國內也做到世界第一,那到時候是誰偷誰的呢。』
于是,2005年陳友斌放棄了在美國已然成熟的職業路徑,回國后首先在母校清華任職,以便熟悉國內的相關行業情況。并于2007年初,成立了『微模式』,專注于文本圖像處理與識別、視頻圖像處理、OCR識別技術,和人體生物特征識別等相關領域。
只要是輸出的識別結果準確率逼近100%
科學家們從50年代便開始探討文字識別的方法,并研制出了光學字符識別器,70年代開始開始逐漸重視于漢字識別的研究與發展。然而由于中文字筆畫繁多、字符結構復雜、形近字較多,因此識別中文字符的難度,相較于英文識別要困難得多。
『并且,國內企業習慣在票據上有文字的地方蓋章,這樣一來無疑又加大了字符的提取難度。此外,國外的票據個性化較強,例如個人支票上的背景圖片可以根據所有者的喜好自由選擇,因此造假難度偏高,而中國的票據樣式都是統一的,如此一來,防偽難度也相應提高了。』
『但我們在票據識別、票據防偽、手寫簽名驗證、人證對比、以及車輛識別等技術領域,都已經達到世界領先水平,相關產品也已在銀行、安防、互聯網金融等多個領域實現了商業落地。』
人票據識別
據陳友斌博士的介紹,文字識別除了傳統的銀行業,還可以應用于許多領域,例如互聯網金融、代記賬企業、財務或審計公司、保險公司、證券公司,檔案館,包括工商稅務甚至是婚戀網站。簡單來說就是,一切需要抓取、錄入紙質材料或電子圖片中文字信息的企業,都有可能是『微模式』的潛在合作伙伴。
『拿保險公司舉例,按傳統的方式,需要消費者把身份證、銀行卡、保單、繳費憑證等材料的原件及復印件統一快遞給保險公司,然后由保險公司的工作人員進行手工錄入信息,等待保險賠付,這個過程快則2-3個星期,慢則2-3個月。但現在只需要用戶將所有資料拍照上傳,經過系統的影像質量評判后,機器通過深度學習技術便會自動將照片上的文字識別出來,然后進行可視化呈現以及系統備份,整個過程只要幾分鐘即可完成。』
『此外,現在的無紙化支付、無紙化辦公趨勢對我們非但沒有影響,反而產生了例如活體檢測、認證是否一致等更多需要驗證的場景。歸根結底,無紙化只是把原來集中在商戶與消費者之間的工作量分配到了每一個消費者自己的身上,從而加快支付流程,例如在餐廳開具了電子發票后,消費者回到公司還是要打印出來才能給財務報銷,所以只是信息的載體發生了變化,信息量只會有增無減。』
『用我們平臺識別輸出的結果,幾乎可以做到一個字不錯,準確率逼近100%。』
『微模式』以其核心技術為基礎,根據多層次的市場需求,既研發了相對的通用產品,如針對互聯網金融、財務或審計部門、工商稅務、銀行網上業務、包括婚戀網站等企業的互聯網識別驗證云平臺,用戶只需將資料拍照上傳即可進行快速識別及驗證;同時也有針對不同細分領域的解決方案,例如針對安防領域的動態人臉布控系統、OCR識別警務應用、天網搜車系統等;以及人證合一身份驗證一體機、人臉考勤機、人臉閘機等硬件結合產品。
人證合一檢測
陳友斌說道,『我們最核心的技術和產品更多的在文字、票據識別方面,但我們的人臉識別技術同樣是處在行業第一梯隊的,有單項數據冠軍。像武漢大學今年舉辦的櫻花展,入口處的通關閘機使用的就是我們的產品。』
『我們希望產品盡量做到與設備無關、與行業無關的通用化,如果客戶有特定的需求我們再加上部分的定制化設置。』
由于陳友斌此前一直從事外資銀行的相關服務工作,因此對于傳統銀行乃至金融行業都有非常透徹的理解,如何針對行業痛點提出整體解決方案,讓產品的使用體驗更加符合從業人員的期待,而這些方面,不是一家單純有技術的企業就能夠做到的。
『客戶要的是產品的整體性能,他們不會過多的在乎準確度是99%還是95%。因此在這一點上,我們相對其他企業有更大的優勢,同樣這也是我們的壁壘所在。』
人工智能改變世界終究還是要從每一個細分領域開始,那么契合垂直場景中的需求或許就是撬開市場的這根杠桿了。
總結
以上是生活随笔為你收集整理的100%正确率识别票据从金融领域切入挖掘文字识别的巨大价值的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI插件推荐
- 下一篇: (已解决)Android Studio