最近在研究如何把黏在一起的字給分開,好往下一步 餵給機器來讓他識別!!(自己不大算講太深,我只想寫個心得,我從無概念,到現在搞了快一週了,難度頗高!! 原因這個論文數學式沒導清楚,會用,但有些不知道原因,導致弄了很久找問題,而且也不適合完全所有黏字的圖片)
我一開始以為很簡單,想說套個API馬上就好,沒想到實非易事。中間卡關時,因為很多時候碰到的黏字非常歪斜,躁點多,导至compiler 編譯時,識別不出來。像這種圖靈識別的圖,人可以看的出來,但要給機器看,有一點難度。

我就自己摸了索了,拜讀了G. Congedo, G. Dimauro, S. Impedovo, G. Pirlo寫的Segmentation of Numeric Strings這篇論文,花了三到四天,讀熟他時,開始實作這種滴水分割法,對這種黏在一起的字,來切再適合也不過了
試著用code 來仿他的論文中的數學式
他這難點在水滴降落點在x軸線上的哪一部分,我上網看其他人都是把它投影到x軸上,取其長度的中位數在減4
+在加後面的值(看那幾乎等於零a.index(min(b),心想那這寫有啥屁用!! 論文上也沒交待清楚,他們因該有些例外,覺得不合理,自己try很多次改良了他的參數值
雖然樣子不是很好看,但測試的資料網上都有,可以把字餵給機器教他辨識字母了!!
网友评论