光學字符識別(OCR)是印刷或書寫的文本字符,光學掃描成位圖字符代碼,如ASCII的翻譯。這是把硬拷貝材料成可以編輯和以其他方式操縱的計算機上的數據文件的有效方法。這是長期使用圖書館和政府機構進行冗長的文件快速電子方式提供的技術。在OCR技術的進步已通過企業帶動了越來越多的使用。對於許多文檔輸入任務,OCR是最具成本效益和快速的方法可用。每年,該技術可釋放畝的存儲空間,一旦放棄對文件櫃和箱子全紙質文件。之前的OCR可以使用,在源材料必須使用光學掃描器(有時在PC的專用電路板)來讀取在頁面作為位圖(點圖案)進行掃描。軟件識別圖像也是必需的。
我們的軟件旨在解決孤立的手寫字符和UJI筆字符數據集採用神經網絡的數字分類。該數據由26個字符和10位樣品在Tablet PC上寫的11作家。的字符(在標準UNIPEN格式)在上部和下部殼體寫入兩者並有一整2組每作家的字符。所以輸出應在35類之一。最終的目標是建立每個字符一個作家獨立的模型。
有價值的特性的選擇是字符識別的關鍵,所以一個新的和有意義的功能集,統一鑑別標準坐標(UDNC),由C.安吉爾介紹,被採用。這些特徵表明,以改善使用簡單的分類算法,以便它們被用於訓練神經網絡,並測試其對UJI筆特徵數據集的性能的識別率。
關鍵詞:Matlab的,來源,代碼,OCR,光學字符識別,掃描文本,書面文字,ASCII字符隔離
要求:
Matlab的
評論沒有發現