近年來,人工智能迎來了深度學習的浪潮,技術呈現革命性的突破,尤其是在以視頻為核心的物聯網行業率先實現產業化,在公安、交通、金融等領域得到廣泛應用。大華股份作為視頻安防的領軍企業,在人工智能領域深耕多年,積累深厚的技術實力和產品經驗。
大華股份先進技術研究院,采用深度學習技術研發的文本檢測技術,取得了自然場景隨手拍文本檢測排行榜第一名,標志著大華股份在自然場景文字檢測方面取得了突破性進展,為技術成果落地奠定了堅實的基礎。
大華股份刷新了ICDAR Robust Reading 2015中的自然場景隨手拍任務(IncidentalScene Text)的全球最好成績,超越商湯、騰訊、百度、曠視等知名AI企業。該技術已經越來越多的應用到實際場景中,包括車牌字符識別、集裝箱號識別、物流面單識別、自然場景字符識別等領域。
關于ICDAR:即國際文檔分析與識別大會(International Conference on Document Analysis and Recognition),是國際模式識別協會舉辦的文檔分析與識別、模式識別領域世界最權威的國際學術會議之一,每兩年舉辦一次。
自然場景隨手拍任務
該任務中的文本背景復雜,成像存在噪聲、模糊、反光、傾斜等諸多干擾因素,檢測難度較大。大華股份以87.19%的準確率位列第一。
本次競賽在大華自主研發的深度學習平臺上,汲取了SENet和ResNet等網絡結構的優點,采用多特征、多通道融合的策略,并運用多模型融合技術,大幅提升了精度。
其中,該場景的文本檢測效果圖如下:
文本檢測技術在車牌識別系統中的應用
本次競賽中使用的技術已經在大華的智能交通等產品上得到廣泛應用,尤其在傾斜車牌的檢測中,取得突破性進展。