最近,手機(jī)QQ最新版本升級了“圖片文字提取”功能,可以將圖片中的文字提取出來并可以隨意編輯,用起來簡直方便到逆天。
只要打開手機(jī)QQ,長按對話框中的圖片選擇“提取圖中文字”,或是點(diǎn)擊“掃一掃”中的“文字提取”,在超有科幻感的“正在識別中”完成之后,用戶就可以得到圖片中轉(zhuǎn)化出的文字。提取出的文字還可以隨意編輯,復(fù)制粘貼修改都沒問題。
手機(jī)QQ的這一新大招,正是基于騰訊優(yōu)圖實(shí)驗(yàn)室提供的OCR文字識別技術(shù)。
復(fù)雜場景也不怕 OCR技術(shù)帶來的讀圖識字時(shí)代
優(yōu)圖的OCR文字識別技術(shù),顧名思義,就是將圖片上的文字內(nèi)容,智能識別成為可編輯的文本。
無論是生活中復(fù)雜多變場景,還是不同光照條件,甚至透視變形的情況下,優(yōu)圖OCR技術(shù)都可以在任意版面下識別出整圖的文字,包括中英文、字母、數(shù)字、標(biāo)點(diǎn)等共1000標(biāo)簽,并覆蓋到數(shù)十種字體,滿足生活中大部分場景的讀圖識字需求,以解決生活和溝通中的痛點(diǎn)。
背后的黑科技是基于優(yōu)圖實(shí)驗(yàn)室世界領(lǐng)先的深度學(xué)習(xí)技術(shù),識別準(zhǔn)確率也居于業(yè)界一流水平。近期,優(yōu)圖團(tuán)隊(duì)在國際權(quán)威的ICDAR2015“Robust Reading Competition”的自然場景文本檢測項(xiàng)目,以及ICDAR2015“Focused Scene Text”場景文字識別任務(wù)中,均以優(yōu)越的表現(xiàn)超越眾多競爭對手,取得了排名第一的佳績。
OCR技術(shù)實(shí)現(xiàn)多場景應(yīng)用落地讓溝通無障礙
實(shí)際上,在我們的日常生活中,不少細(xì)微之處都有讀圖識字的需求,優(yōu)圖OCR技術(shù)貼心地填補(bǔ)這些細(xì)節(jié)的需求空缺,從而提高了人們生活的品質(zhì)和工作的效率:
在日常會議或課堂中,用手機(jī)拍下PPT、演示稿,能立即對圖片中的文字進(jìn)行編輯,而不再因?yàn)榛庞诔瓕懚e(cuò)過了臺上的精彩分享;
在超市里,隨手拍下想買的商品分享給家人,即時(shí)從圖片中提取文字而不用拉動(dòng)圖片放大看文字,快速解決“選擇困難癥”;
在編輯室內(nèi),隨手拍海量紙質(zhì)資料進(jìn)行圖片文字提取編輯,以便排版、存檔、檢索,傳統(tǒng)媒體數(shù)字化轉(zhuǎn)型無需再消耗巨大人力在前期資料歸集上;
在家里,長輩為拉近與兒孫輩的距離,不用再對著年輕人發(fā)來的圖片一籌莫展,通過圖片文字提取識別便能夠看清圖上文字;
而對于存在視覺障礙的人群而言,OCR技術(shù)還能幫助他們讀圖識字,甚至結(jié)合語音技術(shù),這些文字能被轉(zhuǎn)化為語音,進(jìn)而避免很多溝通障礙,更具社會意義。
除此之外,優(yōu)圖的OCR技術(shù)還支持印刷體和手寫體識別,包括身份證、名片等卡證類,也支持票據(jù)、運(yùn)單等定制化場景的識別,這些讓信息錄入更加快速高效,而錄入人員再也不用敲鍵盤到手酸了。同時(shí),OCR通用識別還可應(yīng)用于互聯(lián)網(wǎng)內(nèi)容審核管理,能夠高效、智能識別廣告圖片中的所有文字內(nèi)容,準(zhǔn)確過濾掉廣告中的違規(guī)文字及黑產(chǎn)廣告。
潦草的手寫體也能識別快遞不會再送錯(cuò)人了
優(yōu)圖的OCR技術(shù)與傳統(tǒng)行業(yè)的結(jié)合,還能對行業(yè)產(chǎn)生更深遠(yuǎn)的影響。如在物流行業(yè),OCR技術(shù)的應(yīng)用就能夠提高快遞運(yùn)單的識別效率,從而給消費(fèi)者帶來更便捷高效的快遞服務(wù)。
現(xiàn)如今,依然有很多快遞單上都是手寫的地址信息,潦草的字容易認(rèn)錯(cuò)而加大了物流中的人力、物力和時(shí)間成本。近期,優(yōu)圖的OCR技術(shù)就與順豐技術(shù)團(tuán)隊(duì)合作,實(shí)現(xiàn)快速識別手寫體的快遞單,再潦草的手寫寄件收件信息也能夠識別,并接近人工識別水平。
優(yōu)圖的OCR技術(shù)也在展開積極的內(nèi)外部合作。手機(jī)QQ、順豐之外,優(yōu)圖OCR識別技術(shù)也與騰訊微云達(dá)成合作,為其用戶提供圖片內(nèi)文字的檢測和識別服務(wù)。
在云時(shí)代,通過技術(shù)的不斷優(yōu)化和廣泛的內(nèi)外部合作,在隨手可及的細(xì)微之處滿足日常生活的圖文轉(zhuǎn)換需求,對接行業(yè)成為數(shù)字化迭代的源動(dòng)力,優(yōu)圖OCR技術(shù)的意義正在于此。目前優(yōu)圖的OCR技術(shù)已經(jīng)通過騰訊云對外開放,用科技連接各行各業(yè),帶動(dòng)行業(yè)的智能化變革。在未來,希望每一個(gè)普通人也都將從中受益。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!