根據(jù)Google 最近報(bào)告的解釋?zhuān)?fù)責(zé)Google Gboard應(yīng)用程序中機(jī)器學(xué)習(xí)的開(kāi)發(fā)人員創(chuàng)建了一種新的機(jī)器學(xué)習(xí)模型,該模型甚至可以識(shí)別一些最差的筆跡。
自從首次啟動(dòng)以來(lái),由AI驅(qū)動(dòng)的鍵盤(pán)模式已經(jīng)有了實(shí)質(zhì)性的改進(jìn),但是最新的變化可能是迄今為止最大的變化。隨著AI的發(fā)展,對(duì)手寫(xiě)功能背后的機(jī)器學(xué)習(xí)進(jìn)行了新??的修訂,從而產(chǎn)生了新的模型體系結(jié)構(gòu)和訓(xùn)練方法,可以比上一次迭代提高20%到40%。
該公司在一篇新論文中對(duì)最新方法進(jìn)行了詳細(xì)介紹,乍一看似乎異常復(fù)雜,但實(shí)際上可能更加直觀。它基于對(duì)接觸點(diǎn),貝塞爾曲線(xiàn)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)(特別是準(zhǔn)遞歸神經(jīng)網(wǎng)絡(luò)(QRNN))的識(shí)別的介紹。
這意味著該系統(tǒng)不再完全依賴(lài)于“手工設(shè)計(jì)的試探法”,該試探法將筆劃簡(jiǎn)單地分離為單獨(dú)的字符。相反,它從記錄代表給定筆劃起點(diǎn)的觸摸點(diǎn)開(kāi)始。這些標(biāo)記有時(shí)間戳,以幫助分離它們打算作為哪個(gè)字符的一部分,但系統(tǒng)還會(huì)將這些點(diǎn)計(jì)算并分解為計(jì)算機(jī)可讀的貝塞爾曲線(xiàn)-本質(zhì)上是經(jīng)過(guò)切去的部分,從而可以更準(zhǔn)確地讀取坐標(biāo)曲線(xiàn)中風(fēng)。
QRNN的作用是在卷積層和循環(huán)層之間交替,在將手寫(xiě)文本解碼為字母之前讀取曲線(xiàn)和接觸點(diǎn)。
綜上所述,AI讀取每個(gè)字符時(shí)所寫(xiě)的字符,其方式與人們觀看所寫(xiě)字母的方式(即筆跡的流程)更相似。這樣可以根據(jù)系統(tǒng)容易識(shí)別的更自然的參數(shù)集進(jìn)行更好的猜測(cè),將每個(gè)單獨(dú)的曲線(xiàn)與數(shù)據(jù)集進(jìn)行比較,以產(chǎn)生結(jié)果的概率,默認(rèn)輸出和建議。