日韩免费在线观看成人,骚碰成人免费视频,电影院 摸 湿 嗯…啊h

    1. <span id="um726"><blockquote id="um726"></blockquote></span>

        <span id="um726"><blockquote id="um726"></blockquote></span>
        1. 您的位置:首頁>科技 >內(nèi)容

          為什么語言技術(shù)無法處理權(quán)力的游戲

          2019-06-27 09:25:12來源:
          導(dǎo)讀來自阿姆斯特丹自由大學(xué)和荷蘭皇家學(xué)院人文科學(xué)研究所的研究人員評(píng)估了四種最先進(jìn)的工具,用于識(shí)別文本中的名字,評(píng)估和改善他們?cè)诹餍行≌f

          來自阿姆斯特丹自由大學(xué)和荷蘭皇家學(xué)院人文科學(xué)研究所的研究人員評(píng)估了四種最先進(jìn)的工具,用于識(shí)別文本中的名字,評(píng)估和改善他們?cè)诹餍行≌f中的表現(xiàn)。他們找到了解決方案,以提高工具識(shí)別一本小說中名稱的能力,準(zhǔn)確率為7%至90%。

          自然語言處理(NLP)工具通常用于許多日常應(yīng)用程序,如Siri和Google,但這些技術(shù)的有效性尚未完全理解。來自阿姆斯特丹自由大學(xué)和荷蘭皇家藝術(shù)學(xué)院人文科學(xué)研究所的研究人員對(duì)流行的40部小說中的四種不同的名稱識(shí)別工具進(jìn)行了全面評(píng)估,其中包括“權(quán)力的游戲”。他們的分析發(fā)表在PeerJ Computer Science上,突出顯示這些工具特別具有挑戰(zhàn)性的名稱和文本類型,以及減輕這種情況的解決方案。此外,他們從小說中提取社交網(wǎng)絡(luò),以探索故事結(jié)構(gòu)的差異。這些見解可以幫助使這些技術(shù)更加強(qiáng)大,以防止流派差異,并可以幫助例如使這項(xiàng)技術(shù)對(duì)想要分析大型數(shù)據(jù)集(如巴拿馬論文)的記者更有用。

          許多NLP工具都基于機(jī)器學(xué)習(xí);也就是說,訓(xùn)練計(jì)算機(jī)程序以基于先前饋送的示例識(shí)別文本中的模式。為了識(shí)別文本中的名字,例如,它提供了許多報(bào)紙文章,其中人類已經(jīng)仔細(xì)地標(biāo)記了名稱。然后,該程序的任務(wù)是根據(jù)上下文(例如,先于Mr)或單詞的形狀(例如,這些名稱通常以英文大寫字母開頭)來“學(xué)習(xí)”名稱的外觀。現(xiàn)在,將報(bào)紙上的這種系統(tǒng)應(yīng)用到小說中的問題在于,小說的作者在敘述方面比需要堅(jiān)持事實(shí)的記者有更多的自由。小說作者可以組成自己的名字,例如Tywin或R'hllor,或直接使用字典中的描述性字符名稱,例如Gray Worm。

          由Niels Dekker(Trifork BV),Tobias Kuhn(阿姆斯特丹自由大學(xué))和Marieke van Erp(KNAW Humanities Cluster)進(jìn)行的實(shí)驗(yàn)也突出了語言的靈活性以及名稱在故事中的背景。例如,可以將Daenerys Targaryen稱為Daenerys和她,但她也被稱為Dany,Daenerys Stormborn,龍之母,Khaleesi,Unburnt和Mhysa。為權(quán)力的游戲創(chuàng)建的社交網(wǎng)絡(luò),例如,她的朋友使用Dany,而她的敵人(在她缺席時(shí))只使用她的全名Daenerys。

          本出版物中描述的研究表明,應(yīng)該更多地關(guān)注NLP工具的性能,并且在計(jì)算機(jī)完全理解“文本”之前仍有工作要做。

          免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

          猜你喜歡

          最新文章