日韩免费在线观看成人,骚碰成人免费视频,电影院 摸 湿 嗯…啊h

    1. <span id="um726"><blockquote id="um726"></blockquote></span>

        <span id="um726"><blockquote id="um726"></blockquote></span>
        1. 您的位置:首頁>要聞 >內(nèi)容

          擾流板警告 在您閱讀之前這個神經(jīng)網(wǎng)絡會發(fā)現(xiàn)危險的評論

          2019-07-10 11:13:15來源:
          導讀 這些天很難避免互聯(lián)網(wǎng)上的破壞者 - 即使你小心翼翼,隨機推文或推薦的新聞可能會浪費你的計劃,以便在一天晚些時候觀看那個季節(jié)的結(jié)局,

          這些天很難避免互聯(lián)網(wǎng)上的破壞者 - 即使你小心翼翼,隨機推文或推薦的新聞可能會浪費你的計劃,以便在一天晚些時候觀看那個季節(jié)的結(jié)局,或者在人群消退后觀看電影。但是很快AI工作人員就可以為你做擾流板,并在你有機會看之前標出劇透評論和內(nèi)容。

          SpoilerNet是加州大學圣地亞哥分校的一個團隊的成員,他們可能是那些試圖等待一周看無限戰(zhàn)爭并因為他們的麻煩而被搶購的人。再也不!

          他們匯集了一個由亞馬遜擁有的閱讀社區(qū)Goodreads提供的超過一百萬條評論的數(shù)據(jù)庫,在這里,任何評論中都會注意到破壞者,這主要是逐行的。作為網(wǎng)站的用戶,我很感謝這種能力,研究人員也是如此 - 因為在其他任何地方都沒有任何書面評論,其中任何構(gòu)成“劇透”的內(nèi)容都由一個盡職盡責的社區(qū)精心標記。

          (好吧,有點認真。正如研究人員所說:“我們觀察到實際上只有少數(shù)用戶使用此功能。”)

          無論如何,這些標記數(shù)據(jù)現(xiàn)在基本上是通常被稱為AI系統(tǒng)的食物:各種類型的神經(jīng)網(wǎng)絡,“學習”定義特定圖像,對象或在這種情況下擾流器的質(zhì)量。該團隊將130萬條Goodreads評論納入系統(tǒng),讓它觀察并記錄普通句子與其中包含劇透的句子之間的差異。

          也許評論的作者傾向于以某種方式開始用情節(jié)細節(jié)來表達句子 - “后來它被揭示......” - 或者可能是語言中的句子往往缺乏像“偉大”或“復雜”這樣的評價性詞語。誰知道呢?只有網(wǎng)絡。

          一旦訓練完成,代理人就會被一套單獨的句子(來自Goodreads和令人難以置信的時代電視特洛伊)放松,它可以被標記為“劇透”或“非劇透”,最多可達92準確率。早期嘗試計算預測句子中是否有破壞者并沒有那么好;蔣等人的一篇論文。去年開辟了新的領域,但受其數(shù)據(jù)集和方法的限制,這使得它只能考慮前面的句子。

          “我們還在同一評論文檔中對句子之間的依賴性和連貫性進行建模,以便可以合并高級語義,”SpoilerNet論文的主要作者Mengting Wan在一封電子郵件中告訴TechCrunch。這樣可以更全面地理解段落或評論,但當然這也是一個更復雜的問題。

          但更復雜的模型是來自更豐富數(shù)據(jù)的自然結(jié)果,他寫道:

          這樣的模型設計確實得益于我們?yōu)檫@項工作收集的新的大規(guī)模審查數(shù)據(jù)集,其中包括完整的審查文件,句子級擾流標簽和其他元數(shù)據(jù)。據(jù)我們所知,在此工作之前的公共數(shù)據(jù)集(2013年發(fā)布)僅涉及幾千個單句評論,而不是完整的評論文檔。對于研究社區(qū)而言,這樣的數(shù)據(jù)集還有助于詳細分析現(xiàn)實世界的評論劇作者以及在該領域開發(fā)現(xiàn)代“數(shù)據(jù)饑渴”的深度學習模型。

          這種方法仍然是新的,更復雜的方法有其缺點。例如,如果其他擾流句是相鄰的話,該模型偶爾會將一個句子誤認為具有破壞者;并且它對單個句子的理解不夠好,無法理解某些詞語是否真的表明劇透。你和我都知道“這殺死達斯維達”是一個擾流板,而“這殺死了懸念”不是,但計算機模型可能難以分辨。

          Wan告訴我系統(tǒng)應該能夠在用戶的計算機上實時運行,但當然訓練它將是一個更大的工作。這開啟了瀏覽器插件或應用程序的可能性,可以在您面前查看評論并隱藏其認為有風險的任何內(nèi)容。盡管亞馬遜與該研究間接相關(guān)(共同作者Rishabh Misra在那里工作),Wan表示還沒有計劃商業(yè)化或以其他方式應用該技術(shù)。

          毫無疑問,它將成為亞馬遜及其子公司和子業(yè)務能夠在評論和其他內(nèi)容中自動標記劇透的有用工具。但是在新模型實施之前(并且直到它好一點)我們將不得不堅持使用老式的方法來避免與世界接觸,直到我們看到有問題的電影或節(jié)目。

          加州大學圣地亞哥分校的團隊將于本月晚些時候在意大利的計算語言學協(xié)會會議上展示他們的工作;你可以在這里閱讀全文- 但要注意劇透。認真。

          免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

          猜你喜歡

          最新文章