Cloudera機器學(xué)習(xí)(CML)得到了更新,最終將大數(shù)據(jù)公司的共享數(shù)據(jù)體驗(SDX)擴展到了機器學(xué)習(xí)模型,并提供了性能監(jiān)控,以幫助那些為準備就緒而苦苦準備的人。
首先突出顯示的功能是一些附加功能,使團隊可以密切關(guān)注其模型的運行情況。集成了新的監(jiān)視服務(wù),據(jù)說可以同時解決功能和技術(shù)方面的問題。
它可以幫助測量諸如模型漂移,等待時間和預(yù)測準確性之類的東西,然后可以通過專用UI對其進行可視化。但是,由于各個公司的設(shè)置和監(jiān)視目標不同,因此Cloudera還提供了Python SDK,用于編寫用于跟蹤和分析的自定義代碼。
CML被廣告宣傳為Cloudera Data Platform的機器學(xué)習(xí)服務(wù),Cloudera Data Platform是Hortonworks-Cloudera合并于2019年初完成的產(chǎn)品,因此該工具現(xiàn)在可以利用該平臺的共享數(shù)據(jù)體驗了。SDX的創(chuàng)建是為了在不同環(huán)境中實施統(tǒng)一策略?,F(xiàn)在完成的對CML的擴展意味著CDP上設(shè)置的安全和治理規(guī)則也可以用于模型部署,這對于生產(chǎn)環(huán)境而言是個好兆頭。
廣告
如果這聽起來不夠有趣,那么該公司還表示已經(jīng)擴展了數(shù)據(jù)治理和元數(shù)據(jù)框架Apache Atlas(該平臺的一部分),以包括模型元數(shù)據(jù)。這可能證明對調(diào)試和解釋模型很有用,因為這些信息可以說明如何構(gòu)建模型,包括使用了哪些數(shù)據(jù)。由于基本的可解釋性是在各種行業(yè)(例如金融或醫(yī)學(xué))中使用機器學(xué)習(xí)的先決條件,因此越來越喜歡這種功能。
ML服務(wù)的此迭代中的其他修改包括一些內(nèi)部重組,旨在改善已部署模型對Kubernetes集群的可用性以及對模型進行分類的方法。
可以在Cloudera博客上找到一個演示新功能的分步示例。CML按小時收費,每個實例每小時0.68美元,并且可在CDP上用于Azure和AWS。