亚洲直播在线一区_国产免费一区二区三区_在线观看h片_日韩三级在线免费观看_亚洲精品乱码日韩_自拍视频在线看_国产精品剧情在线亚洲_精品一区二区三区国产_丝袜美腿诱惑一区二区三区_欧美区一区二区三区_www.av99_亚洲国产日韩欧美在线

你好,游客 登錄 注冊 搜索
背景:
閱讀新聞

使用DC/OS為企業數據科學加速

[日期:2019-10-22] 來源:51CTO.com  作者:布加迪編譯 [字體: ]

這篇逐步介紹的教程介紹了使用Tensorflow將DC/OS Data Science Engine設置成PaaS,用于支持分布式多節點多GPU模型訓練。

作為一名專注于構建和交付新產品的全棧機器學習顧問,我常發現自己處于數據科學、數據工程和開發運維的交匯點。因此,我一直非常關注數據科學平臺即服務(PaaS)的興起。我最近著手評估不同的平臺即服務(PaaS)及其使數據科學操作實現自動化的潛力。我在探究它們的功能,然后使用一個或多個PaaS使代碼的設置和執行實現自動化。

為什么是DC/OS Data Science Engine?

在任何一個給定的云環境,比如亞馬遜網絡服務(AWS)、谷歌云平臺(GCP)和微軟Azure,設置Jupyter筆記本(notebook)變得很容易,以便數據科學家個人能夠工作。對于初創公司和小型數據科學團隊來說,這是一個很好的解決方案。什么都不需要維護,筆記本可以保存在Github中以實現持久性和共享。

對于大型企業來說,事情可沒有這么簡單。在這種規模下,由于環境和建模變得不可重現,跨多云的短暫資產上的臨時環境會帶來混亂而不是有序。企業跨多云和在本地運作,有特定的訪問控制和驗證要求,需要能夠訪問內部資源,用于數據、源控制、數據流及其他服務。

對于這些組織而言,DC/OS Data Science Engine提供了統一的系統,該系統提供Python機器學習堆棧、Spark、Tensorflow及其他深度學習框架,包括TensorFlowOnSpark,以實現分布式多節點多GPU模型訓練。這是非常引人注目的方案,設置后直接可以使用,為大型的數據科學團隊和公司大大消除了沮喪和復雜性。

AWS上的Data Science Engine

DC/OS Universal Installer是一個terraform模塊,可輕松啟動DC/OS集群,帶有用于訓練神經網絡的GPU實例。這里有個地方要注意:你擁有足夠多的通過亞馬遜的服務限制授權的GPU實例。AWS Service Limits定義了你可以在任何給定區域使用多少AWS資源。默認分配的GPU實例為零,可能需要一兩天才能授權更多實例。如果你需要加快速度,可以進入到AWS支持中心,請求與專員聯系。他們通常可以大大加快進程。

想使用Terraform引導集群,我們只需要在paas_blog/dcos/terraform/desired_cluster_profile.tfvars中編輯下列變量:

cluster_owner = "rjurney" 
dcos_superuser_password_hash = "${file("dcos_superuser_password_hash")}" 
dcos_superuser_username = "rjurney" 
dcos_license_key_contents = "" 
dcos_license_key_file = "./license.txt" 
dcos_version = "1.13.4" 
dcos_variant = "open" 
bootstrap_instance_type = "m5.xlarge" 
gpu_agent_instance_type = "p3.2xlarge" 
num_gpu_agents = "5" 
ssh_public_key_file = "./my_key.pub" 

并運行下列命令:

bash 
terraform init -upgrade 
terraform plan -var-file desired_cluster_profile.tfvars -out plan.out 
terraform apply "plan.out" 

apply命令的輸出將包括一個或多個主節點的IP,這只對你的IP開放。打開master url會顯示登錄屏幕,你可以使用Google、Github、微軟或預先配置的密碼來驗證身份。

一旦你完成這步,想拆除集群,請運行:

bash 
terraform destroy --auto-approve --var-file desired_cluster_profile.tfvars 

可以從DC/OS Web控制臺找到Data Science Engine以及Catalog菜單上的其他諸多服務,比如Kafka、Spark和Cassandra。我們只需要選擇“data-science-engine”軟件包,配置提供服務的資源:CPU、RAM和GPU。如果需要,還有許多其他選項,但它們不是必需的。

一旦我們點擊了Review & Run并確認,將進入到服務頁面。幾秒鐘內完成部署后,我們只需點擊服務名稱上的箭頭,便進入到JupyterLab實例。

JupyterLab的Github模塊很出色,已預先安裝,可以輕松加載我為了測試系統而創建的教程筆記本。點擊Github圖標,輸入rjurney,其中顯示可調出我的公共存儲庫列表。選擇paas_blog,然后雙擊DCOS_Data_Science_Engine.ipynb Jupyter筆記本即可打開它。它使用S3上的數據,因此不必下載任何數據。

本教程基于一個名為Kim-CNN的卷積神經網絡文檔分類器模型,為786個最頻繁的標簽創建了一個Stack Overflow標記器(tagger)。筆記本是深度網絡和自然語言處理(NLP)所常見的。我們先驗證GPU支持在Tensorflow中適用,我們還遵循為所有模型參數定義變量的最佳做法,以方便搜索超參數。然后,在執行測試/訓練拆分之前,我們對標簽進行標記化、填充并轉換成矩陣,以便一旦訓練完畢,我們就能獨立驗證模型的性能。

python 
tokenizer = Tokenizer( 
num_words=TOKEN_COUNT, 
oov_token='__PAD__' 
) 
tokenizer.fit_on_texts(documents) 
 
sequences = tokenizer.texts_to_sequences(documents) 
 
padded_sequences = pad_sequences( 
sequences, 
maxlen=MAX_LEN, 
dtype='int32', 
padding='post', 
truncating='post', 
value=1 
) 

Kim-CN使用不同長度的一維卷積和max-over-time pooling方法,連接結果,這些結果進入到較低維度的密集層,然后最終的sigmoid函數激活與標簽對應的密集層。模型的核心已在下面實現,作了幾處改動。 來源:Yoon Kim所著的《用于句子分類的卷積神經網絡》

python 
# Create convlutions of different sizes 
convs = [] 
for filter_size in FILTER_SIZE: 
f_conv = Conv1D( 
filters=FILTER_COUNT, 
kernel_size=filter_size, 
padding=CONV_PADDING, 
activation=ACTIVATION 
)(drp) 
f_shape = Reshape((MAX_LEN * EMBED_SIZE, 1))(f_conv) 
f_pool = MaxPool1D(filter_size)(f_conv) 
convs.append(f_pool) 
 
l_merge = concatenate(convs, axis=1) 
 
l_conv = Conv1D( 
128, 
5, 
activation=ACTIVATION 
)(l_merge) 
l_pool = GlobalMaxPool1D()(l_conv) 
 
l_flat = Flatten()(l_pool) 
l_drp = Dropout(CONV_DROPOUT_RATIO)(l_flat) 
 
l_dense = Dense( 
60, 
activation=ACTIVATION 
)(l_drp) 
 
out_dense = Dense( 
y_train.shape[1], 
activation='sigmoid' 
)(l_dense) 

雖然數據經過上采樣(upsampled)以平衡類,仍存在足夠的不平衡,我們需要計算類權重,幫助模型學會預測常見標簽和不常見標簽。若沒有類權重,損失函數(loss function)對常見標簽和不常見標簽同等處理,導致模型不可能預測不常見標簽。

python

train_weight_vec = list(np.max(np.sum(y_train, axis=0)) / np.sum(y_train, axis=0)) 
train_class_weights = {i: train_weight_vec[i] for i in range(y_train.shape[1])} 

我們關注的主要度量標準是類別準確性,因為即使786個標簽中有一個預測不正確,二進制準確性也無法通過預測。

為了便于進行可重復的實驗,我們將最終的度量標準名稱調整為可重復的(即val_precision_66變為val_precision,然后將我們跟蹤的度量標準附加到pandas DataFrame日志末尾,我們既可以直觀顯示當前和先前運行的結果,還可以直觀顯示作出變更后兩次運行之間的性能變化。

我們還想知道每次epoch的性能,那樣我們不用訓練數量過多的epoch。我們使用matplotlib繪制幾個度量標準以及每次epoch的測試/訓練損失。

最后,光了解理論性能還不夠。我們需要在不同的置信度閾值下查看標記器的實際輸出。我們為Stack Overflow問題、它們的實際標簽以及我們預測的標準創建了一個DataFrame,以便我們直接演示模型及其實際性能。

該平臺完美地運行本教程,我是指雖然它是新的,但已經適合實際的數據科學工作負載。

使DC/OSData Science Engine的設置實現自動化

這包括你如何手動使用平臺,但本文關注的是PaaS自動化。那么我們如何加快速度呢?

DC/OS的圖形用戶界面和CLI共同使所有類型的用戶都可以通過Data Science Engine輕松訪問JupyterLab:非技術管理人員想在筆記本中查看報告,開發運維人員/數據工程師希望使流程實現自動化。如果手動GUI流程似乎很復雜,一旦我們擁有作為JSON文件的服務配置,僅用幾行代碼就可以使它實現自動化,為此通過Terraform命令啟動DC/OS集群,從Terraform獲得集群地址,然后使用DC/OS CLI對集群進行身份驗證并運行服務。

DC/OS GUI提供了粘貼到外殼中的命令,以安裝和配置CLI,我們使用CLI使集群和服務的設置實現自動化。

你可以使用GUI通過導出服務配置使設置實現自動化。

服務配置本身非常簡單:

json 
{ 
"service": { 
"name": "data-science-engine", 
"cpus": 8, 
"mem": 51200, 
"gpu": { 
"enabled": true, 
"gpus": 1 
} 
} 
} 

然后你只用一個命令即可安裝服務:

bash 
dcos package install data-science-engine --options=data-science-engine-options.json 

如果光使用CLI實現全面的自動化,你可以創建集群,并啟動Data Science Engine,僅用6個命令即可:

bash 
# Boot DC/OS Cluster 
terraform init -upgrade 
terraform plan -var-file desired_cluster_profile.tfvars -out plan.out 
terraform apply plan.out 
 
# Get the cluster address from Terraform's JSON output 
export CLUSTER_ADDRESS = `terraform output -json | jq -r '.["masters-ips"].value[0]'` 
 
# Authenticate CLI to Cluster using its address and Install the Data Science Engine Package 
dcos cluster setup http://$CLUSTER_ADDRESS # add whatever arguments you need for automated authentication 
dcos package install data-science-engine --options=data-science-engine-options.json 

這六個命令用于設置DC/OS集群,眾多可用服務只需點擊一下即可獲得,包括可以運行Spark任務,并執行分布式Tensorflo訓練的JupyterLab實例。這不賴!

結束語

總之,DC/OS Data Science Engine給我留下了深刻的印象。手動設置很容易,環境適合實際使用,結果證明自動化很容易。如果你想了解更多信息,請在此處查看全文,相應代碼詳見此處:github.com/rjurney/paas_blog。

原文標題:Using DC/OS to Accelerate Data Science in the Enterprise,作者:Russell Jurney

推薦 打印 | 錄入:admin | 閱讀:
相關新聞      
本文評論   
評論聲明
  • 尊重網上道德,遵守中華人民共和國的各項有關法律法規
  • 承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
-->
亚洲第一福利网| 久久午夜精品| 色天天综合色天天久久| 日韩a∨精品日韩在线观看| 欧美性受xxxx黑人猛交| 亚洲婷婷伊人| 日韩女优毛片在线| 欧洲免费在线视频| 成人欧美一区二区三区小说| 久久久久久久久久网| 久久国产日韩欧美精品| 国产一区二区三区高清视频| 真实原创一区二区影院| 欧美第一淫aaasss性| 成人一级视频| 国产视频精品一区二区三区| 国产黄大片在线观看画质优化| 五月天激情综合| 超碰在线一区二区三区| 亚洲男人的天堂网| 99视频资源网| 亚洲天堂网中文字| 上原亚衣加勒比在线播放| 欧美国产国产综合| 99久久国产宗和精品1上映| av亚洲精华国产精华精| 免费高清一区二区三区| 国产河南妇女毛片精品久久久| 法国空姐在线观看免费| 国产裸体歌舞团一区二区| 韩国无码av片在线观看网站| 国产成人精品免费看| 人人干视频在线| 久久婷婷成人综合色| 欧美视频免费播放| 自拍av一区二区三区| 丁香花高清电影在线观看完整版| 精品日本高清在线播放| www.亚洲.com| 精品国产区一区| 蜜桃成人精品| 久99久在线视频| 国产精品一国产精品| 国产精品亚洲视频在线观看| 天天影视天天精品| 国产一区二区高清不卡| 秋霞成人午夜伦在线观看| 日韩人妻无码精品久久久不卡| 国产日产精品1区| 情趣网站在线观看| 911精品国产一区二区在线| 欧亚av在线| 国自在线精品视频| 亚洲九九在线| 在线视频亚洲自拍| 久久久国产精品不卡| 日韩日韩日韩日韩| 欧美日韩精品欧美日韩精品| 亚洲v.com| 91av在线网站| 亚洲麻豆av| 自拍日韩亚洲一区在线| 亚洲色图在线播放| 日本视频在线免费观看| 日韩中文字幕第一页| 日韩国产一区二区| 亚洲综合av一区| 亚洲欧洲一区二区在线播放| 成人福利在线| 精品国产一区二区三区在线观看| 欧美午夜精品一区二区三区电影| 日韩久久精品一区二区三区| 国产亚洲福利社区一区| 91网页在线观看| 久久精品视频导航| 国产精品国产三级国产在线观看| 色吧亚洲视频| 久久精品欧美日韩精品| 黄色美女网站在线观看| 日韩一区二区福利| 伊人久久大香线蕉综合热线| 国产h视频在线播放| 91成人在线观看喷潮| 欧美激情网站| 国产欧美日韩精品丝袜高跟鞋| 免费观看久久久4p| 探花国产精品| 国产一级揄自揄精品视频| 久久久久久久久久久9不雅视频| 永久免费看av| 欧美日韩裸体免费视频| 欧美激情视频三区| 欧美hdxxxx| 欧美一区二区三区激情视频| 国产成人综合av| 男人的天堂亚洲一区| 凹凸日日摸日日碰夜夜爽1| 欧美性xxxx极品hd欧美风情| 韩日精品一区| 国产欧美日本在线| 国产精品丝袜在线| bl在线肉h视频大尺度| 国产乱肥老妇国产一区二| 国产乱子伦一区二区三区国色天香| 高清欧美精品xxxxx在线看| 亚洲欧美精品一区二区| 在线电影一区二区| 不卡av免费在线| 日韩一级精品视频在线观看| 亚洲精品一级二级三级| 成年人网站国产| 色婷婷综合久久| 91亚洲无吗| 激情五月五月婷婷| 欧美午夜电影在线播放| 国产永久精品大片wwwapp| 国产69精品久久久久999小说| 精品视频免费看| 欧美天天综合| 日韩中文字幕免费在线| 亚洲精品wwww| 蜜桃伊人久久| 91看片在线观看| 国产精品视频内| 国产精品国产三级国产有无不卡| 丁香婷婷久久| 2022中文字幕| 亚洲精品在线视频| 免费观看日韩电影| 国产黄色小视频在线| 91国产丝袜在线放| 亚洲动漫第一页| 综合伊思人在钱三区| 熟女性饥渴一区二区三区| 亚洲视频axxx| 国产成人亚洲综合a∨婷婷| 日本片在线观看| 欧美二级三级| 欧美一区二区三区视频在线| 亚洲国产午夜| 蜜桃视频在线观看www社区 | 国产精品丝袜高跟| 中文字幕一区二区三区色视频| 亚洲啊v在线免费视频| 国产精品97在线| xxx一区二区| 91丨九色丨黑人外教| 91九色成人| av网站在线不卡| 91sa在线看| 亚洲精品成人在线| 日韩不卡一区| 国产一二三区在线| 久久精品国产综合精品| 日韩欧美在线一区二区三区| 日本麻豆一区二区三区视频| 新版的欧美在线视频| 国产精品无码人妻一区二区在线| 久久精品久久久久电影| 日本一区二区在线不卡| 亚洲警察之高压线| 日本大臀精品| 欧美在线播放一区| 亚洲欧美国产精品久久久久久久| 波多野结衣中文字幕一区二区三区| 国产精品亚洲综合在线观看| 99视频免费| 91久久精品国产91性色| 欧美日本在线播放| 国产麻豆视频一区| 少妇精品在线| 在线看中文字幕| 久久手机视频| 尤物精品国产第一福利三区 | 久草在线资源视频| 国产免费一区| 日韩黄色高清视频| 久久久综合九色合综国产精品| 欧美视频在线观看免费| 欧美国产日韩精品免费观看| 狠狠综合久久| 不卡一卡2卡3卡4卡精品在| 日韩一区日韩二区| 亚洲另类欧美自拍| 亚洲成人直播| 樱花草涩涩www在线播放| 又大又硬又爽免费视频| 高清欧美电影在线| 日本韩国欧美三级| 久久99精品久久久久婷婷| 国产精品久一| 清纯唯美亚洲色图| 亚洲欧洲一区二区| 久久久久国产精品免费网站| 日韩欧亚中文在线| 国产精品99久久久久久久vr| 成人性生交大片免费看96| а天堂8中文最新版在线官网| 中文精品无码中文字幕无码专区| 性欧美亚洲xxxx乳在线观看|