數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí):工業(yè)的機(jī)會(huì)
為了將數(shù)據(jù)科學(xué)的好處擴(kuò)展到工業(yè)企業(yè)的其他部分,提供商正在提供具有用戶友好界面的數(shù)據(jù)科學(xué)解決方案,使開發(fā)人員和非開發(fā)人員都能夠探索數(shù)據(jù)、生成模型和開發(fā)見解。
不斷增加的數(shù)字化使更多的數(shù)據(jù)收集成為可能,并促進(jìn)機(jī)器學(xué)習(xí)在多個(gè)行業(yè)的應(yīng)用。對更多產(chǎn)品種類、可追溯性、生產(chǎn)效率和響應(yīng)速度的需求推動(dòng)了這些應(yīng)用程序的采用。為了將數(shù)據(jù)科學(xué)的好處擴(kuò)展到工業(yè)企業(yè)的其他部分,解決方案提供商正在提供具有用戶友好界面的數(shù)據(jù)科學(xué)解決方案,使開發(fā)人員和非開發(fā)人員都能夠探索數(shù)據(jù)、生成模型和開發(fā)見解。
—— Ebele Maduekwe Analyst
目錄:

一、Executive Overview
信息技術(shù)(IT)、數(shù)據(jù)科學(xué)和操作技術(shù)(OT)的融合正在推動(dòng)跨行業(yè)的機(jī)器學(xué)習(xí)(ML)解決方案的發(fā)展。隨著IT領(lǐng)域的應(yīng)用進(jìn)入OT領(lǐng)域,數(shù)據(jù)科學(xué)正成為一種需求,特別是對于從航空航天、汽車、專業(yè)或?qū)櫸锘瘜W(xué)品和包裝消費(fèi)品等行業(yè)的數(shù)據(jù)中獲得快速洞察。結(jié)合加速的市場動(dòng)蕩,工業(yè)終端用戶正在尋找新的解決方案,從他們的運(yùn)營中發(fā)現(xiàn)見解,以提高競爭優(yōu)勢。

從產(chǎn)品開發(fā)到供應(yīng)鏈優(yōu)化,工業(yè)供應(yīng)商正在構(gòu)建解決方案,以滿足對敏捷性、生產(chǎn)可追溯性、效率和響應(yīng)速度的需求。從R&D或生產(chǎn)數(shù)據(jù)中提取的可操作的見解被用于解決價(jià)值鏈上的挑戰(zhàn)。實(shí)現(xiàn)這一目標(biāo)的一種方法是使用數(shù)據(jù)科學(xué)應(yīng)用程序,如從R&D到生活生產(chǎn)的機(jī)器學(xué)習(xí)。目前的應(yīng)用程序可以幫助減少“死資本”——在這種情況下,非常昂貴的資源無法交付價(jià)值,可能會(huì)導(dǎo)致數(shù)百萬美元的收入損失。
在工業(yè)中采用數(shù)據(jù)科學(xué)的一個(gè)主要挑戰(zhàn)是技術(shù)知識的不足。這使得從過程數(shù)據(jù)中快速構(gòu)建、建模和獲得洞察變得困難。另一方面,通常很難雇用和保留專門技能;也就是說,由于激烈而昂貴的競爭,數(shù)據(jù)科學(xué)知識和領(lǐng)域?qū)<抑R的正確組合需要支持應(yīng)用程序開發(fā)。
作為回應(yīng),供應(yīng)商正在設(shè)計(jì)數(shù)據(jù)科學(xué)解決方案,幫助開發(fā)者和非開發(fā)者在其價(jià)值鏈中構(gòu)建、共享和部署可操作和可復(fù)制的模型。因此,數(shù)據(jù)科學(xué)正在從傳統(tǒng)的大量代碼方法演變?yōu)橐子谑褂玫臒o/低代碼解決方案。在這個(gè)無代碼/低代碼用戶界面中,一系列涉眾,包括操作主題專家,可以為業(yè)務(wù)需求構(gòu)建、驗(yàn)證和部署模型。最終,最終用戶將學(xué)會(huì)結(jié)合數(shù)據(jù)和專業(yè)知識,隨著時(shí)間的推移改變他們的業(yè)務(wù)方式。這一組合將推動(dòng)競爭優(yōu)勢,使更好地響應(yīng)客戶需求和市場信號的速度和靈活性。
二、Data Science and Machine Learning:Transforming Industry
數(shù)據(jù)科學(xué)是各種應(yīng)用和行業(yè)的關(guān)鍵,從自動(dòng)駕駛、語音和面部識別到催化劑設(shè)計(jì)和食品和飲料配方。如今,許多行業(yè)領(lǐng)導(dǎo)者都采用了模式識別和學(xué)習(xí)算法,可以提取流程、系統(tǒng)和人類行為的見解。這些技術(shù)為一個(gè)充滿新可能性的世界打開了大門,并從根本上改變了我們所知道的傳統(tǒng)工藝。例如,虛擬現(xiàn)實(shí)、混合現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)技術(shù)的進(jìn)步使現(xiàn)場工作人員和機(jī)器操作人員的操作安全性得以提高。利用數(shù)據(jù)科學(xué)的精準(zhǔn)醫(yī)療發(fā)展使制藥公司能夠提供新的方法來使用臨床數(shù)據(jù)來實(shí)現(xiàn)個(gè)性化體驗(yàn),并實(shí)現(xiàn)更快的治療上市時(shí)間。使用機(jī)器學(xué)習(xí)的產(chǎn)品配方實(shí)時(shí)動(dòng)態(tài)建模簡化了材料科學(xué)公司的產(chǎn)品開發(fā),而無需增加原型制作的成本,這有助于推動(dòng)它們領(lǐng)先于市場競爭對手。

(1) Data at Your Fingertips
隨著企業(yè)繼續(xù)數(shù)字化,研發(fā)和制造過程的“數(shù)據(jù)化”正在增長。在此之前,“大數(shù)據(jù)”一詞被用來描述收集、轉(zhuǎn)換和分析大量數(shù)據(jù)的過程。今天,許多大數(shù)據(jù)技術(shù)在許多行業(yè)中被定期和大規(guī)模地使用。然而,技術(shù)和算法的進(jìn)步表明,在某些行業(yè),大數(shù)據(jù)并不總是開發(fā)可操作見解的必要條件。
通過構(gòu)建數(shù)據(jù)管道來組合不同的數(shù)據(jù)源,用戶可以訪問來自研發(fā)、生產(chǎn)和業(yè)務(wù)流程的數(shù)據(jù)。這樣就很容易將所需的數(shù)據(jù)帶到最終用戶的指尖。
(2) Human Factor: The Missing Link
盡管大數(shù)據(jù)技術(shù)正在工業(yè)中被采用,但現(xiàn)有的勞動(dòng)力并不總是具備編寫正確問題和提取正確見解所需的專業(yè)知識。終端用戶可以聘請數(shù)據(jù)科學(xué)專家來構(gòu)建和驗(yàn)證他們的業(yè)務(wù)或數(shù)據(jù)模型,但這需要廣泛的領(lǐng)域知識,在實(shí)現(xiàn)價(jià)值之前仍然需要集成操作環(huán)境。此外,培訓(xùn)勞動(dòng)力是昂貴和耗時(shí)的。在材料科學(xué)領(lǐng)域,專業(yè)知識包括各種材料的化學(xué)結(jié)構(gòu)和分子特性方面的廣泛知識。這些知識是指導(dǎo)從早期研發(fā)過程到生產(chǎn)過程的關(guān)鍵。在這方面,化學(xué)和統(tǒng)計(jì)學(xué)是建立適用的數(shù)據(jù)科學(xué)解決方案的主要基礎(chǔ)。對于很少或沒有編碼經(jīng)驗(yàn)的用戶來說,結(jié)合低編碼/無編碼數(shù)據(jù)科學(xué)解決方案是縮小這種人力資本差距并從操作和實(shí)驗(yàn)室數(shù)據(jù)中創(chuàng)造價(jià)值的一種方法。使用低代碼/無代碼解決方案的可視化支持環(huán)境,研究人員、工程師和其他涉眾可以自動(dòng)化模型構(gòu)建、工作流設(shè)計(jì)和生成見解。
(3)Embracing Data Science and Machine Learning:Application Building-Block Methods for Industry
隨著工業(yè)應(yīng)用的發(fā)展,跟上這種發(fā)展所需的工具和技能也在發(fā)生變化。數(shù)據(jù)分析的日益民主化要求為企業(yè)應(yīng)用重新設(shè)計(jì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)交付。特別是,沒有辦法使用高成本技術(shù)知識的工業(yè)組織可以實(shí)現(xiàn)其數(shù)字化目標(biāo),或利用其現(xiàn)有的勞動(dòng)力規(guī)模已經(jīng)存在的解決方案。重新設(shè)計(jì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)代碼交付的一種方法是創(chuàng)建應(yīng)用程序構(gòu)建塊。這創(chuàng)造了一個(gè)低代碼/無代碼的環(huán)境,允許機(jī)器學(xué)習(xí)專業(yè)知識有限的勞動(dòng)力在視覺支持的環(huán)境中通過自動(dòng)化機(jī)器學(xué)習(xí)更快地構(gòu)建和驗(yàn)證數(shù)據(jù)模型。

一個(gè)關(guān)鍵的優(yōu)勢是應(yīng)用程序模型在構(gòu)建和驗(yàn)證之后的標(biāo)準(zhǔn)化和可重用性。它允許工業(yè)終端用戶獨(dú)立于數(shù)據(jù)科學(xué),并更專注于優(yōu)化生產(chǎn)kpi。它還允許數(shù)據(jù)科學(xué)挑戰(zhàn)的成功模型與整個(gè)業(yè)務(wù)的其他人一致地共享。另一個(gè)優(yōu)勢是可以釋放勞動(dòng)力生產(chǎn)力的限制,并以以前不可能的方式產(chǎn)生生產(chǎn)力回報(bào)。這意味著主題專家可以快速積累知識,將主題知識與數(shù)據(jù)科學(xué)見解結(jié)合起來。主題專業(yè)知識和數(shù)據(jù)科學(xué)的這種協(xié)同作用,允許業(yè)務(wù)流程快速轉(zhuǎn)換,并區(qū)分工業(yè)企業(yè)為客戶交付價(jià)值的方式。
三、The BIOVIA Solution for Data Science within Industry
BIOVIA是達(dá)索的一個(gè)品牌,提供了一套解決方案,支持材料科學(xué)中的機(jī)器學(xué)習(xí)。這些解決方案將機(jī)器學(xué)習(xí)技術(shù)結(jié)合到一套數(shù)據(jù)科學(xué)應(yīng)用程序作為數(shù)據(jù)管道工具,稱為BIOVIA Pipeline Pilot。Pipeline Pilot連接并組合來自多個(gè)來源的數(shù)據(jù);它讀取、處理和清理數(shù)據(jù),并開發(fā)數(shù)據(jù)模型。它可以用于可視化結(jié)果,并允許在低代碼/無代碼用戶界面中共享管道協(xié)議,并將其部署為企業(yè)應(yīng)用程序。

BIOVIA Pipeline Pilot提供:
• 各種ML模型的預(yù)構(gòu)建架構(gòu)。
• 連續(xù)和動(dòng)態(tài)的模型參數(shù)優(yōu)化的基礎(chǔ)上堅(jiān)實(shí)的統(tǒng)計(jì)和物理基礎(chǔ)。
• 低代碼/無代碼用戶界面,利用數(shù)據(jù)可訪問性,數(shù)據(jù)民主化,釋放勞動(dòng)力潛力。
• 敏捷和精益的數(shù)據(jù)模型開發(fā),所有數(shù)據(jù)模型都具有 自我驗(yàn)證和透明性。
• 全球范圍內(nèi)的數(shù)據(jù)優(yōu)化,以處理小型和大型數(shù)據(jù)集,并允許靈活適應(yīng)變化的客戶業(yè)務(wù)模式。
• ML技術(shù)可以

根據(jù)客戶的數(shù)據(jù)需求,這些解決方案可以部署在本地,也可以部署在云中,或者兩者混合部署。BIOVIA的業(yè)務(wù)模型利用數(shù)據(jù)科學(xué)為全球范圍內(nèi)的數(shù)據(jù)建模提供模塊化解決方案。這允許BIOVIA與客戶/終端用戶合作,在整個(gè)轉(zhuǎn)型過程中促進(jìn)持續(xù)的業(yè)務(wù)參與和供應(yīng)商信任。
案例研究 1:產(chǎn)品性能預(yù)測
快速設(shè)計(jì)出滿足客戶痛點(diǎn)的產(chǎn)品是材料科學(xué)增值的關(guān)鍵。傳統(tǒng)上,材料科學(xué)公司在開發(fā)/改進(jìn)一種新/現(xiàn)有產(chǎn)品時(shí),需要面對昂貴的長時(shí)間設(shè)計(jì)和更長的測試時(shí)間,以確定其產(chǎn)品的關(guān)鍵性能是否有價(jià)值。
這種方法的一個(gè)問題是產(chǎn)品開發(fā)周期的不確定性。傳統(tǒng)上,研究人員需要通過物理測試和他們自己的專業(yè)知識來設(shè)計(jì)新產(chǎn)品。為了解決這一問題,BIOVIA Pipeline Pilot包含一系列技術(shù),如定量結(jié)構(gòu)性能關(guān)系(QSPR)建模,允許材料科學(xué)研究人員利用現(xiàn)有數(shù)據(jù),通過檢查材料分子結(jié)構(gòu)變化和感興趣的物理性能之間的相關(guān)性來預(yù)測產(chǎn)品性能。QSPR模型利用遺傳函數(shù)算法生成相互交叉/突變的隨機(jī)模型,從而生成性能提高的下一代模型。有了這些知識,研究人員可以指導(dǎo)他們的研究,更深入地了解影響產(chǎn)品性能的關(guān)鍵因素。

BIOVIA Pipeline Pilot已將QSPR模型應(yīng)用于緩蝕劑、traction流體、光學(xué)透明度、染料色牢度和洗滌劑制造中的表面活性劑分子。
案例研究 2:產(chǎn)品配方和設(shè)計(jì)
對于材料科學(xué)公司來說,優(yōu)化產(chǎn)品設(shè)計(jì)對于改進(jìn)新產(chǎn)品或現(xiàn)有產(chǎn)品、適應(yīng)市場和消費(fèi)者偏好并符合監(jiān)管要求非常重要。對于供應(yīng)商來說,遵守這些標(biāo)準(zhǔn)可能代價(jià)高昂,因?yàn)樾枰紤]不同的數(shù)據(jù)參數(shù)。

對于輪胎橡膠、食品飲料配方、鋰離子電池電解質(zhì)、潤滑劑或高性能混凝土等配方產(chǎn)品,BIOVIA Pipeline Pilot可以通過帕累托分析預(yù)測原材料的最佳配方,以最大限度地提高強(qiáng)度和提供最佳性能/質(zhì)量,同時(shí)最小化成本。換句話說,管道試點(diǎn)解決方案可以確定材料科學(xué)實(shí)驗(yàn)室在給定的價(jià)格點(diǎn)上不同工藝的原材料的最佳混合。例如,Pipeline Pilot可以用于確定在惡劣天氣條件下最佳輪胎性能所需的聚合物的正確組合。它還允許科學(xué)家比較模型性能,優(yōu)化附加參數(shù),并可視化結(jié)果。
案例研究 3:使用圖像分析進(jìn)行質(zhì)量控制
一旦產(chǎn)品被制定或創(chuàng)建,它們的質(zhì)量就可以通過公司定義的基準(zhǔn)進(jìn)行檢查。對于材料科學(xué)公司的某些產(chǎn)品,傳統(tǒng)的分析方法可能無法提供最優(yōu)的質(zhì)量結(jié)果,而且成本高昂,需要大量勞動(dòng)力。利用來自其他流程的數(shù)據(jù),公司可以分析其產(chǎn)品或流程的質(zhì)量,并根據(jù)預(yù)先確定的閾值對其進(jìn)行基準(zhǔn)測試。BIOVIA Pipeline Pilot包含大量的圖像處理和分析工具的集合,用于使用圖像分析的質(zhì)量檢查,托管在一個(gè)用戶友好的低/非代碼環(huán)節(jié)。

BIOVIA Pipeline Pilot:Training a Model for Image Analysis
預(yù)先驗(yàn)證的功能塊使科學(xué)家可以很容易地拖放組件以實(shí)現(xiàn)可生產(chǎn)模型。使用深度學(xué)習(xí)技術(shù),用戶可以建立一個(gè)模型,訓(xùn)練它,并使用訓(xùn)練后的模型進(jìn)行圖像預(yù)測。該解決方案已成功用于檢測有缺陷的微電路,材料分析,顆粒分析,以及用于洗滌劑中去除污漬的圖像校準(zhǔn)。

四、Conclusion
數(shù)據(jù)科學(xué)和ML解決方案帶來的有益的顛覆性影響是顯而易見的。將顛覆性的潛力轉(zhuǎn)化為現(xiàn)實(shí)需要變革性的解決方案,以迎接材料科學(xué)驅(qū)動(dòng)公司面臨的挑戰(zhàn)。行業(yè)領(lǐng)導(dǎo)者正在他們的過程中采用數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),以獲得競爭優(yōu)勢,并更快地提供新的和可操作的見解。

本文翻譯自Dassault Systèmes , 點(diǎn)擊下方“閱讀原文” ,訪問原文英文鏈接。
北京泰科博思科技有限公司是BIOVIA Pipeline Pilot官方指定代理商,有關(guān)軟件詳情或者技術(shù)支持請咨詢北京泰科。
電話:010-64951848
郵箱:sales@tech-box.com.cn
北京泰科為廣大學(xué)習(xí)分子模擬科研人員提供了交流討論平臺(tái),泰科建立了BIOVIA Pipeline Pilot交流群,群里有專業(yè)老師解答問題,如有興趣一起交流,歡迎來電/郵申請入群,作者期待您的參與!
公司簡介:
北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是國內(nèi)領(lǐng)先的分子模擬及虛擬仿真綜合解決方案提供商。
北京泰科博思科技有限公司與國際領(lǐng)先的模擬軟件廠商、開發(fā)團(tuán)隊(duì)深入合作,為高校、科研院所和企業(yè)在材料、化工、藥物、生命科學(xué)、環(huán)境、人工智能及數(shù)據(jù)挖掘、虛擬仿真教學(xué)等領(lǐng)域提供專業(yè)的整體解決方案。用戶根據(jù)需要在我們的平臺(tái)上高效的進(jìn)行各種模擬實(shí)驗(yàn),指導(dǎo)實(shí)際的生產(chǎn)設(shè)計(jì)。
北京泰科博思科技有限公司擁有一支一流的技術(shù)服務(wù)團(tuán)隊(duì)和資深的專家咨詢團(tuán)隊(duì),以客戶真正需求出發(fā),服務(wù)客戶,為客戶創(chuàng)造價(jià)值。我們秉承“職業(yè)、敬業(yè)、擔(dān)當(dāng)、拼搏、合作”的企業(yè)精神,致力于用國際領(lǐng)先的軟件產(chǎn)品和專業(yè)全面的技術(shù)支持服務(wù),成為客戶可信賴的合作伙伴。
Pipeline,Pilot
熱門新聞
北京泰科攜達(dá)索BIOVIA創(chuàng)新方案亮相第七屆離子液體與綠色過程大會(huì)
5月8日至10日,以"低碳智能變革 開創(chuàng)新質(zhì)未來"為主題的第七屆離子液體與綠色過程大會(huì)在開封圓滿落幕。北京泰科作為達(dá)索系統(tǒng)BIOVIA品牌中國區(qū)核心合作伙伴,攜AI離子液體篩選解決方案及COSMOLOGIC、Materials Studio、Pipeline Pilot等明星產(chǎn)品重磅參展,助力產(chǎn)業(yè)智能化升級。
2025-05-16 08:51
"人工智能背景下的多尺度材料模擬技術(shù)分享會(huì)"在渝圓滿落幕
會(huì)議聚焦量子計(jì)算、機(jī)器學(xué)習(xí)與材料模擬技術(shù)的深度融合,吸引了來自重慶大學(xué)、四川大學(xué)、中科院綠色智能研究院等30余位高校學(xué)者、科研機(jī)構(gòu)專家及企業(yè)代表,圍繞合金材料研發(fā)、核能材料性能優(yōu)化及低碳轉(zhuǎn)型等議題展開深度探討,共繪材料科學(xué)智能化升級新藍(lán)圖。
2025-05-07 14:09
分子模擬與人工智能賦能油氣行業(yè)論壇在京舉辦 I 達(dá)索系統(tǒng)BIOVIA聯(lián)合北京泰科科技共探油氣數(shù)字化新路徑
由北京泰科科技與達(dá)索系統(tǒng)BIOVIA聯(lián)合主辦的“分子模擬與人工智能賦能油氣行業(yè)論壇”在達(dá)索系統(tǒng)北京辦公室成功舉行。
2025-05-07 13:29