欧美aaa级-男女高潮激烈免费观看-黑人性生活视频-精品人妻无码一区二区三区蜜桃一-亚洲第一成网站-国产一区中文字幕-国产精品videosex极品-天天摸天天射-国产精品特黄aaaa片在线观看-天天干网-免费观看黄网站-国产无遮挡a片无码免费-a天堂在线-亚洲免费色-中文字幕乱偷无码av先锋-中文天堂最新版资源www官网-国四虎影永久去哪里了-五月视频-91黄色免费网站-亚洲精品一区二区三区影院

你的位置:首頁 > 互連技術 > 正文

生成式 AI 幫助工程師挖掘隱藏在非結構化數據中的深層洞察

發布時間:2026-02-25 來源:轉載 責任編輯:lily

【導讀】生成式AI(GenAI)的崛起,不僅能將分散的非結構化數據與結構化傳感器數據深度融合,更將工程師的角色從繁瑣的數據清洗中解放出來,轉向更高階的戰略分析與決策。從塔塔汽車利用檢索增強生成(RAG)技術構建上下文感知的故障診斷助手,到哥本哈根大學通過圖論與大模型結合加速食品科學發現,GenAI正展現出超越基礎代碼編寫的巨大潛力。然而,盡管普及率日益提升,許多工程師仍受限于傳統用法或對工作流整合的擔憂,尚未充分挖掘其在預測性維護和復雜系統分析中的深層價值。


您是否知道,生成式 AI(GenAI)可以幫助工程師在幾秒鐘內診斷汽車故障,甚至在設備出現問題之前預測潛在失效?GenAI 正在通過加速數據分析和算法開發,讓這些場景從設想走向現實,使工程師能夠充分發揮專業知識,挖掘可執行的洞察。


工程團隊每年都會產生數 TB 級的數據。根據 Gartner 的估算,其中多達 80% 屬于非結構化數據。服務記錄、研究論文和技術人員記錄中蘊含著關鍵的組織知識,但由于格式不一致,難以有效解析。GenAI 工具能夠幫助工程師整合結構化與非結構化數據,實現過去難以大規模開展的分析工作。對工程師而言,這意味著更快速的故障排查、更高效的設計流程以及更快的技術發現。


工程師在使用 GenAI 時的盲區

盡管 GenAI 在重塑工程工作方面具有高度靈活性,但其能力與工程師日常使用方式之間仍存在差距。許多工程師仍將 GenAI 主要用于編寫基礎代碼或生成文檔,而不是將其應用于更高級的工程流程。


為更好地了解工程師對 GenAI 的態度及其實際應用情況,MathWorks 于 2025 年 12 月在社交媒體上進行了一項非正式投票。反饋結果揭示了多項重要洞察,包括:

-83% 的工程師至少每月使用一次 GenAI,其中最常見的應用場景是“編寫代碼”和“文檔與報告生成”。

-工程師對 GenAI 的最大擔憂是其與現有工作流程的整合(46%)。在擁有六年以上經驗的工程師中,這一比例更是升至 75%。


這些數據表明,大多數工程師已經在使用 GenAI,但尚未將其應用于戰略性工程任務。希望提升 GenAI 使用能力的工程師應考慮將其用于準備和分析非結構化數據。


利用服務手冊、工程文檔和維修記錄構建面向技術人員的聊天助手

汽車故障排查通常需要在不同品牌和車型中診斷復雜問題。盡管大語言模型(LLM)包含大量公開的汽車知識,但它們缺乏細節豐富的品牌專屬信息。為彌合這一差距,塔塔汽車的工程師采用了一種名為檢索增強生成(RAG)的 GenAI 技術,將 LLM 的通用知識與內部專有數據結合,從而生成具有上下文針對性的建議。


工程師利用 RAG 開發了一個具備上下文感知能力的聊天助手,能夠檢索內部文檔并基于這些內容生成故障排查回復。他們使用 MATLAB? 構建了 RAG 工作流程,使其應用(稱為 ServiceSage)可以搜索服務手冊、工程文檔和維修記錄。當技術人員向 ServiceSage 提問時,問題會被轉化為 GenAI 能理解的數值表示,系統隨后查找最相關的文檔。由于 RAG 執行的是語義搜索,問題的具體措辭并不關鍵,它會根據相關概念進行推斷。相關文檔隨后被輸入 AI 模型,模型將其與通用知識結合,生成清晰、可理解的回答。


這種方法具有成本效益且可擴展,無需進行昂貴的模型再訓練,并能處理大量此前未被充分利用的文本數據。借助該方法,團隊能夠快速識別根本原因,提供上下文相關的指導,并縮短維修周期。通過 GenAI,工程師可以高效分析大量文本數據,并將其融入故障排查流程中。


利用全球與歷史科研資料推進食品科學發現

科學研究通常涉及跨越數十年、來自多個地區的大量論文,想要系統梳理某一主題的所有研究或找出其中潛在聯系,若無先進工具幾乎不可能。哥本哈根大學的食品科學研究人員在分析龐大資料尋找主題關聯時面臨這一挑戰。LLM 雖然能夠總結單篇文獻,但難以在海量數據中梳理整體關聯。為解決該問題,研究人員在使用 LLM 前,將 GenAI 與傳統技術相結合——如文本預處理與清洗、信息提取等——為非結構化文本建立結構。


哥本哈根大學團隊在整個流程中多次使用 GenAI,包括:

1清理并標準化了數千份格式不一致的 PDF 文件。

2在元數據缺失時自動生成關鍵字。

3將文本轉換為詞元(tokens),并標記異常長的詞語,以識別隱藏在文中的化學物質名稱。

4將論文拆分為段落和關鍵字后構建知識圖譜。圖譜中的每個節點代表一個段落或化學名稱,節點之間的連接則體現主題之間的關聯。


隨后,團隊使用 MATLAB 對該數據集應用圖論方法,識別各概念之間的關聯路徑。接著,他們將這些結構化的文本子集輸入 LLM,由模型生成摘要并解釋不同主題之間的關系——這些關系若由人工分析,可能需要數周時間。最終,他們構建了一套能夠將分散研究轉化為可執行洞察的流程,大幅加速了食品科學研究的推進。


盡管 GenAI 帶來了顯著價值——研究人員通過該流程節省了數天的人工處理時間——但成功仍高度依賴人工判斷與手動工作。團隊在將數據輸入 GenAI 之前投入了數百小時進行實驗與數據準備。通過反復試驗,他們才確定將文本按段落進行切分最為有效,因為 GenAI 無法自動作出這種判斷。GenAI 的強大之處只有在具備高質量數據和嚴謹工程方法的前提下才能充分發揮。


將維護數據轉化為前瞻性洞察

傳統的預測性維護(PdM)主要依賴傳感器的數值數據,用來跟蹤溫度、振動、壓力等變化,以捕捉設備故障前的異常模式。許多組織還會收集維護日志和技術人員記錄等文本信息,這些內容能夠提供傳感器無法捕捉的關鍵背景,例如故障癥狀、維修過程以及可能的根因判斷。


圖片1.png

生成式 AI 幫助工程師處理來自設備日志和服務記錄的非結構化數據,從而改進預測性維護流程。


文本信息并不能取代傳感器數據;工程師可以利用 GenAI 將其標準化,使其能夠與傳統信號協同使用。例如,GenAI 可以總結維護記錄、統一不一致的術語,或標注關鍵事件(如組件故障或重復出現的故障類型)。這些標注數據隨后可與時間序列傳感器數據對齊,為 PdM 模型的開發提供更清晰的目標與上下文。


圖片2.png

生成式 AI 幫助技術人員將服務記錄與傳感器數據結合,以更快速、更準確地完成汽車故障診斷。


GenAI 還可以支持工程流程的其他環節。工程師可以使用它起草和優化用于數據清洗、特征工程或探索性分析的代碼,也可以用它評估不同的建模方法。然而,領域知識在整個過程依然至關重要。只有經驗豐富的工程師才能判斷特征是否具有物理意義、模型行為是否符合系統動力學,以及輸出結果是否反映真實的故障模式或只是數據噪聲。


與所有 PdM 方法一樣,基于 GenAI 的工作流程在部署前需要經過嚴格驗證。一個在原型或小規模測試集中表現良好的模型,未必能夠應對真實環境中的多變條件。工程師應使用具有代表性的數據集進行驗證,對模型進行多工況壓力測試,并加入確定性檢查以確保其健壯性。這些最佳實踐適用于所有 PdM 方法,無論是否包含 GenAI,再次強調成功的 PdM 不僅依賴先進工具,更依賴扎實的工程判斷。


工程師們仍只觸及 GenAI 的表層

與任何工具一樣,GenAI 應在方法論指導下使用,而非被泛化應用于所有問題。當任務涉及大量非結構化數據,或需要處理語言驅動的輸入時,GenAI 的價值最為突出。工程師需要戰略性地整合 GenAI,拓展領域專業知識,并思考如何在自身的設計方法中切實應用這一工具。


總結

生成式AI雖已展現出重塑工程流程的強大能力,但目前大多數應用仍停留在表層,尚未完全轉化為推動技術創新的核心引擎。真正的突破不在于盲目依賴模型的通用能力,而在于將GenAI戰略性地嵌入嚴謹的工程方法論中:通過人工判斷指導數據預處理,利用領域知識驗證模型輸出的物理意義,并將非結構化文本洞察與傳統傳感器數據有機結合。無論是加速故障排查還是優化預測性維護,成功的鑰匙始終掌握在那些能夠駕馭工具、堅持嚴格驗證并具備深厚專業背景的工程師手中。


3-958x200_20251021044824_513.png

特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索

關閉

?

關閉